|
|
|
определение кодировки файла
|
|||
|---|---|---|---|
|
#18+
Здравствуйте, всем! ребята почему всегда получаю дефолтЭнкодинг? Код: java 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.04.2018, 11:35 |
|
||
|
определение кодировки файла
|
|||
|---|---|---|---|
|
#18+
и совсем уж странно то что Код: java 1. возвращает WINDOWS-1255 при этом всегда ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.04.2018, 11:47 |
|
||
|
определение кодировки файла
|
|||
|---|---|---|---|
|
#18+
и так после добавления ещё одного метода точнее теперь уже пример с интернета Код: java 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. получается что, если у файла кодировка: utf-8 - определяется как utf-8 cp1251 - определяется как WINDOWS-1252 cp866 - как WINDOWS-1255 почему так? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.04.2018, 14:51 |
|
||
|
определение кодировки файла
|
|||
|---|---|---|---|
|
#18+
и так, после анализа определился что если размер файла составляет примерно 400байтов и больше то уже правильно определяется cp866 , но cp1521 теперь стал определятся как KOI8-R ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.04.2018, 06:52 |
|
||
|
определение кодировки файла
|
|||
|---|---|---|---|
|
#18+
Подозреваю что UniversalDetector определяет кодировку на основе статистики файла. И возможно это определение не всегда точное. Зависит от данных которые внутри файла. И процент кривых определений всегда будет. Надо с этим смириться. Ненадежный механизм. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.04.2018, 09:39 |
|
||
|
определение кодировки файла
|
|||
|---|---|---|---|
|
#18+
Стоит отметить что на данных определенного размера и содержания решение задачи не возможно в принципе. Автору стоит ознакомится с тем что такое однобайтовые кодировки и попробовать конкретезировать проблему именно для своих данных. Потому что универсальный инструмент, он слишком универсален чтобы учитывать конкретику именно вашей проблемы. А конкретика помогла бы задать нужную статистику в вашем случае. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.04.2018, 11:10 |
|
||
|
определение кодировки файла
|
|||
|---|---|---|---|
|
#18+
mayton, вроде так и есть Blazkowicz, вообще мне достаточна ср866 т.к. все файлы на этой кодировке, но просто хотел сделать что то универсальное чтоб дальнейшем можно было пользоваться в других проектах в качестве библиотеки. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.04.2018, 21:38 |
|
||
|
|

start [/forum/topic.php?fid=59&msg=39627136&tid=2122129]: |
0ms |
get settings: |
12ms |
get forum list: |
12ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
56ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
48ms |
get tp. blocked users: |
1ms |
| others: | 236ms |
| total: | 385ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...