Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности

Новые сообщения [новые:0]
Дайджест
Горячие темы
Избранное [новые:0]
Форумы
Пользователи
Статистика
Статистика нагрузки
Мод. лог
Поиск
|
|
30.04.2005, 13:07
|
|||
|---|---|---|---|
Определение кодировки текстового файла |
|||
|
#18+
Преветствую всех!!! Имеется такая проблемма : Как определить в какой кодировке (Windows, DOS KOI) записан текстовый файл (как при открытии делает Word)? Для начали известно, что файл на русском языке Усложняем задачку: а если язык заранее не известер? Заранее благодарен ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
30.04.2005, 13:36
|
|||
|---|---|---|---|
Определение кодировки текстового файла |
|||
|
#18+
IcyCoolПреветствую всех!!! Имеется такая проблемма : Как определить в какой кодировке (Windows, DOS KOI) записан текстовый файл (как при открытии делает Word)? Для начали известно, что файл на русском языке Усложняем задачку: а если язык заранее не известер? Заранее благодарен Подобного софта уже наделано... Есть в разном виде... Алгоритмы тож расписаны... Гугла и Яьндекс - в помощь... имхо. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
02.05.2005, 18:08
|
|||
|---|---|---|---|
Определение кодировки текстового файла |
|||
|
#18+
В общем, принцип простой. У тебя должны быть подготовленны частотные таблицы для каждого из ожидаемых языков и кодировок. При открытии файла подсчитываешь сколько раз в нем встречается каждый из байтов, потом сравниваешь полученую частотную таблицу со своими таблицами. Соотвественно - чем больше по объему исходный файл, тем больше шансов правильного определения языка/кодировки. Так же, можешь хранить у себя словари наиболее вероятных слов. Если в обрабатываемом тексте есть одно или несколько слов из известного списка - значит и язык мы уже знаем. В комбинации с частотными таблицами можно получить очень неплохую вероятность угадывания. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|

start [/forum/topic.php?fid=16&mobile=1&tid=1347719]: |
0ms |
get settings: |
10ms |
get forum list: |
19ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
32ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
38ms |
get tp. blocked users: |
1ms |
| others: | 227ms |
| total: | 344ms |

| 0 / 0 |
