Новые сообщения [новые:0]
Дайджест
Горячие темы
Избранное [новые:0]
Форумы
Пользователи
Статистика
Статистика нагрузки
Мод. лог
Поиск
|
03.06.2004, 12:31
|
|||
---|---|---|---|
кодировки, русский ? |
|||
#18+
как однозначно определить, содержит ли строка русские слова. ведь проверки на содержане кириллических символов недостаточно. это необходимо для определения, нужно ли декодировать текст или ненужно например, если строка содержит строку в кодировке UTF-8 - мы перекодируем в win-1251, если нет - оставляем как есть. проверки вида: $word =~ /[а-я]+/ $word =~ /[А-Я]+/ ничего не дают, т.е. текст в utf может содержать эти символы. возможно я пошел не потому пути, и есть хороший способ определения кодировки текста. подскажите. ... |
|||
:
Нравится:
Не нравится:
|
|||
|
04.06.2004, 01:22
|
|||
---|---|---|---|
кодировки, русский ? |
|||
#18+
По-моему, все кириллические кодировки изрядно пересекаются, поэтому таким способом вряд ли что-то получится определить. Ну разве что процент содержания больший или маленьких букв. У меня появилась идея - проверять слова на наличие главсных. То есть если слова длиной более 1 буквы (чтобы предлоги "в", "к" и т.д. не спутались) не содержат ни одной гласной - то текст фальшивый и нужно попробовать подобрать другую комбинацию. SHOGAL ... |
|||
:
Нравится:
Не нравится:
|
|||
|
|
start [/forum/topic.php?fid=23&tablet=1&tid=1479698]: |
0ms |
get settings: |
8ms |
get forum list: |
11ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
76ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
41ms |
get tp. blocked users: |
2ms |
others: | 311ms |
total: | 470ms |
0 / 0 |