|
кодировки, русский ?
|
|||
---|---|---|---|
#18+
как однозначно определить, содержит ли строка русские слова. ведь проверки на содержане кириллических символов недостаточно. это необходимо для определения, нужно ли декодировать текст или ненужно например, если строка содержит строку в кодировке UTF-8 - мы перекодируем в win-1251, если нет - оставляем как есть. проверки вида: $word =~ /[а-я]+/ $word =~ /[А-Я]+/ ничего не дают, т.е. текст в utf может содержать эти символы. возможно я пошел не потому пути, и есть хороший способ определения кодировки текста. подскажите. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.06.2004, 12:31 |
|
кодировки, русский ?
|
|||
---|---|---|---|
#18+
По-моему, все кириллические кодировки изрядно пересекаются, поэтому таким способом вряд ли что-то получится определить. Ну разве что процент содержания больший или маленьких букв. У меня появилась идея - проверять слова на наличие главсных. То есть если слова длиной более 1 буквы (чтобы предлоги "в", "к" и т.д. не спутались) не содержат ни одной гласной - то текст фальшивый и нужно попробовать подобрать другую комбинацию. SHOGAL ... |
|||
:
Нравится:
Не нравится:
|
|||
04.06.2004, 01:22 |
|
|
start [/forum/topic.php?fid=23&msg=32546360&tid=1479698]: |
0ms |
get settings: |
11ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
61ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
50ms |
get tp. blocked users: |
2ms |
others: | 14ms |
total: | 174ms |
0 / 0 |