Гость
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / кодировки, русский ? / 2 сообщений из 2, страница 1 из 1
03.06.2004, 12:31
    #32546360
Wanenhalf
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
кодировки, русский ?
как однозначно определить, содержит ли строка русские слова.
ведь проверки на содержане кириллических символов недостаточно.

это необходимо для определения, нужно ли декодировать текст или ненужно

например, если строка содержит строку в кодировке UTF-8 - мы перекодируем в win-1251, если нет - оставляем как есть.

проверки вида:
$word =~ /[а-я]+/
$word =~ /[А-Я]+/
ничего не дают, т.е. текст в utf может содержать эти символы.

возможно я пошел не потому пути, и есть хороший способ определения кодировки текста.

подскажите.
...
Рейтинг: 0 / 0
04.06.2004, 01:22
    #32547688
Шогал
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
кодировки, русский ?
По-моему, все кириллические кодировки изрядно пересекаются, поэтому таким способом вряд ли что-то получится определить. Ну разве что процент содержания больший или маленьких букв.

У меня появилась идея - проверять слова на наличие главсных. То есть если слова длиной более 1 буквы (чтобы предлоги "в", "к" и т.д. не спутались) не содержат ни одной гласной - то текст фальшивый и нужно попробовать подобрать другую комбинацию.

SHOGAL
...
Рейтинг: 0 / 0
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / кодировки, русский ? / 2 сообщений из 2, страница 1 из 1
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]