powered by simpleCommunicator - 2.0.51     © 2025 Programmizd 02
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / кодировки, русский ?
2 сообщений из 2, страница 1 из 1
кодировки, русский ?
    #32546360
Wanenhalf
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
как однозначно определить, содержит ли строка русские слова.
ведь проверки на содержане кириллических символов недостаточно.

это необходимо для определения, нужно ли декодировать текст или ненужно

например, если строка содержит строку в кодировке UTF-8 - мы перекодируем в win-1251, если нет - оставляем как есть.

проверки вида:
$word =~ /[а-я]+/
$word =~ /[А-Я]+/
ничего не дают, т.е. текст в utf может содержать эти символы.

возможно я пошел не потому пути, и есть хороший способ определения кодировки текста.

подскажите.
...
Рейтинг: 0 / 0
кодировки, русский ?
    #32547688
Шогал
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
По-моему, все кириллические кодировки изрядно пересекаются, поэтому таким способом вряд ли что-то получится определить. Ну разве что процент содержания больший или маленьких букв.

У меня появилась идея - проверять слова на наличие главсных. То есть если слова длиной более 1 буквы (чтобы предлоги "в", "к" и т.д. не спутались) не содержат ни одной гласной - то текст фальшивый и нужно попробовать подобрать другую комбинацию.

SHOGAL
...
Рейтинг: 0 / 0
2 сообщений из 2, страница 1 из 1
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / кодировки, русский ?
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]