powered by simpleCommunicator - 2.0.60     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / Проблема русских кодировок в работе с loadHTMLFile() - saveHTML()
9 сообщений из 9, страница 1 из 1
Проблема русских кодировок в работе с loadHTMLFile() - saveHTML()
    #38781685
Добрый день.
Проблема такова: в объект X класса DOMDocument грузится методом DOMDocument->loadHTMLFile(URI) html-файл с русскоязычным контентом. Кодировка файла неизвестна, мета-тега с её указанием файл не содержит. Потом делаем echo X->saveHTML() - и получаем на мониторе абракадабру вместо русских букв.
Кто-нибудь знаком с такой проблемой и знает, что этим делать?
...
Рейтинг: 0 / 0
Проблема русских кодировок в работе с loadHTMLFile() - saveHTML()
    #38781809
alex564657498765453
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
в пхп есть функция детекта кодировки.

детектит исходя чисто из текста. если есть руские буквы - подозреваю что определит точно.
...
Рейтинг: 0 / 0
Проблема русских кодировок в работе с loadHTMLFile() - saveHTML()
    #38781813
alex564657498765453
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
и зачем темы плодить ? или ты на каждую строчку кода будешь тему делать?
...
Рейтинг: 0 / 0
Проблема русских кодировок в работе с loadHTMLFile() - saveHTML()
    #38781841
Соседнюю тему завёл, т.к. была надежда выцепить кодировку из http-заголовка.
А точно детектить кодировку чисто из текста, имхо, невозможно - все эти функции работают весьма приблизительно.
...
Рейтинг: 0 / 0
Проблема русских кодировок в работе с loadHTMLFile() - saveHTML()
    #38781898
alex564657498765453
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Летучий Змей,

тыж сам написал что нету указателя на кодировку в странице... у тебя есть ещо вариант кроме как детектить на основании текста?
...
Рейтинг: 0 / 0
Проблема русских кодировок в работе с loadHTMLFile() - saveHTML()
    #38782040
Указателя на кодировку в странице нет, но, может, можно как-то дать команду серверу перекодировать её перед отправкой в то, что нам нужно... как-то так.
Пробовал отправлять серверу заголовок запроса Accept-charset: имяНужнойКодировки. Но, похоже, плевать ему на это.
...
Рейтинг: 0 / 0
Проблема русских кодировок в работе с loadHTMLFile() - saveHTML()
    #38782198
alex564657498765453
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Летучий ЗмейУказателя на кодировку в странице нет, но, может, можно как-то дать команду серверу перекодировать её перед отправкой в то, что нам нужно... как-то так.
Пробовал отправлять серверу заголовок запроса Accept-charset: имяНужнойКодировки. Но, похоже, плевать ему на это.

афигеть...а ты разве не посылаешь ему итак аксепт чарсет ютф8 или виндоус1251 (я читал и соседнюю твою ветку по этой же проблеме тоже :) 0
...
Рейтинг: 0 / 0
Проблема русских кодировок в работе с loadHTMLFile() - saveHTML()
    #38782203
miksoft
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
alex564657498765453аксепт чарсетФормально таковой заголовок существует, но я ни разу не видел его живьем в дикой природе, т.е. в браузерных протоколах.
...
Рейтинг: 0 / 0
Проблема русских кодировок в работе с loadHTMLFile() - saveHTML()
    #38782224
alex564657498765453Летучий ЗмейУказателя на кодировку в странице нет, но, может, можно как-то дать команду серверу перекодировать её перед отправкой в то, что нам нужно... как-то так.
Пробовал отправлять серверу заголовок запроса Accept-charset: имяНужнойКодировки. Но, похоже, плевать ему на это.

афигеть...а ты разве не посылаешь ему итак аксепт чарсет ютф8 или виндоус1251 (я читал и соседнюю твою ветку по этой же проблеме тоже :) 0

В моём примере в соседней ветке я ему в явном виде отправлял вот что:
$req = "GET $url HTTP/1.0\n"."User-Agent: PHP/5\n"."Host: $host:$port\n"."Accept: */*\n\n"
Отправлял это через fwrite($fp, $req), где $fp - открытый ранее сокет (или как там это правильно сказать).
Пробовал добавлять в $req и Accept-charset, но он на это не реагировал.
Может, конечно, кроме $req ему ещё что-то в неявном виде отправляется, в то числе Accept-charset, но вряд ли =:)

А ты, кажется, перепутал в той ветке мой код и код примера из другой статьи, который идёт вслед за моим кодом.
...
Рейтинг: 0 / 0
9 сообщений из 9, страница 1 из 1
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / Проблема русских кодировок в работе с loadHTMLFile() - saveHTML()
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]