Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности

Новые сообщения [новые:0]
Дайджест
Горячие темы
Избранное [новые:0]
Форумы
Пользователи
Статистика
Статистика нагрузки
Мод. лог
Поиск
|
|
23.07.2013, 13:43
|
|||
|---|---|---|---|
|
|||
LWP::UserAgent regexp и utf8 |
|||
|
#18+
На Perl скачиваю страницу через LWP::UserAgent, страница в utf8 и в регэкспе пытаюсь применить кириллицу - не проходит. Причём если код веб-страницы сохранить в самом perl документ - работает. Документ сохраняется тоже в utf8 и use utf8 стоит. Если полученный через LWP контент попробовать перекодировать через decode('utf8', $content) - выдаёт ошибку wide characters. Как решить данную проблему? Код: python 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
23.07.2013, 14:02
|
|||
|---|---|---|---|
|
|||
LWP::UserAgent regexp и utf8 |
|||
|
#18+
Код: sql 1. Так попробуйте. А также поиграйте с заголовками. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
23.07.2013, 15:35
|
|||
|---|---|---|---|
|
|||
LWP::UserAgent regexp и utf8 |
|||
|
#18+
mhx Код: sql 1. Так попробуйте. А также поиграйте с заголовками. Ставил, играл. Ох уж этот perl ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
24.07.2013, 07:04
|
|||
|---|---|---|---|
|
|||
LWP::UserAgent regexp и utf8 |
|||
|
#18+
Тогда замените use utf8 на use encoding 'utf8', STDOUT => 'utf8'. И кириллица в регулярках работает, и 'Wide character' отсутствует ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
24.07.2013, 09:51
|
|||
|---|---|---|---|
|
|||
LWP::UserAgent regexp и utf8 |
|||
|
#18+
mhxТогда замените use utf8 на use encoding 'utf8', STDOUT => 'utf8'. И кириллица в регулярках работает, и 'Wide character' отсутствует Нет, всёравно wide character ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
24.07.2013, 09:58
|
|||
|---|---|---|---|
|
|||
LWP::UserAgent regexp и utf8 |
|||
|
#18+
binmode STDOUT, ':utf8'; ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|
24.07.2013, 12:46
|
|||
|---|---|---|---|
|
|||
LWP::UserAgent regexp и utf8 |
|||
|
#18+
mhxbinmode STDOUT, ':utf8'; ? Так тоже не работало, но суть не в этом. Опытным путём определил, что кириллический символы находятся, а проблема в пробелах была, regexp сделал таким: "выбрано.?моделей.?\—.?(\d+)" и заработало. Я так понимаю на сайте вместо пробельных символ использовались какие-то особенные? Хотя я для регэкспа копировал из исходного html-кода фразу и вставлял в скрипт, но это не давало результата. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|

start [/forum/topic.php?fid=23&mobile=1&tid=1463591]: |
0ms |
get settings: |
10ms |
get forum list: |
15ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
36ms |
get topic data: |
7ms |
get forum data: |
2ms |
get page messages: |
36ms |
get tp. blocked users: |
1ms |
| others: | 258ms |
| total: | 369ms |

| 0 / 0 |
