Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
LWP::UserAgent regexp и utf8
|
|||
|---|---|---|---|
|
#18+
На Perl скачиваю страницу через LWP::UserAgent, страница в utf8 и в регэкспе пытаюсь применить кириллицу - не проходит. Причём если код веб-страницы сохранить в самом perl документ - работает. Документ сохраняется тоже в utf8 и use utf8 стоит. Если полученный через LWP контент попробовать перекодировать через decode('utf8', $content) - выдаёт ошибку wide characters. Как решить данную проблему? Код: python 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.07.2013, 13:43 |
|
||
|
LWP::UserAgent regexp и utf8
|
|||
|---|---|---|---|
|
#18+
Код: sql 1. Так попробуйте. А также поиграйте с заголовками. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.07.2013, 14:02 |
|
||
|
LWP::UserAgent regexp и utf8
|
|||
|---|---|---|---|
|
#18+
mhx Код: sql 1. Так попробуйте. А также поиграйте с заголовками. Ставил, играл. Ох уж этот perl ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 23.07.2013, 15:35 |
|
||
|
LWP::UserAgent regexp и utf8
|
|||
|---|---|---|---|
|
#18+
Тогда замените use utf8 на use encoding 'utf8', STDOUT => 'utf8'. И кириллица в регулярках работает, и 'Wide character' отсутствует ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.07.2013, 07:04 |
|
||
|
LWP::UserAgent regexp и utf8
|
|||
|---|---|---|---|
|
#18+
mhxТогда замените use utf8 на use encoding 'utf8', STDOUT => 'utf8'. И кириллица в регулярках работает, и 'Wide character' отсутствует Нет, всёравно wide character ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.07.2013, 09:51 |
|
||
|
LWP::UserAgent regexp и utf8
|
|||
|---|---|---|---|
|
#18+
binmode STDOUT, ':utf8'; ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.07.2013, 09:58 |
|
||
|
LWP::UserAgent regexp и utf8
|
|||
|---|---|---|---|
|
#18+
mhxbinmode STDOUT, ':utf8'; ? Так тоже не работало, но суть не в этом. Опытным путём определил, что кириллический символы находятся, а проблема в пробелах была, regexp сделал таким: "выбрано.?моделей.?\—.?(\d+)" и заработало. Я так понимаю на сайте вместо пробельных символ использовались какие-то особенные? Хотя я для регэкспа копировал из исходного html-кода фразу и вставлял в скрипт, но это не давало результата. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.07.2013, 12:46 |
|
||
|
|

start [/forum/topic.php?fid=23&msg=38340734&tid=1463591]: |
0ms |
get settings: |
5ms |
get forum list: |
13ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
60ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
35ms |
get tp. blocked users: |
1ms |
| others: | 243ms |
| total: | 374ms |

| 0 / 0 |
