|
|
|
Кодировка Google непонятный тип кодировки
|
|||
|---|---|---|---|
|
#18+
Добрый день. Есть необходимость распарсить лог файл из веб сервера, в частности получить текст запроса из поисковика, по которому был вход на страницу с Яндексом все понятно: http://yandex.ru/yandsearch?text=ёяЁртюўэшъ яю ЁрфшюфхЄры ь&lr=213 тут UTF-8, где символ кирилицы = %D1, можно декодировать, уже сделано с Гуголь все сложнее: http://www.google.com/url?sa=t&rct=j&q=&esrc=s&frm=1&source=web&cd=9&ved=0CGQQFjAI&url=http://rad.service.ru/index16.php&ei=--DyUrC3GeeuyQG47YDADg&usg=AFQjCNGMjRlIkW1XDpJRuKAZIUQRNlbbsg&bvm=bv.60799247,d.aWc Вопросы: 1. что тут кодирует символ, строка типа =&esrc или что это вообще? 2. как получить на кирилице текст поискового запроса? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2014, 12:30 |
|
||
|
Кодировка Google непонятный тип кодировки
|
|||
|---|---|---|---|
|
#18+
авторчто тут кодирует символ, строка типа =&esrc или что это вообще? не =&esrc , а &esrc= s . это GET параметр запроса заведите учетку на li.ru или mail.ru или где-то еще, установите их счетчик и смотрите поисковые фразы ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2014, 13:25 |
|
||
|
Кодировка Google непонятный тип кодировки
|
|||
|---|---|---|---|
|
#18+
у меня, вообщето, будет автоматизированная система учета посещаемости сайтов так что мыло.ру ни к чему тут но, вообще, спасибо ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2014, 15:10 |
|
||
|
Кодировка Google непонятный тип кодировки
|
|||
|---|---|---|---|
|
#18+
Pcrepair, вы будете периодически сталкиваться с невозможностью расшифровки рефера поисковики (гугл в частности) может иметь "невообразимый" реквест, потому что он копит его в сессии поиска пользователя. пэкперементируйте поиском (сначала одно, затем другое ищите... и посмотрите на его урл) и увидите ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2014, 15:35 |
|
||
|
Кодировка Google непонятный тип кодировки
|
|||
|---|---|---|---|
|
#18+
+ даже если вы разберетесь и решитесь его использовать/парсить (его реквест) то нет гарантии что они не изменять его логику и вся ваша расшифровка станет неверной ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2014, 15:43 |
|
||
|
Кодировка Google непонятный тип кодировки
|
|||
|---|---|---|---|
|
#18+
liveinternet.ru, уважаемый всеми статист, и тот не все расшифровывает поищите среди статистов таких у кого есть апи. если найдете, то это реальное решение для своей статистики ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2014, 15:48 |
|
||
|
Кодировка Google непонятный тип кодировки
|
|||
|---|---|---|---|
|
#18+
понятно в таком случае хватит данных из яндекса кстати, да. в австаст(встроенная статиска на сайте из лог-файла) часто встречаются абракадабры типа ╤А╨░╨┤╨╕╨╛╨╢╤Г╤З╨╛╨║ ЁрфшюфхЄрыхщ Ёрё°шЁшЄ№ наверно это тот случай когда веб-сервер и его РНР-скрипты не смогли декодировать хугль ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2014, 16:02 |
|
||
|
Кодировка Google непонятный тип кодировки
|
|||
|---|---|---|---|
|
#18+
Pcrepair, скорее это кодировка которую не ожидал аваст ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2014, 16:17 |
|
||
|
Кодировка Google непонятный тип кодировки
|
|||
|---|---|---|---|
|
#18+
... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2014, 16:22 |
|
||
|
Кодировка Google непонятный тип кодировки
|
|||
|---|---|---|---|
|
#18+
на самом деле, как стало ясно, у хугля кодировка поискового запроса то же в УТФ8 и заключена между символами q= и первым & а шмондекса между text= и тоже & судя по тому что на веб-сервере австатс декодирует поисковые запросы эта схема стабильна ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.02.2014, 16:51 |
|
||
|
|

start [/forum/topic.php?fid=22&fpage=108&tid=1447415]: |
0ms |
get settings: |
5ms |
get forum list: |
14ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
193ms |
get topic data: |
6ms |
get forum data: |
1ms |
get page messages: |
23ms |
get tp. blocked users: |
1ms |
| others: | 203ms |
| total: | 450ms |

| 0 / 0 |
