|
|
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
Доброго времени суток уважаемы форумчане... Подскажите пожалуйста кто знает... Изрыл весь гугл, но так и не нашел по своему вопросу ничего нужного Необходимо отправить запрос wget с содержанием в URL-части русских букв. Что получается если писать стандартно: Пишу так: wget "http:/<ip-address>/aaa.php?option1=value1&option2=value2&option3=р35н55" -O d:\files\ При выполнении команды вижу в запросе цифры 35 и 55, а буквы меняются на кракозябру с процентами... Читал что они вроде как конвертируются в 16-й код, и мне может помочь ключ --restrict-file-names. Но он что-то не помог. Туда я пробовал прописывать windows; nocontrol; nocontrol,windows Так кракозябры и остались. Хотел попробовать опцию --local-encoding, но так и не понял что туда можно написать. Пробовал --local-encoding=UTF-8 и UTF-16 - ругается - unrecognised option Подскажите куда еще копнуть можно? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.10.2016, 08:10 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
Знатоки wget-а откликнитесь пожалуйста))) Неужели не возникала такая проблема? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.10.2016, 05:22 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
В url не должно быть русских букв по стандарту. https://ru.wikipedia.org/wiki/URL#.D0.9A.D0.BE.D0.B4.D0.B8.D1.80.D0.BE.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5_URL Если он использует русские буквы в неправильной кодировке - ну закодируйте руками в нужной ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.10.2016, 05:22 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
Barlone, а вот если вводить команду без wget в браузер, то загрузка происходит нормально. А как можно в cmd закодировать? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.10.2016, 06:18 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
dartveider13Barlone, а вот если вводить команду без wget в браузер, то загрузка происходит нормально. А как можно в cmd закодировать?Так браузер кодирует запрос к серверу по стандарту, только вам может не показывать ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.10.2016, 08:37 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
Barlone, Это конечно здорово, что он сам кодирует, но мне надо выполнить этот запрос через cmd.exe. А как там правильно закодировать я не знаю ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.10.2016, 08:53 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
BarloneТак браузер кодирует запрос к серверу по стандарту, только вам может не показывать а в отладочном окне броузера можно посмотреть, что он реально отправляет. даже документацию можно не читать ))) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.10.2016, 09:42 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
Изопропил, браузер мне в этом плане не подходит. Мне надо cmd.exe использовать. Или я неправильно что-то понял? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.10.2016, 09:44 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
dartveider13Изопропил, браузер мне в этом плане не подходит. Мне надо cmd.exe использовать. Или я неправильно что-то понял? неправильно - в броузере можно посмотреть во что кириллица преобразуется ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.10.2016, 10:32 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
Изопропил, Использовал Хром, как там можно увидеть? Подскажите пожалуйста... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.10.2016, 10:58 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
В мозиле есть в меню "Информация о странице". В хроме... Ну можно скопировать url из адресной строки и вставить в блокнот - у меня по крайней мере при этом вместо русских букв все %D0 успешно появляются. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.10.2016, 11:15 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
Barlone, Хммм ну я попробую, просто когда я ввожу свой адрес в хром, эта команда скачивает файл ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.10.2016, 11:25 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
dartveider13, Если просматривать код элемента, хром переводит русские буквы в кракозябры тоже, но скачивает то, что нужно... Я так понимаю надо сравнить эти кракозябры с теми, которые получаются при вызове wget из cmd.exe? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.10.2016, 11:34 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
Кракозябры не совпадают... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.10.2016, 11:38 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
А вот если вместо русских букв взять и ввести в cmd в параметр URL кракозябры из ссылки браузера, то отлично скачивается))) Впринципе это нормально... Думаю в программе, которую я пишу можно придумать процедуру перекодировки... Ладненько, раз стандартного средства wget для перекодировки русских символов нет, то думаю вопрос исчерпан, дальше вступит в действие программирование))) Всем спасибо за ответы) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.10.2016, 11:46 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
Жаль, мне такой ответ не подходит. Я также страдаю такой проблемой, но у меня не только рф домены (азиаты, арабы и прочее). И также wget такое в cmd и bash не читает. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.10.2016, 09:54 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
azsx, но у меня не только рф домены (азиаты, арабы и прочее). без разницы. гуглить "IDN" до просветления ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.10.2016, 22:58 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
dartveider13буквы меняются на кракозябру с процентами... Читал что они вроде как конвертируются в Читай лучше RFC 3986 . Ну или хотя бы URI — Википедия . ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.10.2016, 23:11 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
dartveider13, для любителей cmd.exe есть "небольшой" косяк Если работать в интерпретаторе - то там будет использоваться кодировка 866,(а нужна видимо 1251) и это видно сразу - например если зайти в папку с русскими названиями файлов и папок и выполнить команду: dir /b > c:\test.txt потом посмотреть что в этом файле получилось... - то можно удивиться :-) Самый простой вариант - создать cmd-файл блокнотом и вставлять команды в него ну и выполнять этот файл... "и ваши волосы станут шелковистыми" ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.10.2016, 12:46 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
AndreyTarasovнапример если зайти в папку с русскими названиями файлов и папок и выполнить команду: dir /b > c:\test.txt потом посмотреть что в этом файле получилось... - то можно удивиться :-) Если при "посмотреть" указать кодовую 866 - с удивлением не сложится. Равно как и в случае, если предварительно выполнить chcp 1251 - можешь смело открывать блокнотом, всё будет читабельно... правда, в самом консоле - будет весело. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.10.2016, 12:53 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
AkinaAndreyTarasovнапример если зайти в папку с русскими названиями файлов и папок и выполнить команду: dir /b > c:\test.txt потом посмотреть что в этом файле получилось... - то можно удивиться :-) Если при "посмотреть" указать кодовую 866 - с удивлением не сложится. Равно как и в случае, если предварительно выполнить chcp 1251 - можешь смело открывать блокнотом, всё будет читабельно... правда, в самом консоле - будет весело. и как следствие набрать любую команду с кириллицей станет невозможно зачем такие комментарии? человек хочет узнать почему команды с кириллицей, набранные в консоли не работают - я ответил... а смена кодировки через chcp ничего не изменит, как будут команды в 866 набираться, так и продолжат ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.10.2016, 04:06 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
AndreyTarasovЕсли работать в интерпретаторе - то там будет использоваться кодировка 866,(а нужна видимо 1251) ...а нужна utf8 - "из браузера работает", а браузер как раз в utf8 кодирует ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.10.2016, 09:06 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
Смена кодировки никак не поможет. Я вроде уже писал про это. Пробовали уже все эти chcp. Тут как раз я и описал что русские буквы в URL неправильно передаются. В моей задаче впринципе всего 12 букв в нижнем регистре используется, я уже их закодировал по URI. Мне этого вполне хватило. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.10.2016, 08:32 |
|
||
|
wget и русские буквы в URL
|
|||
|---|---|---|---|
|
#18+
dartveider13Хотел попробовать опцию --local-encoding, но так и не понял что туда можно написать. Пробовал --local-encoding=UTF-8 и UTF-16 - ругается - unrecognised option У вас какая-то древняя версия wget. Ну и писать туда надо cp866. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.10.2016, 08:55 |
|
||
|
|

start [/forum/topic.php?fid=26&msg=39329498&tid=1493335]: |
0ms |
get settings: |
11ms |
get forum list: |
15ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
149ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
50ms |
get tp. blocked users: |
1ms |
| others: | 234ms |
| total: | 480ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...