Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Windows [игнор отключен] [закрыт для гостей] / wget и русские буквы в URL / 24 сообщений из 24, страница 1 из 1
19.10.2016, 08:10
    #39329498
dartveider13
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
Доброго времени суток уважаемы форумчане...
Подскажите пожалуйста кто знает...
Изрыл весь гугл, но так и не нашел по своему вопросу ничего нужного

Необходимо отправить запрос wget с содержанием в URL-части русских букв.
Что получается если писать стандартно:

Пишу так:
wget "http:/<ip-address>/aaa.php?option1=value1&option2=value2&option3=р35н55" -O d:\files\

При выполнении команды вижу в запросе цифры 35 и 55, а буквы меняются на кракозябру с процентами...

Читал что они вроде как конвертируются в 16-й код, и мне может помочь ключ --restrict-file-names.

Но он что-то не помог. Туда я пробовал прописывать windows; nocontrol; nocontrol,windows
Так кракозябры и остались.

Хотел попробовать опцию --local-encoding, но так и не понял что туда можно написать.
Пробовал --local-encoding=UTF-8 и UTF-16 - ругается - unrecognised option

Подскажите куда еще копнуть можно?
...
Рейтинг: 0 / 0
20.10.2016, 05:22
    #39330248
dartveider13
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
Знатоки wget-а откликнитесь пожалуйста))) Неужели не возникала такая проблема?
...
Рейтинг: 0 / 0
20.10.2016, 05:22
    #39330249
Barlone
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
В url не должно быть русских букв по стандарту. https://ru.wikipedia.org/wiki/URL#.D0.9A.D0.BE.D0.B4.D0.B8.D1.80.D0.BE.D0.B2.D0.B0.D0.BD.D0.B8.D0.B5_URL
Если он использует русские буквы в неправильной кодировке - ну закодируйте руками в нужной
...
Рейтинг: 0 / 0
20.10.2016, 06:18
    #39330256
dartveider13
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
Barlone, а вот если вводить команду без wget в браузер, то загрузка происходит нормально. А как можно в cmd закодировать?
...
Рейтинг: 0 / 0
20.10.2016, 08:37
    #39330289
Barlone
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
dartveider13Barlone, а вот если вводить команду без wget в браузер, то загрузка происходит нормально. А как можно в cmd закодировать?Так браузер кодирует запрос к серверу по стандарту, только вам может не показывать
...
Рейтинг: 0 / 0
20.10.2016, 08:53
    #39330298
dartveider13
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
Barlone, Это конечно здорово, что он сам кодирует, но мне надо выполнить этот запрос через cmd.exe. А как там правильно закодировать я не знаю
...
Рейтинг: 0 / 0
20.10.2016, 09:42
    #39330347
Изопропил
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
BarloneТак браузер кодирует запрос к серверу по стандарту, только вам может не показывать
а в отладочном окне броузера можно посмотреть, что он реально отправляет.
даже документацию можно не читать )))
...
Рейтинг: 0 / 0
20.10.2016, 09:44
    #39330350
dartveider13
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
Изопропил, браузер мне в этом плане не подходит. Мне надо cmd.exe использовать. Или я неправильно что-то понял?
...
Рейтинг: 0 / 0
20.10.2016, 10:32
    #39330402
Изопропил
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
dartveider13Изопропил, браузер мне в этом плане не подходит. Мне надо cmd.exe использовать. Или я неправильно что-то понял?
неправильно - в броузере можно посмотреть во что кириллица преобразуется
...
Рейтинг: 0 / 0
20.10.2016, 10:58
    #39330421
dartveider13
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
Изопропил, Использовал Хром, как там можно увидеть? Подскажите пожалуйста...
...
Рейтинг: 0 / 0
20.10.2016, 11:15
    #39330437
Barlone
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
В мозиле есть в меню "Информация о странице". В хроме... Ну можно скопировать url из адресной строки и вставить в блокнот - у меня по крайней мере при этом вместо русских букв все %D0 успешно появляются.
...
Рейтинг: 0 / 0
20.10.2016, 11:25
    #39330449
dartveider13
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
Barlone, Хммм ну я попробую, просто когда я ввожу свой адрес в хром, эта команда скачивает файл
...
Рейтинг: 0 / 0
20.10.2016, 11:34
    #39330460
dartveider13
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
dartveider13, Если просматривать код элемента, хром переводит русские буквы в кракозябры тоже, но скачивает то, что нужно... Я так понимаю надо сравнить эти кракозябры с теми, которые получаются при вызове wget из cmd.exe?
...
Рейтинг: 0 / 0
20.10.2016, 11:38
    #39330466
dartveider13
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
Кракозябры не совпадают...
...
Рейтинг: 0 / 0
20.10.2016, 11:46
    #39330480
dartveider13
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
А вот если вместо русских букв взять и ввести в cmd в параметр URL кракозябры из ссылки браузера, то отлично скачивается))) Впринципе это нормально... Думаю в программе, которую я пишу можно придумать процедуру перекодировки... Ладненько, раз стандартного средства wget для перекодировки русских символов нет, то думаю вопрос исчерпан, дальше вступит в действие программирование))) Всем спасибо за ответы)
...
Рейтинг: 0 / 0
21.10.2016, 09:54
    #39331235
azsx
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
Жаль, мне такой ответ не подходит. Я также страдаю такой проблемой, но у меня не только рф домены (азиаты, арабы и прочее). И также wget такое в cmd и bash не читает.
...
Рейтинг: 0 / 0
22.10.2016, 22:58
    #39332214
Изопропил
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
azsx, но у меня не только рф домены (азиаты, арабы и прочее).
без разницы. гуглить "IDN" до просветления
...
Рейтинг: 0 / 0
22.10.2016, 23:11
    #39332216
Akina
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
dartveider13буквы меняются на кракозябру с процентами...

Читал что они вроде как конвертируются в
Читай лучше RFC 3986 .
Ну или хотя бы URI — Википедия .
...
Рейтинг: 0 / 0
24.10.2016, 12:46
    #39332664
AndreyTarasov
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
dartveider13,

для любителей cmd.exe есть "небольшой" косяк

Если работать в интерпретаторе - то там будет использоваться кодировка 866,(а нужна видимо 1251) и это видно сразу - например если зайти в папку с русскими названиями файлов и папок и выполнить команду:
dir /b > c:\test.txt

потом посмотреть что в этом файле получилось... - то можно удивиться :-)

Самый простой вариант - создать cmd-файл блокнотом и вставлять команды в него ну и выполнять этот файл...
"и ваши волосы станут шелковистыми"
...
Рейтинг: 0 / 0
24.10.2016, 12:53
    #39332674
Akina
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
AndreyTarasovнапример если зайти в папку с русскими названиями файлов и папок и выполнить команду:
dir /b > c:\test.txt
потом посмотреть что в этом файле получилось... - то можно удивиться :-)
Если при "посмотреть" указать кодовую 866 - с удивлением не сложится.
Равно как и в случае, если предварительно выполнить chcp 1251 - можешь смело открывать блокнотом, всё будет читабельно... правда, в самом консоле - будет весело.
...
Рейтинг: 0 / 0
25.10.2016, 04:06
    #39333206
AndreyTarasov
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
AkinaAndreyTarasovнапример если зайти в папку с русскими названиями файлов и папок и выполнить команду:
dir /b > c:\test.txt
потом посмотреть что в этом файле получилось... - то можно удивиться :-)
Если при "посмотреть" указать кодовую 866 - с удивлением не сложится.
Равно как и в случае, если предварительно выполнить chcp 1251 - можешь смело открывать блокнотом, всё будет читабельно... правда, в самом консоле - будет весело.

и как следствие набрать любую команду с кириллицей станет невозможно
зачем такие комментарии?


человек хочет узнать почему команды с кириллицей, набранные в консоли не работают - я ответил...
а смена кодировки через chcp ничего не изменит, как будут команды в 866 набираться, так и продолжат
...
Рейтинг: 0 / 0
25.10.2016, 09:06
    #39333251
Barlone
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
AndreyTarasovЕсли работать в интерпретаторе - то там будет использоваться кодировка 866,(а нужна видимо 1251)
...а нужна utf8 - "из браузера работает", а браузер как раз в utf8 кодирует
...
Рейтинг: 0 / 0
26.10.2016, 08:32
    #39334061
dartveider13
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
Смена кодировки никак не поможет. Я вроде уже писал про это. Пробовали уже все эти chcp. Тут как раз я и описал что русские буквы в URL неправильно передаются. В моей задаче впринципе всего 12 букв в нижнем регистре используется, я уже их закодировал по URI. Мне этого вполне хватило.
...
Рейтинг: 0 / 0
26.10.2016, 08:55
    #39334078
Barlone
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
wget и русские буквы в URL
dartveider13Хотел попробовать опцию --local-encoding, но так и не понял что туда можно написать.
Пробовал --local-encoding=UTF-8 и UTF-16 - ругается - unrecognised option
У вас какая-то древняя версия wget. Ну и писать туда надо cp866.
...
Рейтинг: 0 / 0
Форумы / Windows [игнор отключен] [закрыт для гостей] / wget и русские буквы в URL / 24 сообщений из 24, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]