|
Парсинг. Проблемы.
|
|||
---|---|---|---|
#18+
Добрый день. Пытаюсь осуществить парсинг и всплыло две проблемы. Код: Код: vbnet 1. 2. 3. 4. 5. 6. 7. 8.
Проблема 1: В xml_obj.responseText вся кириллица превращается в вопросительные знаки. Проблема 2: html_doc.body.innerHTML пуст. Тэги ‘<body>’ присутствуют корректно. В чем может быть причина и как с этим бороться? Спасибо. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.07.2016, 09:23 |
|
Парсинг. Проблемы.
|
|||
---|---|---|---|
#18+
Казалось бы, каким тут боком Access?... ... |
|||
:
Нравится:
Не нравится:
|
|||
19.07.2016, 12:40 |
|
Парсинг. Проблемы.
|
|||
---|---|---|---|
#18+
Вопрос по теме. xml_obj.send – в xml_obj получаем объект-документ в кодировке кириллица (windows). Как можно его перекодировать в юникод utf-8? Спасибо ... |
|||
:
Нравится:
Не нравится:
|
|||
19.07.2016, 15:19 |
|
Парсинг. Проблемы.
|
|||
---|---|---|---|
#18+
guest_rusimport (27 сен 15, 19:39 ) , Код: vbnet 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16.
Не хочет перекодироваться. Вернее создает файл в кодировке "UTF-8", но кириллица в этом новом файле все равно отображается в виде абракадабры. Перекодировать бы эти данные в UTF-8 на уровне s.Send, или Access заставить читать windows-1251... Есть какие идеи? ... |
|||
:
Нравится:
Не нравится:
|
|||
19.07.2016, 19:13 |
|
Парсинг. Проблемы.
|
|||
---|---|---|---|
#18+
малыш789654, ты какой программой файл после перекодировки смотришь? ... |
|||
:
Нравится:
Не нравится:
|
|||
19.07.2016, 19:19 |
|
Парсинг. Проблемы.
|
|||
---|---|---|---|
#18+
guest_rusimportмалыш789654, ты какой программой файл после перекодировки смотришь? ВинХР, Акц2000. На форме кнопка. При нажатии: - лезу по url на сайт и вытаскиваю страницу. Страница в windows-1251. - Загоняю контент в body.innerHTML - Затем бегаю по тегам и извлекаю необходимые мне данные. - Данные вношу в таблицы. Что происходит при использовании предложенной методы: - Создается хмл файл. - в файл вносятся данные. Они вносятся до появления первого символа кириллицы. - Далее формирование файла останавливается Если данные сохранять в файл html а не xml, то - Создается файл кодировки UTF-8 - перенос контента происходит полностью, но кириллица как была тарабарщиной, так таковой и остается. Если html страницу сохранить у себя на диске и применить эту технологию (url = C\...html), то результат будет тот же. Если же эту страницу ручками переформатировать в UTF-8, результат положительный, все корректно работает. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.07.2016, 19:54 |
|
Парсинг. Проблемы.
|
|||
---|---|---|---|
#18+
малыш789654guest_rusimportмалыш789654, ты какой программой файл после перекодировки смотришь? ВинХР, Акц2000. На форме кнопка. При нажатии: - лезу по url на сайт и вытаскиваю страницу. Страница в windows-1251. - Загоняю контент в body.innerHTML - Затем бегаю по тегам и извлекаю необходимые мне данные. - Данные вношу в таблицы. Что происходит при использовании предложенной методы: - Создается хмл файл. - в файл вносятся данные. Они вносятся до появления первого символа кириллицы. - Далее формирование файла останавливается Если данные сохранять в файл html а не xml, то - Создается файл кодировки UTF-8 - перенос контента происходит полностью, но кириллица как была тарабарщиной, так таковой и остается. Если html страницу сохранить у себя на диске и применить эту технологию (url = C\...html), то результат будет тот же. Если же эту страницу ручками переформатировать в UTF-8, результат положительный, все корректно работает. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.07.2016, 20:02 |
|
Парсинг. Проблемы.
|
|||
---|---|---|---|
#18+
малыш789654, Попробуй на основе этого примера http://am.rusimport.ru/msaccess/topic.aspx?ID=378 через IE сделать (он по идее уже сам с кодировкой разберется), вообщем поизучай внимательно, не спеша, сделай маленький примерчик на основе этого примера для случая с твоей страничкой... ну , и если не получится - выкладывай пример с этим на форум ... |
|||
:
Нравится:
Не нравится:
|
|||
19.07.2016, 20:53 |
|
|
start [/forum/topic.php?fid=45&fpage=98&tid=1613337]: |
0ms |
get settings: |
10ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
29ms |
get topic data: |
13ms |
get forum data: |
3ms |
get page messages: |
47ms |
get tp. blocked users: |
2ms |
others: | 12ms |
total: | 137ms |
0 / 0 |