Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Java [игнор отключен] [закрыт для гостей] / Получить html-код / 17 сообщений из 17, страница 1 из 1
11.09.2014, 23:34
    #38744713
reset4
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить html-код
Приветствую
подскажите, как "правильно" получить HTML-код страницы после выполнения клиентских JS скриптов на ней (то, что видит пользователь в браузере)?
...
Рейтинг: 0 / 0
12.09.2014, 01:24
    #38744743
mr_virtus
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить html-код
reset4,
здравствуйте,

а что конкретно интересует? Вы можете из html вызывать JS и используя JS генерить html код.
...
Рейтинг: 0 / 0
12.09.2014, 01:26
    #38744745
alexy_black
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить html-код
я копирую из firefox инспектора. там можно выделить body и скопировать его и его подузлы.
...
Рейтинг: 0 / 0
12.09.2014, 01:30
    #38744747
mr_virtus
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить html-код
reset4,

можете здесь посмотреть примеры.

http://www.tutorialspoint.com/javascript/javascript_forin_loop.htm

Возможно, подойдет Вам.
...
Рейтинг: 0 / 0
12.09.2014, 09:02
    #38744831
reset4
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить html-код
mr_virtusreset4,
здравствуйте,

а что конкретно интересует? Вы можете из html вызывать JS и используя JS генерить html код.
Есть страница со скриптами. Нужно вытащить из нее HTML для дальнейшего парса.Если напрямую забирать со страницы данные,то получаем в результате текст с неотработанными скриптами. Нужно получить страницу, выполнить скрипты и забрать с нее html.
Если создавать внешний процесс браузера и делать все в нем, то работает. Интересуют варианты без внешних приложений.
...
Рейтинг: 0 / 0
12.09.2014, 09:46
    #38744860
mad_nazgul
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить html-код
reset4Есть страница со скриптами. Нужно вытащить из нее HTML для дальнейшего парса.Если напрямую забирать со страницы данные,то получаем в результате текст с неотработанными скриптами. Нужно получить страницу, выполнить скрипты и забрать с нее html.
Если создавать внешний процесс браузера и делать все в нем, то работает. Интересуют варианты без внешних приложений.

Гуглить работу с HttpClient
...
Рейтинг: 0 / 0
12.09.2014, 09:55
    #38744875
Blazkowicz
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить html-код
reset4подскажите, как "правильно" получить HTML-код страницы после выполнения клиентских JS скриптов на ней (то, что видит пользователь в браузере)?
Получить где?
...
Рейтинг: 0 / 0
12.09.2014, 10:20
    #38744904
reset4
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить html-код
mad_nazgulreset4Есть страница со скриптами. Нужно вытащить из нее HTML для дальнейшего парса.Если напрямую забирать со страницы данные,то получаем в результате текст с неотработанными скриптами. Нужно получить страницу, выполнить скрипты и забрать с нее html.
Если создавать внешний процесс браузера и делать все в нем, то работает. Интересуют варианты без внешних приложений.

Гуглить работу с HttpClient
погуглено уже, все клиенты с первой страницы гугла, выдают HTML без отработанных скрптов. Поэтому и пишу сюда :).
...
Рейтинг: 0 / 0
12.09.2014, 10:21
    #38744905
reset4
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить html-код
alexy_blackя копирую из firefox инспектора. там можно выделить body и скопировать его и его подузлы.
да, про это уже указал, что если юзать внешний процесс, то все работает.
...
Рейтинг: 0 / 0
12.09.2014, 10:23
    #38744908
reset4
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить html-код
Blazkowiczreset4подскажите, как "правильно" получить HTML-код страницы после выполнения клиентских JS скриптов на ней (то, что видит пользователь в браузере)?
Получить где?
получить в Java приложении в виде String, InputStream или еще чего, что можно было бы распарсить.
...
Рейтинг: 0 / 0
12.09.2014, 10:25
    #38744910
mad_nazgul
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить html-код
reset4погуглено уже, все клиенты с первой страницы гугла, выдают HTML без отработанных скрптов. Поэтому и пишу сюда :).

HtmlUnit
Selenium

Учитесь гуглить ;-)
...
Рейтинг: 0 / 0
12.09.2014, 10:53
    #38744926
smackmychi
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить html-код
mad_nazgul,

document.body.innerHTML
...
Рейтинг: 0 / 0
12.09.2014, 11:46
    #38745003
Alibek B
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить html-код
А какая связь между Java и JS?
Отвечающие тоже доставляют. ТС ведь указал, что из браузера он получает интересуемое, но ему нужно эмулировать работу браузера, захостить у себя скриптовый движок и получить страницу после отработки скриптов.
А все как один, не включая мозги, советуют забирать страницу из браузера или с сервера.
...
Рейтинг: 0 / 0
12.09.2014, 11:51
    #38745011
Blazkowicz
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить html-код
reset4Если создавать внешний процесс браузера и делать все в нем, то работает. Интересуют варианты без внешних приложений.
webkit - это opensource. Ничего не мешает интегрировать в свой процесс и использовать API. Зачем создавать новые процессы?
Надеюсь, решение не серверное? Потому что запускать какой попало JS на сервере чревато как минимум тормозами.
...
Рейтинг: 0 / 0
12.09.2014, 12:04
    #38745018
забыл ник
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить html-код
Я бы начал смотреть с http://phantomjs.org/ В двух словах это WebKit движок, которому не надо запускать окно браузера. Как говорят разраотчики "So, it is a web browser that works on your server."
...
Рейтинг: 0 / 0
12.09.2014, 13:36
    #38745094
reset4
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить html-код
Alibek B.А какая связь между Java и JS?
Отвечающие тоже доставляют. ТС ведь указал, что из браузера он получает интересуемое, но ему нужно эмулировать работу браузера, захостить у себя скриптовый движок и получить страницу после отработки скриптов .
А все как один, не включая мозги, советуют забирать страницу из браузера или с сервера.
this
...
Рейтинг: 0 / 0
12.09.2014, 13:39
    #38745096
reset4
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Получить html-код
Blazkowiczreset4Если создавать внешний процесс браузера и делать все в нем, то работает. Интересуют варианты без внешних приложений.
webkit - это opensource. Ничего не мешает интегрировать в свой процесс и использовать API. Зачем создавать новые процессы?
Надеюсь, решение не серверное? Потому что запускать какой попало JS на сервере чревато как минимум тормозами.
тоже решил в эту сторону копать. Может есть готовые примеры у кого-нибудь? Для ускорения меня ;)
...
Рейтинг: 0 / 0
Форумы / Java [игнор отключен] [закрыт для гостей] / Получить html-код / 17 сообщений из 17, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]