powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Java [игнор отключен] [закрыт для гостей] / Получить html-код
17 сообщений из 17, страница 1 из 1
Получить html-код
    #38744713
reset4
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Приветствую
подскажите, как "правильно" получить HTML-код страницы после выполнения клиентских JS скриптов на ней (то, что видит пользователь в браузере)?
...
Рейтинг: 0 / 0
Получить html-код
    #38744743
mr_virtus
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
reset4,
здравствуйте,

а что конкретно интересует? Вы можете из html вызывать JS и используя JS генерить html код.
...
Рейтинг: 0 / 0
Получить html-код
    #38744745
alexy_black
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
я копирую из firefox инспектора. там можно выделить body и скопировать его и его подузлы.
...
Рейтинг: 0 / 0
Получить html-код
    #38744747
mr_virtus
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
reset4,

можете здесь посмотреть примеры.

http://www.tutorialspoint.com/javascript/javascript_forin_loop.htm

Возможно, подойдет Вам.
...
Рейтинг: 0 / 0
Получить html-код
    #38744831
reset4
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
mr_virtusreset4,
здравствуйте,

а что конкретно интересует? Вы можете из html вызывать JS и используя JS генерить html код.
Есть страница со скриптами. Нужно вытащить из нее HTML для дальнейшего парса.Если напрямую забирать со страницы данные,то получаем в результате текст с неотработанными скриптами. Нужно получить страницу, выполнить скрипты и забрать с нее html.
Если создавать внешний процесс браузера и делать все в нем, то работает. Интересуют варианты без внешних приложений.
...
Рейтинг: 0 / 0
Получить html-код
    #38744860
mad_nazgul
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
reset4Есть страница со скриптами. Нужно вытащить из нее HTML для дальнейшего парса.Если напрямую забирать со страницы данные,то получаем в результате текст с неотработанными скриптами. Нужно получить страницу, выполнить скрипты и забрать с нее html.
Если создавать внешний процесс браузера и делать все в нем, то работает. Интересуют варианты без внешних приложений.

Гуглить работу с HttpClient
...
Рейтинг: 0 / 0
Получить html-код
    #38744875
Фотография Blazkowicz
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
reset4подскажите, как "правильно" получить HTML-код страницы после выполнения клиентских JS скриптов на ней (то, что видит пользователь в браузере)?
Получить где?
...
Рейтинг: 0 / 0
Получить html-код
    #38744904
reset4
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
mad_nazgulreset4Есть страница со скриптами. Нужно вытащить из нее HTML для дальнейшего парса.Если напрямую забирать со страницы данные,то получаем в результате текст с неотработанными скриптами. Нужно получить страницу, выполнить скрипты и забрать с нее html.
Если создавать внешний процесс браузера и делать все в нем, то работает. Интересуют варианты без внешних приложений.

Гуглить работу с HttpClient
погуглено уже, все клиенты с первой страницы гугла, выдают HTML без отработанных скрптов. Поэтому и пишу сюда :).
...
Рейтинг: 0 / 0
Получить html-код
    #38744905
reset4
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
alexy_blackя копирую из firefox инспектора. там можно выделить body и скопировать его и его подузлы.
да, про это уже указал, что если юзать внешний процесс, то все работает.
...
Рейтинг: 0 / 0
Получить html-код
    #38744908
reset4
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Blazkowiczreset4подскажите, как "правильно" получить HTML-код страницы после выполнения клиентских JS скриптов на ней (то, что видит пользователь в браузере)?
Получить где?
получить в Java приложении в виде String, InputStream или еще чего, что можно было бы распарсить.
...
Рейтинг: 0 / 0
Получить html-код
    #38744910
mad_nazgul
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
reset4погуглено уже, все клиенты с первой страницы гугла, выдают HTML без отработанных скрптов. Поэтому и пишу сюда :).

HtmlUnit
Selenium

Учитесь гуглить ;-)
...
Рейтинг: 0 / 0
Получить html-код
    #38744926
smackmychi
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
mad_nazgul,

document.body.innerHTML
...
Рейтинг: 0 / 0
Получить html-код
    #38745003
Alibek B
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А какая связь между Java и JS?
Отвечающие тоже доставляют. ТС ведь указал, что из браузера он получает интересуемое, но ему нужно эмулировать работу браузера, захостить у себя скриптовый движок и получить страницу после отработки скриптов.
А все как один, не включая мозги, советуют забирать страницу из браузера или с сервера.
...
Рейтинг: 0 / 0
Получить html-код
    #38745011
Фотография Blazkowicz
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
reset4Если создавать внешний процесс браузера и делать все в нем, то работает. Интересуют варианты без внешних приложений.
webkit - это opensource. Ничего не мешает интегрировать в свой процесс и использовать API. Зачем создавать новые процессы?
Надеюсь, решение не серверное? Потому что запускать какой попало JS на сервере чревато как минимум тормозами.
...
Рейтинг: 0 / 0
Получить html-код
    #38745018
забыл ник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Я бы начал смотреть с http://phantomjs.org/ В двух словах это WebKit движок, которому не надо запускать окно браузера. Как говорят разраотчики "So, it is a web browser that works on your server."
...
Рейтинг: 0 / 0
Получить html-код
    #38745094
reset4
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Alibek B.А какая связь между Java и JS?
Отвечающие тоже доставляют. ТС ведь указал, что из браузера он получает интересуемое, но ему нужно эмулировать работу браузера, захостить у себя скриптовый движок и получить страницу после отработки скриптов .
А все как один, не включая мозги, советуют забирать страницу из браузера или с сервера.
this
...
Рейтинг: 0 / 0
Получить html-код
    #38745096
reset4
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Blazkowiczreset4Если создавать внешний процесс браузера и делать все в нем, то работает. Интересуют варианты без внешних приложений.
webkit - это opensource. Ничего не мешает интегрировать в свой процесс и использовать API. Зачем создавать новые процессы?
Надеюсь, решение не серверное? Потому что запускать какой попало JS на сервере чревато как минимум тормозами.
тоже решил в эту сторону копать. Может есть готовые примеры у кого-нибудь? Для ускорения меня ;)
...
Рейтинг: 0 / 0
17 сообщений из 17, страница 1 из 1
Форумы / Java [игнор отключен] [закрыт для гостей] / Получить html-код
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]