|
|
|
скриншоты web страниц + html код
|
|||
|---|---|---|---|
|
#18+
Добрый день ! нужно делать скриншоты web страниц полностью а также одновременно сохранять полностью их код включая все подключаемые файлы (*.js) желательно на основе mozilla. какие есть возможности ? или как можно в командной строке вызвать mozilla и получить html код страницы. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2010, 00:11 |
|
||
|
скриншоты web страниц + html код
|
|||
|---|---|---|---|
|
#18+
YuriyB, wget ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2010, 01:10 |
|
||
|
скриншоты web страниц + html код
|
|||
|---|---|---|---|
|
#18+
Relic HunterYuriyB, wget ? это не совсем то . во первых он не грузит весь код (например подключаемые javascript скрипты) а во вторых мне же нужет и скриншот еще. есть например плугин для firefox http://torisugari.googlepages.com/cmdlnprint_0_5_1.xpi который позволяет $> firefox -print google.com быстро получить скриншо НО КОД страницы ?! реальное это скрипт с Xfvb ( X-Server) вместе с Firefox с какамито модулями или плугинами ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2010, 01:47 |
|
||
|
скриншоты web страниц + html код
|
|||
|---|---|---|---|
|
#18+
YuriyBво первых он не грузит весь код (например подключаемые javascript скрипты)Грузит... Код: plaintext 1. 2. 3. 4. 5. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2010, 02:04 |
|
||
|
скриншоты web страниц + html код
|
|||
|---|---|---|---|
|
#18+
Relic Hunter, я полагаю ТС нужно что-то вроде того, как IE сохраняет в mhtml ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2010, 02:57 |
|
||
|
скриншоты web страниц + html код
|
|||
|---|---|---|---|
|
#18+
TC, IE легко автоматизируется на VB SCRIPT, если это не принципиально. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2010, 03:07 |
|
||
|
скриншоты web страниц + html код
|
|||
|---|---|---|---|
|
#18+
Интересно, а кто будет "гасить" запросы пользователю из скриптов (Alert/MsgBox) и сообщения об ошибке на странице, и различные вопросы от подсистемы безопасности ? И не просто гасить, а давать разумные, осмысленные ответы на вопросы. imho, фото экрана нужно желать с отключенными скриптами, хотя это означает , что изображение не будет в точности соответствовать тому, что увидит пользователь. Чтобы выцепить картинку из IE можно погуглить IHTMLElementRender IViewObject Про другие броузеры ничего сказать не могу... Насчет сохранения HTML кода: а что насчет Ajax - динамичеких запросов ? Данные, полученные динамически могут не сохранятся в файл и вы их никак не получите , кроме перехвата на проксике т.е. создаете туннель на обычных сокетах и заставляете работать браузер через этот туннель, весь траффик перехватываете и сохраняете. Впрочем погут быть проблемы с перехватом SSL... но это тоже решаемо. С++ Вам в помощь. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2010, 10:29 |
|
||
|
скриншоты web страниц + html код
|
|||
|---|---|---|---|
|
#18+
вот еть наробтки здесь http://www.mysql-apache-php.com/website_screenshot.htm или щдесь http://marginalhacks.com/Hacks/html2jpg/ но номрального работающего решения я пока не нашел ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2010, 10:50 |
|
||
|
скриншоты web страниц + html код
|
|||
|---|---|---|---|
|
#18+
YuriyB, Сделать полный скриншот всей страницы может плагин FireShot В FF автоматизировать действия можно плагинами Greasemonkey и iMacros (оба не пробовал). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2010, 12:25 |
|
||
|
скриншоты web страниц + html код
|
|||
|---|---|---|---|
|
#18+
miksoftYuriyB, Сделать полный скриншот всей страницы может плагин FireShot В FF автоматизировать действия можно плагинами Greasemonkey и iMacros (оба не пробовал). но мне нужно ОДНОВРЕМЕННО получить и код страницы (html , js ,....) задача такая есть 10000 URL с динамическими страницами которые меняют свой код при каждом новом вызове и раз в час с них нужно делать полный скриншот всей страницы если в её коде попадается заданый ключ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2010, 12:49 |
|
||
|
скриншоты web страниц + html код
|
|||
|---|---|---|---|
|
#18+
YuriyBmiksoftYuriyB, Сделать полный скриншот всей страницы может плагин FireShot В FF автоматизировать действия можно плагинами Greasemonkey и iMacros (оба не пробовал). но мне нужно ОДНОВРЕМЕННО получить и код страницы (html , js ,....) задача такая есть 10000 URL с динамическими страницами которые меняют свой код при каждом новом вызове и раз в час с них нужно делать полный скриншот всей страницы если в её коде попадается заданый ключТаки попробуйте. Возможно, плагин для автоматизации сможет дать команду другому плагину на сохранение скришота. Кстати, при беглом просмотре документации iMacros похоже, что он умеет делать скриншоты самостоятельно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2010, 13:03 |
|
||
|
скриншоты web страниц + html код
|
|||
|---|---|---|---|
|
#18+
YuriyB если в её коде попадается заданый ключ Ввиду того, что часть htmlя может генерится "на лету" всякими шмяксами-аяксами-жаваскриптами, страницу нужно натурально запускать браузером и только после этого получать эффективный html код (не загруженный html, а именно отображаемый - они могут отличаться). Если же "заданный ключ" должен присутствовать в html в чистом виде, то сойдёт любая качалка, от вгета до например http://www.httrack.com/. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2010, 13:12 |
|
||
|
скриншоты web страниц + html код
|
|||
|---|---|---|---|
|
#18+
ineedyouYuriyB если в её коде попадается заданый ключ Ввиду того, что часть htmlя может генерится "на лету" всякими шмяксами-аяксами-жаваскриптами, страницу нужно натурально запускать браузером и только после этого получать эффективный html код (не загруженный html, а именно отображаемый - они могут отличаться). Если же "заданный ключ" должен присутствовать в html в чистом виде, то сойдёт любая качалка, от вгета до например http://www.httrack.com/. все генерится "на лету" всякими шмяксами-аяксами-жаваскриптами ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2010, 13:21 |
|
||
|
скриншоты web страниц + html код
|
|||
|---|---|---|---|
|
#18+
На какой ОС планируется крутить проект? Если венда может имеет смысл подумать в сторону средств типа Rational Robot ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2010, 13:30 |
|
||
|
скриншоты web страниц + html код
|
|||
|---|---|---|---|
|
#18+
ineedyouНа какой ОС планируется крутить проект? Если венда может имеет смысл подумать в сторону средств типа Rational Robot ? это всё равно любая ОС любой язык программирования ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2010, 13:36 |
|
||
|
скриншоты web страниц + html код
|
|||
|---|---|---|---|
|
#18+
Блин, совсем забыл про PDFCreator и тому подобные ! Отправляете страницу на печать в виртуальный принтер, получаете на выходе готовую картинку. Может попробовать "подмес" своего скрипта в тело HTML документа? на проксике в каждую HTML форму добавляете строчку типа <script language = JScript src="http://127.0.0.1/grab/GrabHTML.js"></script> в этом скрипте отслеживаете загрузку документа, считываете HTML и отправляете на печать на виртуальный принтер.... и всего делов ! Если будут проблемы с контекстом безопасности (загрузка скрипта из другого домена), то тогда можно побробовать иначе - дописывать свой код не как отдельный файл, а как внедренный в html , ну или прямо в тело "родного" скрипта. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2010, 13:38 |
|
||
|
скриншоты web страниц + html код
|
|||
|---|---|---|---|
|
#18+
Простенький пример управлениия IE на VBS. Cкрипт открывает указанный URL, печатает страницу на принтер по умолчанию (поставьте PDFCreator) сохраняет в файл InnerHTML документа. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2010, 16:52 |
|
||
|
скриншоты web страниц + html код
|
|||
|---|---|---|---|
|
#18+
ART-CODEПростенький пример управлениия IE на VBS. Cкрипт открывает указанный URL, печатает страницу на принтер по умолчанию (поставьте PDFCreator) сохраняет в файл InnerHTML документа. я попробовал сделать на C# всё работает отлично но InnerHTML это не полный html код. мне нужно еще "добраться " до iframeмов которые содержат в себе еще iframeмы ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.02.2010, 21:21 |
|
||
|
|

start [/forum/topic.php?fid=25&msg=36461978&tid=1485131]: |
0ms |
get settings: |
11ms |
get forum list: |
19ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
177ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
84ms |
get tp. blocked users: |
2ms |
| others: | 255ms |
| total: | 571ms |

| 0 / 0 |
