|
Получение данных со скрипта вебстраницы
|
|||
---|---|---|---|
#18+
Добрый день! Пишу парсер для сайта rusprofile. Возникла сложность на этапе перехода к странице организации В перечне тегов данной страницы нет тега с URL страницы организации ("www.rusprofile.ru/id/4539245"), при этом в структуре DOM тег с таким содержанием отображается. Из всего перечисленного делаю вывод, что данный текст является результатом выполнения скрипта. Вопрос: можно ли каким-либо образом обработать скрипт средствами VBA, чтобы в результате получить искомый URL? ... |
|||
:
Нравится:
Не нравится:
|
|||
07.07.2015, 12:34 |
|
Получение данных со скрипта вебстраницы
|
|||
---|---|---|---|
#18+
Почему-то не прикрепился адрес страницы. Прикрепляю http://www.rusprofile.ru/support/search.html?cx=partner-pub-2023889461799885:1217393034&cof=FORID:10&ie=UTF-8&q=7825045809 ... |
|||
:
Нравится:
Не нравится:
|
|||
07.07.2015, 12:37 |
|
Получение данных со скрипта вебстраницы
|
|||
---|---|---|---|
#18+
... |
|||
:
Нравится:
Не нравится:
|
|||
07.07.2015, 12:58 |
|
Получение данных со скрипта вебстраницы
|
|||
---|---|---|---|
#18+
Antonariy, Спасибо!! Адрес я вставил свой, а что писать вместо "alert(document.forms.length)" Код скрипта такой: <script type="text/javascript" src=" http://www.google.ru/jsapi"></script> <script type="text/javascript"> google.load('search', '1', {language : 'ru'}); function searchLoaded() { var options = {}; options['adoptions'] = {'cseGoogleHosting': 'iframe'}; var customSearchControl = new google.search.CustomSearchControl( "partner-pub-2023889461799885:1217393034" , options); customSearchControl.setRefinementStyle("link"); customSearchControl.setResultSetSize(google.search.Search.FILTERED_CSE_RESULTSET); customSearchControl.setMoreAds(); var options = new google.search.DrawOptions(); options.setSearchFormRoot('cse-search-form'); customSearchControl.draw('cse', options); historyManagement(customSearchControl); } function historyManagement(customSearchControl) { if (customSearchControl.startHistoryManagement(init)) { customSearchControl.setLinkTarget( google.search.Search.LINK_TARGET_TOP); } } function init(customSearchControl) { var num = customSearchControl.getWebSearcher().getNumResultsPerPage(); customSearchControl.execute("7825045809"); } google.setOnLoadCallback(searchLoaded, true); </script> ... |
|||
:
Нравится:
Не нравится:
|
|||
07.07.2015, 13:42 |
|
Получение данных со скрипта вебстраницы
|
|||
---|---|---|---|
#18+
Код: vbnet 1.
... |
|||
:
Нравится:
Не нравится:
|
|||
07.07.2015, 15:47 |
|
Получение данных со скрипта вебстраницы
|
|||
---|---|---|---|
#18+
если результатов будет несколько: For each a in x.frames(0).document.querySelectorAll(".gsc-table-result tbody tr td[2] div[1] a") Debug.print a.href Next ... |
|||
:
Нравится:
Не нравится:
|
|||
07.07.2015, 15:49 |
|
Получение данных со скрипта вебстраницы
|
|||
---|---|---|---|
#18+
Antonariyесли результатов будет несколько: Код: vbnet 1. 2. 3.
... |
|||
:
Нравится:
Не нравится:
|
|||
07.07.2015, 15:50 |
|
Получение данных со скрипта вебстраницы
|
|||
---|---|---|---|
#18+
Antonariy, Еще раз спасибо за помощь, но все-равно не получается) Public DocumentFactory As HTMLDocument Public Function GetWebPage(ByVal strURL As String) As HTMLDocument Set GetWebPage = DocumentFactory.createDocumentFromUrl(strURL, vbNullString) Do Until GetWebPage.readyState = "complete" DoEvents Loop End Function Private Sub Form_Load() Dim x As HTMLDocument Set DocumentFactory = New HTMLDocument Set x = GetWebPage(" http://www.rusprofile.ru/support/search.html?cx=partner-pub-2023889461799885:1217393034&cof=FORID:10&ie=UTF-8&q=7825045809") Debug.Print x.frames(0).document.querySelector(".gsc-table-result tbody tr td[2] div[1] a").href - Пишет Object doesn't support this property or method End Sub Библиотека WinHTTP подключена ... |
|||
:
Нравится:
Не нравится:
|
|||
07.07.2015, 16:03 |
|
Получение данных со скрипта вебстраницы
|
|||
---|---|---|---|
#18+
araz, учимся использовать тэги оформления кода - FAQ Вам же отвечают с оформлением, а вы продолжает гнать простой текст, невежливо ... |
|||
:
Нравится:
Не нравится:
|
|||
07.07.2015, 16:48 |
|
Получение данных со скрипта вебстраницы
|
|||
---|---|---|---|
#18+
Shocker.Pro, Прошу прощения, исправлюсь) ... |
|||
:
Нравится:
Не нравится:
|
|||
07.07.2015, 16:55 |
|
Получение данных со скрипта вебстраницы
|
|||
---|---|---|---|
#18+
Библиотека WinHTTP не нужна, нужна Microsoft HTML Object Library. arazПишет Object doesn't support this property or methodсвойство frames какую-то дичь возвращает. ссылку на документ, а не коллекцию фреймов. Код: vbnet 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15.
... |
|||
:
Нравится:
Не нравится:
|
|||
07.07.2015, 16:56 |
|
|
start [/forum/topic.php?fid=60&gotonew=1&tid=2155865]: |
0ms |
get settings: |
11ms |
get forum list: |
13ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
82ms |
get topic data: |
13ms |
get first new msg: |
9ms |
get forum data: |
3ms |
get page messages: |
58ms |
get tp. blocked users: |
2ms |
others: | 302ms |
total: | 499ms |
0 / 0 |