|
|
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
Доброго время суток. Возникла задача стыреть с одного сайта 5-ку последних новостей. как говорится небылоб проблем если бы хотябы знал js. то есть конечно на нем писал когдато, но было давно. может кто писал? скрипт такой в смысле. необходимо чтобы скрип валялся в папке на компе (js/topnews.js)там же где и страницы. и вызывался так: <script language=JavaScript src="http://pif.investfunds.ru/news/js/topnews.js"></script> http://pif.investfunds.ru/news/ -имя сайта откуда тырить новости Этоб было еще пол беды если у сайта был rss. с xml дружу и было бы гораздо быстрее. так его нету.. Значится вопросики: 1. Если у кого то есть скрипт который новости тягает дайте код, плиззз 2. если нету отпишите как конектится из скрипта к данному сайту и распарсивать его внутренности. парсится следующий блог типа: <B>18.09.2007</B></font><BR><BR><font color=#3399FF>[14:17] - </font> <A HREF='news/7973' CLASS=u>УК Росбанка открыла офис в Омске</A>... то есть поиск текущей даты и потом 5 полей. в общем все.. буду благодарен за любые ответы. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.09.2007, 16:33 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
можно через обьект winHTTP вытащить html-код с сайта в текстовую переменную а потом через регулярные выражения парсить текст конечно несколько через задницу ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.09.2007, 16:50 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
какой знакомый ник :) привет из раздела xml. А поподробнее с примером нельзя? считай что в этой облости я вообще нуль. максимально приближонный к теме пример если можно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.09.2007, 16:55 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
да это я спасибо за советы из xml попробую помочь это работает для Internet Explorer (для других браузеров обьекты вызываются по другому я так не помню) // получить html как текст с сайта function getDoc(url,username,password) { var WinHttpReq = new ActiveXObject("WinHttp.WinHttpRequest.5.1"); ................................... могут быть другие установки ........................................ WinHttpReq.Open("GET", url, false); //WinHttpReq.SetCredentials(username,password,0); если есть пароли то открыть коментарии WinHttpReq.Send(); if (WinHttpReq.Status==200) { return (WinHttpReq.ResponseText); } else { return "" } вызов var tt=getDoc("www.google.com","","") alert(tt) с регулярными выражениями нужно подумать я в них не большой спец можно также использовать asp для обьекта WinHttp и тогда не будет зависить от браузера но там чуть больше кода попробуй сначала этот кусок проверь что он работает ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.09.2007, 17:17 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
забыл ещё закрыть скобку // получить html как текст с сайта function getDoc(url,username,password) { var WinHttpReq = new ActiveXObject("WinHttp.WinHttpRequest.5.1"); ................................... могут быть другие установки ........................................ WinHttpReq.Open("GET", url, false); //WinHttpReq.SetCredentials(username,password,0); если есть пароли то открыть коментарии WinHttpReq.Send(); if (WinHttpReq.Status==200) { return (WinHttpReq.ResponseText); } else { return "" } } ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.09.2007, 17:22 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
спасибо за ответ пошел колбасится с ним. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.09.2007, 17:27 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
запусти этот файл в IE при нажатии должен дать html может лучше сделать через asp + IIS ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.09.2007, 18:24 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
Видать чего то нехватает ,выдает токо ошибка на странице. Но и за это спасибо :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.09.2007, 19:55 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
какая ошибка нужно в IE выставить Enable на ActiveX контроли ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.09.2007, 19:58 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
Блин , во всех видах уже разрешил, все еще ругается на xmlhttp.open("GET", url,false); ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.09.2007, 20:29 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
Помочь не очень то могу, потому как такого не делал. Но вот подумалось, что использовать ActiveX наверное не очень правильно. Не все увидят ваши новости. Мне кажется, лучше всё это делать на php. Во первых, можно назначить задание, например настроить Cron, и забирать, и парсить(на php) один раз в сутки. Во вторых, скорость загрузки страницы не мало важная вещь. Если вы будете выводить новости из уже готового файла, это будет лихо. В общем, парсить на лету - это не есть хорошо. Тем более, есть масса готовых бесплатных парсеров, чуть подправить код под вашу задачу, и вперед. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.09.2007, 23:37 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
странно у меня идёт ошибка какая ? а у тебя в пути для URL указанно http:// ? тебе только через скрипты если через asp ? Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. прописать в IIS ты знаешь как запускать ? так без привязки к браузеру ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.09.2007, 23:42 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
Ghirik Тем более, есть масса готовых бесплатных парсеров, чуть подправить код под вашу задачу, и вперед. хотел бы я такой парсер для html который в добавок не XHTML по поводу ActiveX я же написал что это несколько через задницу и только для IE MOZILLA это не берёт ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.09.2007, 23:49 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
Орс..я не уловил, что нужно из HTML парсить... невнимательность... Сейчас проверил, эти новости открываются в фрейме. Можно грузить в скрытый фрейм и уже от туда парсить. Или нужны только заголовки? Что значит?: авторто есть поиск текущей даты и потом 5 полей Только этот кусочек с заголовками? или страницы с этими адресами? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.09.2007, 00:13 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
Ghirik Можно грузить в скрытый фрейм и уже от туда парсить мысль неплохая но как вытащить html из iframe если src обращается к другому сайту document.getElementById("имя iframe").contentWindow.document.body.innerHTML такое не сработает Error: uncaught exception: Permission denied to get property HTMLDocument.body так что только через сервер ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.09.2007, 10:59 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
авторdocument.getElementById("имя iframe").contentWindow.document.body.innerHTML такое не сработает Да, у меня пока то же не получается. Задал Здесь вопрос, может кто подскажет. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.09.2007, 21:31 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
Подумалось.... Эти новости точно из RSS каналов!!! Попробуйте поискать источник по содержимому новостей. Только желательно по старым новостям, чтобы поисковики успели проиндексировать. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.09.2007, 23:47 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
Всем спасибо за участие. Документ действительно заработал на другом компе, на своем скоко я с настройками не воевал не получилось. ну неважно. у меня вот вопрос, вот этот самый документ с http://pif.investfunds.ru/news/ аналогично как с гуглом работать отказался. В чем сущесвенное различие? можно просто ответить в чем различие. скрипт уже написан, правда на другом языке :) (php), работает как надо, осталось его токо оптимизировать Еще раз всем спасибо. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.09.2007, 08:33 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
я посмотрю что не так ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.09.2007, 23:47 |
|
||
|
скрипт для вытягивания новостей
|
|||
|---|---|---|---|
|
#18+
SuSa я посмотрел какая то проблема с Unicode возможно с кодировками по поводу получения html с сайта можно использовать VB6 (Microsoft HTML Object) он получает текст без проблем и дальше можно парсить как хочешь единственно нужно наверно сделать dll и обращаться из скриптов или asp или php.... все равно задействовать сервер ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.09.2007, 11:02 |
|
||
|
|

start [/forum/topic.php?fid=22&msg=34809494&tid=1457575]: |
0ms |
get settings: |
9ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
205ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
51ms |
get tp. blocked users: |
1ms |
| others: | 12ms |
| total: | 310ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...