Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / HTML, JavaScript, VBScript, CSS [игнор отключен] [закрыт для гостей] / скрипт для вытягивания новостей / 21 сообщений из 21, страница 1 из 1
18.09.2007, 16:33
    #34808752
SuSa
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
Доброго время суток.
Возникла задача стыреть с одного сайта 5-ку последних новостей.
как говорится небылоб проблем если бы хотябы знал js. то есть конечно на нем писал когдато, но было давно.
может кто писал? скрипт такой в смысле.
необходимо чтобы скрип валялся в папке на компе (js/topnews.js)там же где и страницы. и вызывался так:
<script language=JavaScript src="http://pif.investfunds.ru/news/js/topnews.js"></script>
http://pif.investfunds.ru/news/ -имя сайта откуда тырить новости
Этоб было еще пол беды если у сайта был rss. с xml дружу и было бы гораздо быстрее. так его нету..
Значится вопросики:
1. Если у кого то есть скрипт который новости тягает дайте код, плиззз
2. если нету отпишите как конектится из скрипта к данному сайту и распарсивать его внутренности.
парсится следующий блог типа:
<B>18.09.2007</B></font><BR><BR><font color=#3399FF>[14:17] - </font> <A HREF='news/7973' CLASS=u>УК Росбанка открыла офис в Омске</A>...
то есть поиск текущей даты и потом 5 полей.
в общем все.. буду благодарен за любые ответы.
...
Рейтинг: 0 / 0
18.09.2007, 16:50
    #34808839
michael R
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
можно через обьект winHTTP вытащить html-код с сайта
в текстовую переменную
а потом через регулярные выражения парсить текст
конечно несколько через задницу
...
Рейтинг: 0 / 0
18.09.2007, 16:55
    #34808864
SuSa
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
какой знакомый ник :)
привет из раздела xml.
А поподробнее с примером нельзя? считай что в этой облости я вообще нуль.
максимально приближонный к теме пример если можно.
...
Рейтинг: 0 / 0
18.09.2007, 17:17
    #34808965
michael R
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
да это я
спасибо за советы из xml
попробую помочь

это работает для Internet Explorer
(для других браузеров обьекты вызываются по другому
я так не помню)

// получить html как текст с сайта
function getDoc(url,username,password)
{
var WinHttpReq = new ActiveXObject("WinHttp.WinHttpRequest.5.1");
...................................
могут быть другие установки
........................................
WinHttpReq.Open("GET", url, false);
//WinHttpReq.SetCredentials(username,password,0); если есть пароли то открыть коментарии
WinHttpReq.Send();
if (WinHttpReq.Status==200)
{
return (WinHttpReq.ResponseText);
}
else
{
return ""
}


вызов

var tt=getDoc("www.google.com","","")
alert(tt)

с регулярными выражениями нужно подумать
я в них не большой спец

можно также использовать asp для обьекта WinHttp
и тогда не будет зависить от браузера но там чуть больше кода

попробуй сначала этот кусок
проверь что он работает
...
Рейтинг: 0 / 0
18.09.2007, 17:22
    #34808989
michael R
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
забыл ещё закрыть скобку

// получить html как текст с сайта
function getDoc(url,username,password)
{
var WinHttpReq = new ActiveXObject("WinHttp.WinHttpRequest.5.1");
...................................
могут быть другие установки
........................................
WinHttpReq.Open("GET", url, false);
//WinHttpReq.SetCredentials(username,password,0); если есть пароли то открыть коментарии
WinHttpReq.Send();
if (WinHttpReq.Status==200)
{
return (WinHttpReq.ResponseText);
}
else
{
return ""
}
}
...
Рейтинг: 0 / 0
18.09.2007, 17:27
    #34809008
SuSa
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
спасибо за ответ пошел колбасится с ним.
...
Рейтинг: 0 / 0
18.09.2007, 18:23
    #34809256
michael R
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
...
Рейтинг: 0 / 0
18.09.2007, 18:24
    #34809261
michael R
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
запусти этот файл в IE
при нажатии должен дать html

может лучше сделать через asp + IIS
...
Рейтинг: 0 / 0
18.09.2007, 19:55
    #34809494
SuSa
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
Видать чего то нехватает ,выдает токо ошибка на странице.
Но и за это спасибо :)
...
Рейтинг: 0 / 0
18.09.2007, 19:58
    #34809497
michael R
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
какая ошибка

нужно в IE выставить Enable на ActiveX контроли
...
Рейтинг: 0 / 0
18.09.2007, 20:29
    #34809535
SuSa
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
Блин , во всех видах уже разрешил, все еще ругается на
xmlhttp.open("GET", url,false);
...
Рейтинг: 0 / 0
18.09.2007, 23:37
    #34809721
Ghirik
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
Помочь не очень то могу, потому как такого не делал. Но вот подумалось, что использовать ActiveX наверное не очень правильно. Не все увидят ваши новости. Мне кажется, лучше всё это делать на php. Во первых, можно назначить задание, например настроить Cron, и забирать, и парсить(на php) один раз в сутки. Во вторых, скорость загрузки страницы не мало важная вещь. Если вы будете выводить новости из уже готового файла, это будет лихо. В общем, парсить на лету - это не есть хорошо.
Тем более, есть масса готовых бесплатных парсеров, чуть подправить код под вашу задачу, и вперед.
...
Рейтинг: 0 / 0
18.09.2007, 23:42
    #34809728
michael R
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
странно у меня идёт
ошибка какая ?
а у тебя в пути для URL указанно http:// ?

тебе только через скрипты если через asp ?


Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
<%
  set whttp = Server.CreateObject("WinHttp.WinHttpRequest.5.1")	
  set url="http://www.google.com"
  Call whttp.Open("GET",  url, false)
  whttp.setRequestHeader "Content-Type", "application/x-www-form-urlencoded;"
  Call whttp.send("")
  txt = whttp.responseText
%>

<html>
<body>
<script language="javascript">
   alert("<%=txt%>")
</script>

файл с расширением asp установить в inetpub/wwwroot
прописать в IIS
ты знаешь как запускать ?
так без привязки к браузеру
...
Рейтинг: 0 / 0
18.09.2007, 23:49
    #34809732
michael R
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
Ghirik Тем более, есть масса готовых бесплатных парсеров, чуть подправить код под вашу задачу, и вперед.

хотел бы я такой парсер для html который в добавок не XHTML
по поводу ActiveX я же написал что это несколько через задницу
и только для IE MOZILLA это не берёт
...
Рейтинг: 0 / 0
19.09.2007, 00:13
    #34809756
Ghirik
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
Орс..я не уловил, что нужно из HTML парсить... невнимательность...
Сейчас проверил, эти новости открываются в фрейме. Можно грузить в скрытый фрейм и уже от туда парсить. Или нужны только заголовки?
Что значит?:
авторто есть поиск текущей даты и потом 5 полей
Только этот кусочек с заголовками? или страницы с этими адресами?
...
Рейтинг: 0 / 0
19.09.2007, 10:59
    #34810356
michael R
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
Ghirik Можно грузить в скрытый фрейм и уже от туда парсить

мысль неплохая
но как вытащить html из iframe
если src обращается к другому сайту

document.getElementById("имя iframe").contentWindow.document.body.innerHTML
такое не сработает
Error: uncaught exception: Permission denied to get property HTMLDocument.body

так что только через сервер
...
Рейтинг: 0 / 0
19.09.2007, 21:31
    #34812755
Ghirik
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
авторdocument.getElementById("имя iframe").contentWindow.document.body.innerHTML
такое не сработает

Да, у меня пока то же не получается.
Задал Здесь вопрос, может кто подскажет.
...
Рейтинг: 0 / 0
19.09.2007, 23:47
    #34812905
Ghirik
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
Подумалось....
Эти новости точно из RSS каналов!!! Попробуйте поискать источник по содержимому новостей. Только желательно по старым новостям, чтобы поисковики успели проиндексировать.
...
Рейтинг: 0 / 0
20.09.2007, 08:33
    #34813178
SuSa
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
Всем спасибо за участие. Документ действительно заработал на другом компе, на своем скоко я с настройками не воевал не получилось. ну неважно.
у меня вот вопрос, вот этот самый документ с http://pif.investfunds.ru/news/ аналогично как с гуглом работать отказался. В чем сущесвенное различие?
можно просто ответить в чем различие. скрипт уже написан, правда на другом языке :) (php), работает как надо, осталось его токо оптимизировать

Еще раз всем спасибо.
...
Рейтинг: 0 / 0
20.09.2007, 23:47
    #34816208
michael R
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
я посмотрю что не так
...
Рейтинг: 0 / 0
30.09.2007, 11:02
    #34836821
michael R
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
скрипт для вытягивания новостей
SuSa

я посмотрел какая то проблема с Unicode
возможно с кодировками

по поводу получения html с сайта
можно использовать VB6 (Microsoft HTML Object)
он получает текст без проблем
и дальше можно парсить как хочешь

единственно нужно наверно сделать dll и обращаться из скриптов или asp или php....
все равно задействовать сервер
...
Рейтинг: 0 / 0
Форумы / HTML, JavaScript, VBScript, CSS [игнор отключен] [закрыт для гостей] / скрипт для вытягивания новостей / 21 сообщений из 21, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]