powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / HTML, JavaScript, VBScript, CSS [игнор отключен] [закрыт для гостей] / скрипт для вытягивания новостей
21 сообщений из 21, страница 1 из 1
скрипт для вытягивания новостей
    #34808752
SuSa
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Доброго время суток.
Возникла задача стыреть с одного сайта 5-ку последних новостей.
как говорится небылоб проблем если бы хотябы знал js. то есть конечно на нем писал когдато, но было давно.
может кто писал? скрипт такой в смысле.
необходимо чтобы скрип валялся в папке на компе (js/topnews.js)там же где и страницы. и вызывался так:
<script language=JavaScript src="http://pif.investfunds.ru/news/js/topnews.js"></script>
http://pif.investfunds.ru/news/ -имя сайта откуда тырить новости
Этоб было еще пол беды если у сайта был rss. с xml дружу и было бы гораздо быстрее. так его нету..
Значится вопросики:
1. Если у кого то есть скрипт который новости тягает дайте код, плиззз
2. если нету отпишите как конектится из скрипта к данному сайту и распарсивать его внутренности.
парсится следующий блог типа:
<B>18.09.2007</B></font><BR><BR><font color=#3399FF>[14:17] - </font> <A HREF='news/7973' CLASS=u>УК Росбанка открыла офис в Омске</A>...
то есть поиск текущей даты и потом 5 полей.
в общем все.. буду благодарен за любые ответы.
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34808839
Фотография michael R
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
можно через обьект winHTTP вытащить html-код с сайта
в текстовую переменную
а потом через регулярные выражения парсить текст
конечно несколько через задницу
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34808864
SuSa
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
какой знакомый ник :)
привет из раздела xml.
А поподробнее с примером нельзя? считай что в этой облости я вообще нуль.
максимально приближонный к теме пример если можно.
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34808965
Фотография michael R
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
да это я
спасибо за советы из xml
попробую помочь

это работает для Internet Explorer
(для других браузеров обьекты вызываются по другому
я так не помню)

// получить html как текст с сайта
function getDoc(url,username,password)
{
var WinHttpReq = new ActiveXObject("WinHttp.WinHttpRequest.5.1");
...................................
могут быть другие установки
........................................
WinHttpReq.Open("GET", url, false);
//WinHttpReq.SetCredentials(username,password,0); если есть пароли то открыть коментарии
WinHttpReq.Send();
if (WinHttpReq.Status==200)
{
return (WinHttpReq.ResponseText);
}
else
{
return ""
}


вызов

var tt=getDoc("www.google.com","","")
alert(tt)

с регулярными выражениями нужно подумать
я в них не большой спец

можно также использовать asp для обьекта WinHttp
и тогда не будет зависить от браузера но там чуть больше кода

попробуй сначала этот кусок
проверь что он работает
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34808989
Фотография michael R
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
забыл ещё закрыть скобку

// получить html как текст с сайта
function getDoc(url,username,password)
{
var WinHttpReq = new ActiveXObject("WinHttp.WinHttpRequest.5.1");
...................................
могут быть другие установки
........................................
WinHttpReq.Open("GET", url, false);
//WinHttpReq.SetCredentials(username,password,0); если есть пароли то открыть коментарии
WinHttpReq.Send();
if (WinHttpReq.Status==200)
{
return (WinHttpReq.ResponseText);
}
else
{
return ""
}
}
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34809008
SuSa
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
спасибо за ответ пошел колбасится с ним.
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34809256
Фотография michael R
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34809261
Фотография michael R
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
запусти этот файл в IE
при нажатии должен дать html

может лучше сделать через asp + IIS
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34809494
SuSa
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Видать чего то нехватает ,выдает токо ошибка на странице.
Но и за это спасибо :)
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34809497
Фотография michael R
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
какая ошибка

нужно в IE выставить Enable на ActiveX контроли
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34809535
SuSa
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Блин , во всех видах уже разрешил, все еще ругается на
xmlhttp.open("GET", url,false);
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34809721
Ghirik
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Помочь не очень то могу, потому как такого не делал. Но вот подумалось, что использовать ActiveX наверное не очень правильно. Не все увидят ваши новости. Мне кажется, лучше всё это делать на php. Во первых, можно назначить задание, например настроить Cron, и забирать, и парсить(на php) один раз в сутки. Во вторых, скорость загрузки страницы не мало важная вещь. Если вы будете выводить новости из уже готового файла, это будет лихо. В общем, парсить на лету - это не есть хорошо.
Тем более, есть масса готовых бесплатных парсеров, чуть подправить код под вашу задачу, и вперед.
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34809728
Фотография michael R
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
странно у меня идёт
ошибка какая ?
а у тебя в пути для URL указанно http:// ?

тебе только через скрипты если через asp ?


Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
<%
  set whttp = Server.CreateObject("WinHttp.WinHttpRequest.5.1")	
  set url="http://www.google.com"
  Call whttp.Open("GET",  url, false)
  whttp.setRequestHeader "Content-Type", "application/x-www-form-urlencoded;"
  Call whttp.send("")
  txt = whttp.responseText
%>

<html>
<body>
<script language="javascript">
   alert("<%=txt%>")
</script>

файл с расширением asp установить в inetpub/wwwroot
прописать в IIS
ты знаешь как запускать ?
так без привязки к браузеру
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34809732
Фотография michael R
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ghirik Тем более, есть масса готовых бесплатных парсеров, чуть подправить код под вашу задачу, и вперед.

хотел бы я такой парсер для html который в добавок не XHTML
по поводу ActiveX я же написал что это несколько через задницу
и только для IE MOZILLA это не берёт
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34809756
Ghirik
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Орс..я не уловил, что нужно из HTML парсить... невнимательность...
Сейчас проверил, эти новости открываются в фрейме. Можно грузить в скрытый фрейм и уже от туда парсить. Или нужны только заголовки?
Что значит?:
авторто есть поиск текущей даты и потом 5 полей
Только этот кусочек с заголовками? или страницы с этими адресами?
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34810356
Фотография michael R
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ghirik Можно грузить в скрытый фрейм и уже от туда парсить

мысль неплохая
но как вытащить html из iframe
если src обращается к другому сайту

document.getElementById("имя iframe").contentWindow.document.body.innerHTML
такое не сработает
Error: uncaught exception: Permission denied to get property HTMLDocument.body

так что только через сервер
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34812755
Ghirik
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
авторdocument.getElementById("имя iframe").contentWindow.document.body.innerHTML
такое не сработает

Да, у меня пока то же не получается.
Задал Здесь вопрос, может кто подскажет.
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34812905
Ghirik
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Подумалось....
Эти новости точно из RSS каналов!!! Попробуйте поискать источник по содержимому новостей. Только желательно по старым новостям, чтобы поисковики успели проиндексировать.
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34813178
SuSa
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Всем спасибо за участие. Документ действительно заработал на другом компе, на своем скоко я с настройками не воевал не получилось. ну неважно.
у меня вот вопрос, вот этот самый документ с http://pif.investfunds.ru/news/ аналогично как с гуглом работать отказался. В чем сущесвенное различие?
можно просто ответить в чем различие. скрипт уже написан, правда на другом языке :) (php), работает как надо, осталось его токо оптимизировать

Еще раз всем спасибо.
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34816208
Фотография michael R
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
я посмотрю что не так
...
Рейтинг: 0 / 0
скрипт для вытягивания новостей
    #34836821
Фотография michael R
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
SuSa

я посмотрел какая то проблема с Unicode
возможно с кодировками

по поводу получения html с сайта
можно использовать VB6 (Microsoft HTML Object)
он получает текст без проблем
и дальше можно парсить как хочешь

единственно нужно наверно сделать dll и обращаться из скриптов или asp или php....
все равно задействовать сервер
...
Рейтинг: 0 / 0
21 сообщений из 21, страница 1 из 1
Форумы / HTML, JavaScript, VBScript, CSS [игнор отключен] [закрыт для гостей] / скрипт для вытягивания новостей
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]