Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Програмно считать схожую инфу с череды сайтов
|
|||
|---|---|---|---|
|
#18+
Вообщем схема такова..... Есть сайт, в нем несколько элементов div название класса которых одинаково и известно. В каждом из этих div есть единственный абзац <a></a>, текст которого надо получить. Проблема в том что на сайте множество страниц и пробегатся по каждой вручную нет ни сил ни желания. Список адресов всех страниц есть - надо только пробежаться по ним и вытянуть из каждой то что я обозначил. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.05.2013, 16:12 |
|
||
|
Програмно считать схожую инфу с череды сайтов
|
|||
|---|---|---|---|
|
#18+
обратитесь к разработчикам того сайта, возможно, у них уже реализован внешний интерфейс "для партнеров", который эти данные уже предоставляет, и надо только договориться чтобы одним из этих самых партнеров стать... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.05.2013, 16:21 |
|
||
|
Програмно считать схожую инфу с череды сайтов
|
|||
|---|---|---|---|
|
#18+
Ну если бы на сайте были хоть какие-то данные о разработчике, или о компании то да. Также, отсутствие различных рекламных баннеров и соотвествующих к ним ссылок типа "заходите к нашим друзьям" дает понять, что сайт сделан не для "партнеров", не предоставляет веб-сервисов, и не сделан в качестве визитки. Он вообще очень прост - регистрация, немного настроек профиля типа цветовой гаммы и все. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.05.2013, 16:38 |
|
||
|
Програмно считать схожую инфу с череды сайтов
|
|||
|---|---|---|---|
|
#18+
К примеру, нужна идея для програмки которая пробегается по забитым в параметры адресам сайтов и сливает их HTML-исходники ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.05.2013, 16:48 |
|
||
|
Програмно считать схожую инфу с череды сайтов
|
|||
|---|---|---|---|
|
#18+
sanekoffice, отвратительная идея, это раз при чем тут ASP.NET? это два сайты можно тащить с помощью утилиты wget и парсить на C# http://habrahabr.ru/post/112325/ ASP.NET тут ни каким боком. готовую утилиту, которая тащит нужные именно вам данные вы не найдете, ну и никто вам её просто так не напишет. берите любую либу, которая ест html и вперед... но идея плохая, куда лучше получить данные легально, как порекомендовал Паганель а то это на воровство смахивает, знаете чем это может грозить. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.05.2013, 16:56 |
|
||
|
Програмно считать схожую инфу с череды сайтов
|
|||
|---|---|---|---|
|
#18+
Ну по-пунктам.... 1) Невижу ничего плохого в том чтобы брать информацию которая уже общедоступна. 2)Asp.Net может и не к месту но я не представлюю себе форума на котором эта тема была бы к месту. 3) Как порекомендовал Пангель я бы сделал да нет вариантов - причину я уже написал. 4) Готовую утулиту я не просил. Я просил идею для получения HTML-кода. Все остольное я конечно сделаю сам ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.05.2013, 17:03 |
|
||
|
Програмно считать схожую инфу с череды сайтов
|
|||
|---|---|---|---|
|
#18+
и подчеркну что получение HTML-кода в данном случае лишь упрощает добычу текста который на сайте выложен. Инфа не секретная и подлежит огласке кем угодно и когда угодно...она включает только имена и фамилии людей которые их не скрывают, они на них зарабатывают. Так что вся моя деятельность есть ничто иное как автоматизация действия "копировать-вставить". Я же ни китаец в конце-концов: взяли тачку, заменили бампер с названием и сказали что машина ими придумана... За совет спасибо. щас буду смотреть ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.05.2013, 17:56 |
|
||
|
Програмно считать схожую инфу с череды сайтов
|
|||
|---|---|---|---|
|
#18+
Код: c# 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. Парсилку можно сделать на регулярных выражениях, или есть либа (помоему встроеная в нет! ;) - которая парсит дом-модель! Удачи!!! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.05.2013, 18:25 |
|
||
|
Програмно считать схожую инфу с череды сайтов
|
|||
|---|---|---|---|
|
#18+
... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.05.2013, 19:21 |
|
||
|
Програмно считать схожую инфу с череды сайтов
|
|||
|---|---|---|---|
|
#18+
sanekoffice, что-то задача стянуть что-то одинаковое с сайтов возникает все время. вот есть утилита для решения таких задач. утилита для закачки данных если будут вопросы о том как настраивать - пиши комментарии, я подскажу. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.05.2013, 20:53 |
|
||
|
|

start [/forum/topic.php?fid=18&msg=38248189&tid=1358470]: |
0ms |
get settings: |
8ms |
get forum list: |
11ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
43ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
41ms |
get tp. blocked users: |
1ms |
| others: | 208ms |
| total: | 329ms |

| 0 / 0 |
