Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Обоснование методологии получения данных с сайтов / 12 сообщений из 12, страница 1 из 1
04.01.2016, 11:08
    #39141878
baza906
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Обоснование методологии получения данных с сайтов
Добрый день!
Есть у кого - либо мысли по поводу того, бывают ли ситуации, когда не стоит использовать парсинг сайтов средствами языков веб-программирования (python или php), а следует попытаться договориться с владельцами данных о предоставлении данных в формате csv или xml? При том, что речь не идет о пользовательской активности на сайтах, а только об анализе его содержимого.
Возможно, есть какие то еще варианты?
...
Рейтинг: 0 / 0
04.01.2016, 20:15
    #39142115
Бредятина
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Обоснование методологии получения данных с сайтов
baza906,
Нужно определиться, что такое "сайт". Статические страницы? Интерфейс к базе данных?
Что парсить?
...
Рейтинг: 0 / 0
04.01.2016, 20:19
    #39142116
t0lix
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Обоснование методологии получения данных с сайтов
baza906бывают ли ситуации, когда не стоит использовать парсинг сайтов средствами языков веб-программирования (python или php), а следует попытаться договориться с владельцами данных о предоставлении данных в формате csv или xml?
бывают
например, когда ты тянешь инфу, а там админ смотрит на трафик, и банит твой айпи, в подозрении на ddos
...
Рейтинг: 0 / 0
04.01.2016, 21:12
    #39142133
Злой Бобр
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Обоснование методологии получения данных с сайтов
baza906,

Бывают. И если есть возможность то стоит всегда договариваться, даже если можно парсить.
...
Рейтинг: 0 / 0
05.01.2016, 11:59
    #39142309
mad_nazgul
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Обоснование методологии получения данных с сайтов
baza906Добрый день!
Есть у кого - либо мысли по поводу того, бывают ли ситуации, когда не стоит использовать парсинг сайтов средствами языков веб-программирования (python или php), а следует попытаться договориться с владельцами данных о предоставлении данных в формате csv или xml? При том, что речь не идет о пользовательской активности на сайтах, а только об анализе его содержимого.
Возможно, есть какие то еще варианты?

Лучше договориться, ибо ваша активность и есть DDOS ;-)
...
Рейтинг: 0 / 0
06.01.2016, 10:35
    #39142623
skyANA
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Обоснование методологии получения данных с сайтов
baza906,

обоснования кому надо предоставить, руководству?
...
Рейтинг: 0 / 0
07.01.2016, 12:47
    #39142995
baza906
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Обоснование методологии получения данных с сайтов
Бредятина, статические страницы. Просто получение цифр из нужного участка html-кода
...
Рейтинг: 0 / 0
07.01.2016, 12:50
    #39142997
baza906
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Обоснование методологии получения данных с сайтов
skyANA, пока себе. Планирую сделать сделать парсинг нескольких сайтов в тестовом режиме, а потом уже думать о применении к конкретной задаче, которая имеется.
...
Рейтинг: 0 / 0
07.01.2016, 12:53
    #39142998
baza906
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Обоснование методологии получения данных с сайтов
mad_nazgul, спасибо
...
Рейтинг: 0 / 0
07.01.2016, 12:53
    #39142999
baza906
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Обоснование методологии получения данных с сайтов
t0lix, спасибо
...
Рейтинг: 0 / 0
07.01.2016, 12:54
    #39143000
baza906
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Обоснование методологии получения данных с сайтов
Злой Бобр, спасибо большое.
...
Рейтинг: 0 / 0
08.01.2016, 17:57
    #39143470
Бредятина
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Обоснование методологии получения данных с сайтов
baza906Бредятина, статические страницы. Просто получение цифр из нужного участка html-кода
На статических страницах не может быть никаких цифр. Как, впрочем, и букв. Если они там оказались из-за ошибки разработчиков, то, конечно, придется договариваться)) Или, наоборот, нет смысла договариваться))
...
Рейтинг: 0 / 0
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Обоснование методологии получения данных с сайтов / 12 сообщений из 12, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]