|
Сохранение в БД истории данных изменения цены на товары в интернет магазине.
|
|||
---|---|---|---|
#18+
fraksПосему увеличить частоту сбора может тупо не получиться - забанят. Что и возвращает нас к 22408690 Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
26.12.2021, 01:22 |
|
Сохранение в БД истории данных изменения цены на товары в интернет магазине.
|
|||
---|---|---|---|
#18+
Dimitry Sibiryakov fraksПосему увеличить частоту сбора может тупо не получиться - забанят. Что и возвращает нас к 22408690 Как это нарушает авторские права мне непонятно. Интернет-магазин - публичное пространство, кто угодно может смотреть там инфу. А вот попросить дать инфу у владельца сайта - вполне может прокатить. Если у них есть разработчики или внятная техподдержка. Доступа к БД конечно не дадут, но выгрузку вполне могут дать, что бы им сайт не дрючили парсером :) ... |
|||
:
Нравится:
Не нравится:
|
|||
26.12.2021, 01:42 |
|
Сохранение в БД истории данных изменения цены на товары в интернет магазине.
|
|||
---|---|---|---|
#18+
fraks Доступа к БД конечно не дадут, но выгрузку вполне могут дать, что бы им сайт не дрючили парсером :) Лучше дать доступы к зеркалу исторических данных. Хоть в CSV, хоть в JSON. Это всяко лучше чем роботы будут дрючить html с пагинацией на 100500 страниц с дизайном. Вот лет 15 назад была такая практика что например университеты имели свои сайты типа www.univercity.org и такие-же публичные ftp ресурсы в домене типа ftp.univer.org. Всё открыто для анонимоса. Заходи. Качай хоть закачайся. Научные работы кафедры. Всякое файло-барахло. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.12.2021, 01:51 |
|
Сохранение в БД истории данных изменения цены на товары в интернет магазине.
|
|||
---|---|---|---|
#18+
mayton, Тут у всех позиция разная. В большинстве случаев никто, ничего просто так = бесплатно не даст (тем более исторические данные). Более умные предоставляют api с минимум информации (только та, что и так на сайте оф. открыта, а не, которую удалось выудить через "кривой запрос"). На api также будет ограничение, но работать будет удобнее, но без "вкусняшек". Тоесть только для того чтобы разгрузить сайт поставщику. В большинстве ставят защиты, чтобы scraping стал невыгодным . Proxy стоят денег, как и работа + меняют артикулы или их формат, описание, в прежние "теги" подставляют фейковые данные (сразу и не поймешь, что тебя дурят, допустим просто мешают артикулы), вводят персональные, фантомные скидки и.т.д., что ручками замучаешься всё перемапливать и вычищать, чтобы сохранить историчность. Пара таких "финтов" и в БД будет помойка, которую разбирать только нейросетями. В конкурентной среде, где торгуют одним и тем же Г. все методы хороши, в том числе доходит даже до пром. шпионажа. При 15000 в месяц (180000/год) вообще не ясно зачем автору БД. Excel поддерживает 1048576 строк. Сделать годовую ротацию и сохранять, как csv файлик, крутить сразу можно в памяти в Excel PowerQuery или аналогичном туле. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.12.2021, 03:13 |
|
Сохранение в БД истории данных изменения цены на товары в интернет магазине.
|
|||
---|---|---|---|
#18+
Как-то давным-давно, сайт конторы в которой я работал, точно так же дрючили парсером. Причем там было хуже, они каждую минуту все позиции пробегали. Додрючили до того, что вроде бы наши достучались до них первыми и предложили забирать напрямую XML, который у нас использовался внутри, для тех же нужд. Я к чему, можно конечно парсить, но лучше спросить, нет ли у них данных в формате данных, а не отображения. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.12.2021, 17:01 |
|
Сохранение в БД истории данных изменения цены на товары в интернет магазине.
|
|||
---|---|---|---|
#18+
Bsplesk Сырые данные могут занимать много места, а это затраты на их хранение. Тут мы входящих не знаем. Нефункциональные требования автор не озвучивал. Может у него под БД древняя карта памяти на 256М, а может собственный ЦОД. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.12.2021, 17:40 |
|
Сохранение в БД истории данных изменения цены на товары в интернет магазине.
|
|||
---|---|---|---|
#18+
три страницы споров ни о чем... shantiom Как правильно организовать хранение в БД истории изменения цен на товары в интернет магазине. То есть, собираю данные с сайта интернет-магазина, сбор 2-3 раза в неделю. Товаров несколько тысяч. У автора нет проблем со сбором информации... СОБИРАЮ - значит уже собираю и нет смысла тарахтеть попами в эту сторону... Автор мля, сохрани уже хоть как-то и через месяц поймешь чего тебе не хватает или на это укажет заказчик... ... |
|||
:
Нравится:
Не нравится:
|
|||
26.12.2021, 19:58 |
|
|
start [/forum/topic.php?fid=32&startmsg=40123096&tid=1539765]: |
0ms |
get settings: |
27ms |
get forum list: |
16ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
47ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
218ms |
get tp. blocked users: |
2ms |
others: | 361ms |
total: | 694ms |
0 / 0 |