Новые сообщения [новые:0]
Дайджест
Горячие темы
Избранное [новые:0]
Форумы
Пользователи
Статистика
Статистика нагрузки
Мод. лог
Поиск
|
27.06.2019, 18:50
|
|||
---|---|---|---|
Организация системы для загрузки содержимого веб сайтов |
|||
#18+
Привет всем! Подскажите путь джедаю: Условие задачи: "Организовать систему для загрузки содержимого веб сайтов. На входе списки урлов, на выходе - их содержимое. Система должна быть распределенной, масштабируемой. Для заданного списка доменов необходимо организовать ограничение по количеству загрузок в секунду чтобы избежать блокировок нашего сервиса с их стороны." Прошу написать, как Вы будете решать эту задачу. Нам не требуется само решение. Нас интересует путь решения с подробностями, если такое возможно. Платформа - любой Линукс сервер. ============================================================================================================ "О, сколько нам открытий чудных готовит просвещения дух, и опыт - сын ошибок трудных, и гений - парадоксов друг, и случай - бог изобретатель" (Пушкин, однако). ... |
|||
:
Нравится:
Не нравится:
|
|||
|
27.06.2019, 19:08
|
|||
---|---|---|---|
|
|||
Организация системы для загрузки содержимого веб сайтов |
|||
#18+
apt-get install curl далее скрипт-однострочник. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
|
27.06.2019, 19:21
|
|||
---|---|---|---|
Организация системы для загрузки содержимого веб сайтов |
|||
#18+
Dimitry Sibiryakov, А что-нибудь можете сказать про parser.ru студии Лебедева? ... |
|||
:
Нравится:
Не нравится:
|
|||
|
27.06.2019, 19:47
|
|||
---|---|---|---|
Организация системы для загрузки содержимого веб сайтов |
|||
#18+
А как сделать систему распределённой и масштабируемой, если пользоваться curl? ... |
|||
:
Нравится:
Не нравится:
|
|||
|
27.06.2019, 20:11
|
|||
---|---|---|---|
|
|||
Организация системы для загрузки содержимого веб сайтов |
|||
#18+
Делением и распределением кусков файла с заданиями. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
|
27.06.2019, 20:13
|
|||
---|---|---|---|
|
|||
Организация системы для загрузки содержимого веб сайтов |
|||
#18+
man split Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
|
27.06.2019, 20:26
|
|||
---|---|---|---|
Организация системы для загрузки содержимого веб сайтов |
|||
#18+
Dimitry SibiryakovДелением и распределением кусков файла с заданиями.а дя этих целей можно MapReduce на хадупе заюзать ... |
|||
:
Нравится:
Не нравится:
|
|||
|
27.06.2019, 20:30
|
|||
---|---|---|---|
Организация системы для загрузки содержимого веб сайтов |
|||
#18+
bga83, А если средствами системы по максимальной возможности, то как лучше это организовать? ... |
|||
:
Нравится:
Не нравится:
|
|||
|
|
start [/forum/topic.php?fid=25&mobile=1&tid=1481150]: |
0ms |
get settings: |
9ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
31ms |
get topic data: |
12ms |
get forum data: |
2ms |
get page messages: |
45ms |
get tp. blocked users: |
1ms |
others: | 260ms |
total: | 381ms |
0 / 0 |