powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / map reduce в масштабе все организации
7 сообщений из 7, страница 1 из 1
map reduce в масштабе все организации
    #39996965
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вопрос в порядке бреда )
Почему-то, когда наши компании внедряют всякие big data и open source-технологии, то обычно это делается на брендованном оборудовании за много-много миллионов. Почему не делают, например, как на рисунке?

Смысл в том, чтобы размазать все данные по контейнерам на простых пользовательских машинах, вес которых (для примера) будет определятся по скорости обработки данных. И чем больше вес, тем больше данных туда можно положить/обработать. Распределение данных пусть будет с избыточностью на случай, если часть машин будет отключена по каким-то причинам. Если же будет отключено много машин - расчет сделают map-элементы на схеме (часть неотключаемого ядра).


При этом и у нас, и в мире много организаций, где парк ПК составляет несколько десятков тысяч машин... Вкусно же!
И самый главный плюс - самоапгрейдящиеся вычислительные элементы

ps а может так уже у кого-то реализовано? если да, то поделитесь инфой
...
Рейтинг: 0 / 0
map reduce в масштабе все организации
    #39996986
H5N1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Критик,

так и встает перед глазами эта эпичная картина - три дня считал скоринг, который можно было за 20 минут посчитать, но поскольку клиенты сидят на еле живом wi-fi, постоянно перегружаются расчет занял 3 дня. всего то на 60 часов позже чем позволяет SLA. но данные блин пропали - на третий день сократили один из отделов и вот ведь непруха, данные легли именно на тот злаполучный.
...
Рейтинг: 0 / 0
map reduce в масштабе все организации
    #39996999
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
H5N1,

Ну что значит "постоянно перегружаются"? Обмен между клиентскими нодами можно построить на чем-то наподобие внутреннего торрент-трекера, будет весьма быстро.

И вопрос с распределением данных вполне можно решить.

Если же такая неприятность все же случилась, то ваш скоринг просто посчитается на map-узлах за те же условные 20 минут, вместо 20 секунд на клиентских нодах.
...
Рейтинг: 0 / 0
map reduce в масштабе все организации
    #39997020
H5N1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Критик

Ну что значит "постоянно перегружаются"? Обмен между клиентскими нодами можно построить на чем-то наподобие внутреннего торрент-трекера, будет весьма быстро.

какая разница что там за протокол поверх wi-fi на соплях ? ну и классический мап-редюс это процессинг запускается на том узле, где данные. ярн смотрит что нода не отвечает, перезапускает задачу маппера или редюсера заново, на ноде, где есть нужные блоки.

Критик

И вопрос с распределением данных вполне можно решить.

можно, но имхо это уже ближе к облакам. компьют нода на ноутбука вытягивает по wi-fi откуда-то данные и начинает считать, но тут чувак пошел на обед и опустил крышку, комп ушел в хибернейт ...

Критик

Если же такая неприятность все же случилась, то ваш скоринг просто посчитается на map-узлах за те же условные 20 минут, вместо 20 секунд на клиентских нодах.

а зачем ? пока там клиенты гоняли по wi-fi эти гигабайты и ярн рестартовал задачи, клиентский комп намотал шифровальщика и часть вычислений превратил уже в кашу.
мне кажется индустрия уже что-то такое проходило во времена foxpro. помню старперы вечно бегали по этажам пытаясь понять у кого вирус и кто дописывает мусор в конец dbf файликов.
...
Рейтинг: 0 / 0
map reduce в масштабе все организации
    #39997161
L_argo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Смысл в том, чтобы размазать все данные по контейнерам на простых пользовательских машинахДоступность и сетевая производительность каждого контейнера будет под большим вопросом. А также администрирование.

По сабжу: качество бреда отменное. Плюсую...
...
Рейтинг: 0 / 0
map reduce в масштабе все организации
    #39997399
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
L_argo,

Сетевые сбои крайне редки, а если все же происходят, то не будет работать не только то, что нарисовано на картинке, но и все другие системы. Также уже не редки 10-гигабитные сетки. Вопросы доступности узлов решаются многократной избыточностью и неотключаемым ядром.

Производительность тоже вопрос решаемый, скажем, выделить каждому контейнеру сколько-то Гб ОЗУ, CPU с самым низким приоритетом и свой nvme-диск. Ведь не секрет, что 95% времени обычные офисные машины просто простаивают и уж точно не утилизируют полностью ресурсы процессора.

Почему вообще такая идея возникла - сейчас все идут в сторону удешевления, в том числе и в плане перехода на на дешёвое потребительское оборудование в датацентрах. Так почему бы не сделать нечто вроде SETI@home или ее аналогов для больших корпораций?
...
Рейтинг: 0 / 0
map reduce в масштабе все организации
    #39997404
.Евгений
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Критик
нечто вроде SETI@home или ее аналогов
Архитектура подобных распределенных вычислений намного проще и представляет собой несколько очередей заданий и результатов между сервером и клиентами. Нет никаких весов, размазываний, распределений и сборок.
...
Рейтинг: 0 / 0
7 сообщений из 7, страница 1 из 1
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / map reduce в масштабе все организации
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]