Hadoop architecture / NoSQL, Big Data

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Hadoop architecture

6 сообщений из 6, страница 1 из 1

Hadoop architecture

#38992628

navio

Участник

Сообщения: 26

Рейтинг: 0 / 0

Коллеги эксперты, я новичек в хадуп

Подскажите пожалуйста по устройству хадупа:

Скажем есть n нод:

Node1
Map over Node1 data partitions

Node2
Map over Node2 data partitions

Node3
Map over Node3 data partitions

Node4
Map over Node4 data partitions

Далее допустим нам нужна сортировка
Как будет работать хадуп ?

Будет ли осуществлен переброс данных с ноду на ноду ?

Спасибо.

...

Рейтинг:

0 / 0

25.06.2015, 13:53

| Ответить | Цитировать | Написать

Hadoop architecture

#38992700

Alexey Tomin

Участник

Откуда: Самара

Сообщения: 1 715

Рейтинг: 0 / 0

navioДалее допустим нам нужна сортировка
Как будет работать хадуп ?

Что значит "нам нужна сортировка"? Что запускается? Откуда? Запрос из hive, или просто код через hadoop jar ...?

...

Рейтинг:

0 / 0

25.06.2015, 14:24

| Ответить | Цитировать | Написать

Hadoop architecture

#38992726

navio

Участник

Сообщения: 26

Рейтинг: 0 / 0

Запрос через Apache TEZ

хотим выполнить флоу с группировкой и сортировкой

Допустим есть 10 физических машин

Как хадуп будет получать данные с одной машины на другую ?

...

Рейтинг:

0 / 0

25.06.2015, 14:33

| Ответить | Цитировать | Написать

Hadoop architecture

#38995184

haXbat

Участник

Сообщения: 398

Рейтинг: 0 / 0

navioЗапрос через Apache TEZ

хотим выполнить флоу с группировкой и сортировкой

Допустим есть 10 физических машин

Как хадуп будет получать данные с одной машины на другую ?

У тебя есть файл с данными myfile.log. При записи в HDFS он разбивается на множество блоков, которые Name Node распределяет по разным нодам. Более того, чтобы данные не потерялись в случае выхода из строя оборудования, происходит репликация всех блоков (тройная по умолчанию).
В TEZ ты создаешь табличку, в основе которой лежит файл myfile.log. Когда в SQL движке пишешь запросик, он превращается в map-reduce job. Name Node копирует map job на те ноды где, есть блоки файла myfile.log. Каждая нода в параллели обрабатывает свой кусок данных. Затем результаты передаются на одну из нод, где и просходит reduce job - т.е. получение финального результата, который возвращается клиенту.

...

Рейтинг:

0 / 0

29.06.2015, 16:31

| Ответить | Цитировать | Написать

Hadoop architecture

#38995197

Alexey Tomin

Участник

Откуда: Самара

Сообщения: 1 715

Рейтинг: 0 / 0

haXbatЗатем результаты передаются на одну из нод, где и просходит reduce job - т.е. получение финального результата, который возвращается клиенту.

Не всегда на одну. Вполне возможно, что редьюс будет идти на тех же 10 нодах.
По мере работы map выбираются ноды для группировки- где-то на 85% map начинается вычисление и передача результатов (и начинает щёлкать счётчик reduce).
Когда map завершён- данные окончательно передаются на нужные ноды и запускается собственно reduce. Это может быть, даже если нужно одно значение (результат потом окончательно просуммируется на одной ноде), а уж если group - то точно будет на нескольких работать.

...

Рейтинг:

0 / 0

29.06.2015, 16:54

| Ответить | Цитировать | Написать

Hadoop architecture

#38995462

navio

Участник

Сообщения: 26

Рейтинг: 0 / 0

А как работает Хадуп если нужна группировка данных через Tez

Когда данные на одной ноде должны быть учтены с другой ноды ?

...

Рейтинг:

0 / 0

29.06.2015, 23:56

| Ответить | Цитировать | Написать

6 сообщений из 6, страница 1 из 1

Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Hadoop architecture

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=48&fpage=8&tid=1856817]:	0ms
get settings:	10ms
get forum list:	14ms
check forum access:	3ms
check topic access:	3ms
track hit:	49ms
get topic data:	13ms
get forum data:	3ms
get page messages:	48ms
get tp. blocked users:	2ms
others:	13ms

total:	158ms