Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.? / NoSQL, Big Data

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

75 сообщений из 75, показаны все 3 страниц

все

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38664352

Игорь Бобак

Гость

В интернете материалов по Big Data я вижу очень много.
И даже есть готовые виртуальные машины.

Вопрос в том, какие из них самые качественные для самообучения с нуля?
Кто уже прошел этот путь - можете поделиться, с чего новичкам начинать обучение?

...

Рейтинг:

0 / 0

07.06.2014, 11:39

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38664362

Jack Carver

Участник

Откуда: obi2ru.blogspot.com

Сообщения: 1 632

Рейтинг: 0 / 0

Если нужны книги, то советую эти:
1. Hadoop: The Definitive Guide, 3rd Edition ( pdf )
2. Programming Hive ( pdf )
3. Programming Pig ( pdf )
4. Apache Sqoop Cookbook ( pdf )

...

Рейтинг:

0 / 0

07.06.2014, 12:12

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38664365

Jack Carver

Участник

Откуда: obi2ru.blogspot.com

Сообщения: 1 632

Рейтинг: 0 / 0

Оговорюсь, эти книги хороши для начала.
Потом все равно нужно читать мануалы с домашних страниц проектов Hadoop, Cloudera (Cloudera Manager), Hive, Pig, Sqoop, HBase, Mahout... тема BigData стремительно развивается, книги очень быстро устаревают.

...

Рейтинг:

0 / 0

07.06.2014, 12:17

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38664368

Игорь Бобак

Гость

По книгам понятно. Спасибо.

А на счет виртуалок готовых: есть ли где-то готовая с нормальными примерами?

Вот например, если бы меня кто-либо попросил "дай виртуалку с примерами с Micrsosoft OLAP, Analysis Services, и хорошими готовыми базами данных на не", то я бы посоветовал вот эту
http://clinthuijbers.wordpress.com/2012/05/23/new-sql-server-2012-rtm-fully-integrated-demo-hyper-v/

Есть ли аналогичная с примерами данных, только с big data-фаршем?

...

Рейтинг:

0 / 0

07.06.2014, 12:33

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38664374

Jack Carver

Участник

Откуда: obi2ru.blogspot.com

Сообщения: 1 632

Рейтинг: 0 / 0

Cloudera QuickStart VM
Oracle Big Data Lite VM

...

Рейтинг:

0 / 0

07.06.2014, 13:10

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38664421

smikesh

Участник

Сообщения: 469

Рейтинг: 0 / 0

Игорь Бобак,

практически все коммерческие дистрибьюторы предоставляют
есть и клаудера, и хортонворкс и мапр

я бы рекомендовал посмотреть на Mapr более внимательно, с их дистирбуцией можно и на амазон еластик мап редьюс.

еще интересная связка это apache shark-spark-tachyon

hive сам по себе уже давно потерял актуальность, сейчас нужно смотреть либо на impala, shark or tez :)) причем для каждого нужно использовать свой формат хранения данных :)

...

Рейтинг:

0 / 0

07.06.2014, 17:24

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38664470

IT-Shaman

Гость

Игорь Бобак,
есть отличный ресурс от IBM с виртуалками и курсами - http://bigdatauniversity.com/

...

Рейтинг:

0 / 0

07.06.2014, 21:34

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38664597

Дедушка

Участник

Откуда: Город трёх революций

Сообщения: 4 572

Рейтинг: 0 / 0

smikeshhive сам по себе уже давно потерял актуальность, сейчас нужно смотреть либо на impala, shark or tezчто, правда...? :)) а мужики то и не знают.
это из разряда "какая субд лучше, от оракла или от майкрософт" - тож самое вид с боку.

Игорь, смотрите вот это:
Hortonworks Sandbox

...

Рейтинг:

0 / 0

08.06.2014, 13:05

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38664691

smikesh

Участник

Сообщения: 469

Рейтинг: 0 / 0

Дедушкачто, правда...? :)) а мужики то и не знают.
не выпендривались бы лучше, вот допилят тез, хайв снова станет актуальным
кстати именно его ваш любимый хортонворкс и пытается пилить, правда пока не особо успешно ((
Дедушкаэто из разряда "какая субд лучше, от орала или от майкрософт" - тож самое вид с боку.
это из разряда что лучше, in-memory или как раньше на диске :))
здесь есть некоторая разница в отличии от орала и мелкософта :))

...

Рейтинг:

0 / 0

08.06.2014, 18:28

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38666914

Игорь Бобак

Гость

Начал разбираться по видео с Cloudera.
Не очень у них удобная навигация по сайту, зато видео - то, что надо.

Параллельно пытался на ютубе найти нормальные use cases, и вот проблемка - а их почти нет...
Ну по крайней мере, мне не попались.

То есть, хочу увидеть видео, в котором было бы вот так:

"стояла задача сделать анализ продаж/покупателей/маркетинговых кампаний/чего угодно.
работает такая-то ERP, которая собирает данные. Данных - несколько десятков терабайт за 10 лет.

сделали такую-то модель хранилища данных на hadoop, для этого задействовали
такое-то железо, поставили или разработали такое-то средство визуализации, и вот сейчас покажем
как работают отчеты. вот давайте откроем отчет по .... и посмотрим - видите, отрабатывает за 10 секунд.
из результата делаем вывод, что такой-то регион где-то позади. роем вглубь в этот регион, смотрим
продажи по каналам. видим, что там такая-то проблема. роем дальше. ... и т.д. - пока не поняли в чем проблема".

Пока что попадаются видео, в которых показано как круто уметь писать SQL запросы на Hive или же
на java писать mapreduce-код, как круто запускать из консоли компиляцию этого всего добра, пропихивать куда-то
на сервер и т.д.

Да, это все круто. Но это - для меня (то есть, для технаря).
А вот если бы я хотел заказчику показать use case - все, облом.

Может кто-нибудь знает ссылки на демонстрации в подобном стиле - то есть "показываем как мы решали конкретную задачу" ?

...

Рейтинг:

0 / 0

10.06.2014, 21:29

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38666916

babona

Участник

Откуда: Батуринск

Сообщения: 1 205

Рейтинг: 0 / 0

От сегодня снова был на переговорах в крупной федеральной конторе, с IT-руководством.
Ни ODS ни DWH толком не сделали, а про БигДату, ESB рассуждают
Oracle, PWC, надо понимать, уже не модно

...

Рейтинг:

0 / 0

10.06.2014, 21:38

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38666923

Игорь Бобак

Гость

Люди не понимают, что big data - это тот же data warehouse, только distributed.

Hadoop + Hive - это тот же движок SQL запросов (типа оракла или mssql), только недоделанный (цитирую слова одного опытного человека, с коротым разговаривал сегодня) и который тоже distributed.

И если они еще не делали простой data warehouse, то почему они думают, что distributed dw им будет сделать легко и от этого будет мгновенное счастье?

...

Рейтинг:

0 / 0

10.06.2014, 21:50

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38667960

Дедушка

Участник

Откуда: Город трёх революций

Сообщения: 4 572

Рейтинг: 0 / 0

Игорь Бобак работает такая-то ERP, которая собирает данные. Данных - несколько десятков терабайт за 10 лет. имхо, hadoop тут вообще ни при чём.

...

Рейтинг:

0 / 0

11.06.2014, 17:40

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38668187

Apex

Участник

Откуда: Made in USSR

Сообщения: 3 841

Рейтинг: 0 / 0

smikeshИгорь Бобак,

практически все коммерческие дистрибьюторы предоставляют
есть и клаудера, и хортонворкс и мапр

я бы рекомендовал посмотреть на Mapr более внимательно, с их дистирбуцией можно и на амазон еластик мап редьюс.

еще интересная связка это apache shark-spark-tachyon

hive сам по себе уже давно потерял актуальность, сейчас нужно смотреть либо на impala, shark or tez :)) причем для каждого нужно использовать свой формат хранения данных :)
Не в защиту Hive, который для меня убогое поделие индусских студентов из Мордокниги, но tez'у его противопоставлять нельзя. Это как противопоставлять двигатель автомобилю.

...

Рейтинг:

0 / 0

11.06.2014, 22:47

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38668191

Apex

Участник

Откуда: Made in USSR

Сообщения: 3 841

Рейтинг: 0 / 0

Игорь БобакЛюди не понимают, что big data

Люди не понимают, что big data - это такой модный слоган, который позволяет увеличить продажи, поэтому его лепят и куда надо и куда не надо.

Игорь Бобакэто тот же data warehouse, только distributed.
Big Data - это big data, data warehouse - это data warehouse, а distributed - это distributed.

...

Рейтинг:

0 / 0

11.06.2014, 22:55

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38668198

Apex

Участник

Откуда: Made in USSR

Сообщения: 3 841

Рейтинг: 0 / 0

Игорь БобакHadoop + Hive - это тот же движок SQL запросов (типа оракла или mssql), только недоделанный (цитирую слова одного опытного человека, с коротым разговаривал сегодня) и который тоже distributed.

Hadoop - это движек (среда) выполнения MapReduce, Hive - это транслятор SQL в MapReduce код.

Игорь БобакИ если они еще не делали простой data warehouse, то почему они думают, что distributed dw им будет сделать легко и от этого будет мгновенное счастье?
Вы бы порядок в голове по этому вопросу навели сначала, а потом рассуждали.

...

Рейтинг:

0 / 0

11.06.2014, 23:07

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38668245

Игорь Бобак

Гость

ApexВы бы порядок в голове по этому вопросу навели сначала, а потом рассуждали.
Не совсем понимаю, к чему эти оскорбления.

От моего первого поста до последнего успел пересмотреть кучу видеоуроков и прочитать много материала. И если посмотреть на схему (см. ниже), то hadoop - это ничто иное, как хранилище данных, разложенное по частям на много узлов.

Или я может не тот термин использовал? Если это так, то можно и культурно меня поправить, а не давать грубые оценки о порядке в голове.

...

Рейтинг:

0 / 0

12.06.2014, 00:55

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38668318

Apex

Участник

Откуда: Made in USSR

Сообщения: 3 841

Рейтинг: 0 / 0

Игорь БобакНе совсем понимаю, к чему эти оскорбления.

Да упаси боже, когда я оскорбляю кого-то, я обычно матом пишу. А так скорее язвительный (да, это признаю) совет и одновременно намек капнуть глубже.

Игорь БобакОт моего первого поста до последнего успел пересмотреть кучу видеоуроков и прочитать много материала. И если посмотреть на схему (см. ниже), то hadoop - это ничто иное, как хранилище данных, разложенное по частям на много узлов.

Или я может не тот термин использовал? Если это так, то можно и культурно меня поправить, а не давать грубые оценки о порядке в голове.

Ну, наверное и в термине тоже, фраза "хранилище данных, разложенное по частям на много узлов" звучит даже с точки зрения не буковеда очень коряво. Что вы понимаете под хранилищем? СУБД на которой оно реализовано? А под распределенным хранилищем?
К тому же, вы, похоже, слишком хорошего мнения о Hadoop, он гораздо примитивнее, чем кажется на первый взгляд. Это просто фреймворк, набор библиотек для исполнения MapReduce + пара-тройка сервисов поддержки и распределенная файловая система HDFS. По большому счету все. Файлопомойка с возможностью распределенной обработки данных. Можно ли реализовать на этом хранилище? Теоретически да, даже практически можно, если задаться целью. Правда, это примерно как пытаться реализовать хранилище на файловой системе, теоретически можно, но на парктике никто не делает.

...

Рейтинг:

0 / 0

12.06.2014, 10:58

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38668378

Hunterik

Участник

Сообщения: 474

Рейтинг: 0 / 0

ApexК тому же, вы, похоже, слишком хорошего мнения о Hadoop, он гораздо примитивнее, чем кажется на первый взгляд. Это просто фреймворк, набор библиотек для исполнения MapReduce + пара-тройка сервисов поддержки и распределенная файловая система HDFS. По большому счету все. Файлопомойка с возможностью распределенной обработки данных. Можно ли реализовать на этом хранилище? Теоретически да, даже практически можно, если задаться целью. Правда, это примерно как пытаться реализовать хранилище на файловой системе, теоретически можно, но на парктике никто не делает.
"Слюшай, аполитично рассуждаешь, да!" =)))

...

Рейтинг:

0 / 0

12.06.2014, 12:32

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38668691

smikesh

Участник

Сообщения: 469

Рейтинг: 0 / 0

ApexНе в защиту Hive, который для меня убогое поделие индусских студентов из Мордокниги, но tez'у его противопоставлять нельзя. Это как противопоставлять двигатель автомобилю.

я тез хайву и не противопоставляю.

хайв это ща уже скорее стандарт, АПИ, язык и набор библиотек. И это все реализует все кому не лень, и импала, и shark-spark-tachyon и наверно много кто другой.
тез это как бы водородный двигатель для автомобиля с паровым котлом ) с этим я согласен :))

...

Рейтинг:

0 / 0

13.06.2014, 00:42

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38682463

Игорь Бобак

Гость

Наблюдаю у себя на виртуальных машинах, что виртуалка от Cloudera - быстрее.

В то же время, у Hortonworks лучшие тьюториалы и больше их в бесплатном доступе.

...

Рейтинг:

0 / 0

28.06.2014, 00:06

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38688522

Владимир Штепа

Участник

Откуда: Hannover

Сообщения: 6 037

Рейтинг: 0 / 0

Apex, полностью Вас поддерживаю.

Слоненок это распределенная файловая система для хранения неструктурированных данных.
Ее использование приходит на повестку дня, когда приблизительно возникает ситуация, данных у нас вал, они не структурированы ( логи, тексты твитов, мэйлы, чаты) или плохо структурированы или с точки зрения rdbms неудобно структурированы. (XML)

Мы не заморачиваемся их структуриванием перед сохранением (ETL экономится) а свалиевем это в кучу. Быстро и избыточно по разным компьютерам.

Для того чтобы анализировать эти данны и иметь преимущества от их распределенного хранения, выдаем задачу с распределением по нескольким узлам. То есть не тянем данные к алгоритмам, а отправляем алгоритмы к данным. Которые сначала парсят данные, а потом делают необходимые преобразования.

Для каждого аналитического запроса нужно писать свой алгоритм - это попытались формализовать через hive, получися бледный sql интерфейс для слоненка.

В классическом DWH/olap данные структурируют перед сохранением на столько подробно, на сколько это требуют бизнес пользователи, чтобы они могли получить ответы практически на любые вопросы

В Big data их структурируют на лету в процессе выполнения запроса.

поправьте или дополните меня, если я что то пропустил или заблуждаюсь

...

Рейтинг:

0 / 0

05.07.2014, 00:40

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38688526

Игорь Бобак

Гость

Владимир ШтепаВ Big data их структурируют на лету в процессе выполнения запроса.
Владимир,

а вот это структурирование не будет ли тормозить каждый раз при новом запросе?
И нет ли смысла каким-то образом все-таки поструктуризировать перед их заливкой в hadoop?

...

Рейтинг:

0 / 0

05.07.2014, 01:00

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38688549

Alexander Ryndin

Участник

Сообщения: 4 863

Рейтинг: 0 / 0

...

Рейтинг:

0 / 0

05.07.2014, 09:26

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38688562

Владимир Штепа

Участник

Откуда: Hannover

Сообщения: 6 037

Рейтинг: 0 / 0

Конечно можно но это все в ручную. Слоненок не знает ничего об устройстве хранимых в нем файлов и не умеет смотреть в их содержимое. Это могут только ваши алгоримы.
Автоматизма мало, точнее совсем нет.

...

Рейтинг:

0 / 0

05.07.2014, 10:55

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38688821

Apex

Участник

Откуда: Made in USSR

Сообщения: 3 841

Рейтинг: 0 / 0

Игорь БобакВладимир ШтепаВ Big data их структурируют на лету в процессе выполнения запроса.
Владимир,

а вот это структурирование не будет ли тормозить каждый раз при новом запросе?
И нет ли смысла каким-то образом все-таки поструктуризировать перед их заливкой в hadoop?
Даже после "структурирования" будет тормозить, хотя и не так сильно (тут все зависит от того, что и как парсим), но все же будет. Hadoop очень нерационально использует вычислительные ресурсы. Каждый mapper или reducer - это отдельный экземпляр JVM, который запускается каждый раз для каждого mapred job, вроде были какие-то работы в направлении использования потоков самой JVM, но насколько я помню оно так и не взлетело. Причем это каждый раз холодный старт. Перед Reduce step всегда должен быть Map step, даже если он не нужен, это ограничние самой вычислительной модели Map-Reduce, это то, что пробуют исправить в Tez. Обмен данными между map step и reduce step только через файловую систему. Сама HDFS живет поверх той FS, которая используется ОС на ваших серверах. Каждый блок HDFS - это просто файл на этой файловой системе. Напрямую с контроллерами оно не работает. Соответствие между блолками и файлами хранится на Name Node, в случае большого числа мелких файлов, которые меньше размера блока HDFS получите сильную нагрузку на Name Node. В общем там подводных камней очень много.
Так что мой вам совет, если ваши данные достаточно хорошо ложатся на реляционную модель и данных этих меньше полу-петабайта в сыром виде и у вас много пользователей, которые будут запускать Ad-Hoc запросы по ним, то скорее всего экономической выгоды от использования Hadoop для обработки этих данных вы не получите. Лучше взять реляционную MPP, самая примитивная и недорогая MPP реляционка подойдет для этой задачи лучше, чем связка Hadoop+Hive.

...

Рейтинг:

0 / 0

06.07.2014, 12:30

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38688823

babona

Участник

Откуда: Батуринск

Сообщения: 1 205

Рейтинг: 0 / 0

надо так понимать, что Big Data - это очередной маркетинговый ход, позволяющий вытянуть из заказчиков большую денюжку, доить их благодаря магическому слову Big. Это же Big !! Оооо, значит и денег должно стоить много. А потом окажется, что опять надо много кодить, программистов много нанимать, их кормить, чтобы получить какие-то там отчетики, посмотреть и выбросить их.

...

Рейтинг:

0 / 0

06.07.2014, 12:40

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38689014

DEVcoach

Гость

ApexДаже после "структурирования" будет тормозить, хотя и не так сильно (тут все зависит от того, что и как парсим), но все же будет. Hadoop очень нерационально использует вычислительные ресурсы. Каждый mapper или reducer - это отдельный экземпляр JVM, который запускается каждый раз для каждого mapred job, вроде были какие-то работы в направлении использования потоков самой JVM, но насколько я помню оно так и не взлетело. Причем это каждый раз холодный старт. Перед Reduce step всегда должен быть Map step, даже если он не нужен, это ограничние самой вычислительной модели Map-Reduce, это то, что пробуют исправить в Tez. Обмен данными между map step и reduce step только через файловую систему. Сама HDFS живет поверх той FS, которая используется ОС на ваших серверах. Каждый блок HDFS - это просто файл на этой файловой системе. Напрямую с контроллерами оно не работает. Соответствие между блолками и файлами хранится на Name Node, в случае большого числа мелких файлов, которые меньше размера блока HDFS получите сильную нагрузку на Name Node. В общем там подводных камней очень много.Есть такое дело. Сейчас уже выходят продукты, которые вклиниваются в API Hadoop, а сами целиком подменяют его движок своей более эффективной имплементацией.
https://ca.finance.yahoo.com/news/gridgain-brings-first-true-plug-120000856.html

...

Рейтинг:

0 / 0

06.07.2014, 23:50

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38689044

Apex

Участник

Откуда: Made in USSR

Сообщения: 3 841

Рейтинг: 0 / 0

babonaнадо так понимать, что Big Data - это очередной маркетинговый ход, позволяющий вытянуть из заказчиков большую денюжку, доить их благодаря магическому слову Big. Это же Big !! Оооо, значит и денег должно стоить много. А потом окажется, что опять надо много кодить, программистов много нанимать, их кормить, чтобы получить какие-то там отчетики, посмотреть и выбросить их.
Надо понимать, что изначально продукт писался для очень ограниченного круга задач, где хорошая масштабируемость была важнее рациональности использования вычислительных мощностей. Теперь же, да, благодаря ушлым продажникам, для которых по-сути важно лишь, сколько и чего они могут продать, а не то, поможет это рельно клиенту или нет, это превратилось в marketing buzz и теперь эту сову пытаются натянуть на каждый глобус.

...

Рейтинг:

0 / 0

07.07.2014, 07:11

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38689768

Дедушка

Участник

Откуда: Город трёх революций

Сообщения: 4 572

Рейтинг: 0 / 0

Apexесли ваши данные достаточно хорошо ложатся на реляционную модель и данных этих меньше полу-петабайта в сыром виде ... то скорее всего экономической выгоды от использования Hadoop для обработки этих данных вы не получите100500++

...

Рейтинг:

0 / 0

07.07.2014, 19:55

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38689783

babona

Участник

Откуда: Батуринск

Сообщения: 1 205

Рейтинг: 0 / 0

...

Рейтинг:

0 / 0

07.07.2014, 20:24

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38746186

Игорь Бобак

Гость

Всем советую не запускать виртуалку от Cloudera на VirtualBox - жрет весь проц, и непонятно чем занимается.
Та же виртуалка только под vmware работает отлично.

...

Рейтинг:

0 / 0

14.09.2014, 02:04

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38969065

кириллk

Участник

Сообщения: 988

Рейтинг: 0 / 0

Начал изучать Apache Spark

...

Рейтинг:

0 / 0

26.05.2015, 17:43

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38969674

GASTROPODA

Гость

Несколько слов о заблюждениях.
Hadoop это не RDBMS. У них разные подходы к информации, соответственно у каждого свои плюсы и минусы.

RDBMS - это Schema-on-Write. Т.е. вначале создаем схему, а потом данные форматируем под этот шаблон при сохранении (записи).

Hadoop - это Schema-on-Read. Т.е. вначале сохраняем ВСЕ данные в файл(ы), а потом при чтении форматируем данные по нужному шаблону и выдаем клиенту.

Т.е. Hadoop ценен когда у нас огромное количество неструктурированных данных, на которые возможно когда-то понадобится наложить какой-то фильтр и увидеть результат.

...

Рейтинг:

0 / 0

27.05.2015, 12:45

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38969683

babona

Участник

Откуда: Батуринск

Сообщения: 1 205

Рейтинг: 0 / 0

GASTROPODA,

хорошее замечание. Спасибо.

Вопрос по Hadoop: а взаимоувязку данных между собой, чистку, довосстановление - подразумеватся делать в момент чтения данных?

...

Рейтинг:

0 / 0

27.05.2015, 12:51

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38969691

Вжик

Участник

Откуда: Москва

Сообщения: 642

Рейтинг: 0 / 0

Да, для текстовых файлов лежащих в Hadoop либо пишите сложный Map - Reduce на Python например, либо обрабатываете в Spark более гибко с использованием join и агрегирований, либо кладете в "реляционные таблицы" Hive и либо через него, либо через Cloudera Impala пищите SQL подобные запросы. Либо Hadoop - это большое хранилище на которое сверху ETL указанными выше способами, результаты в реляционку или Key-Value DB и дальше продолжаете обработку.

...

Рейтинг:

0 / 0

27.05.2015, 12:56

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38969736

GASTROPODA

Гость

babonaВопрос по Hadoop: а взаимоувязку данных между собой, чистку, довосстановление - подразумеватся делать в момент чтения данных?

По классике ядро Hadoop состоит из двух кусков:

1. HDFS (Hadoop Distributed File System) - файловая система где мы храним 2,3,... n -копий наших данных. Заточен на Put/Get/Delete. Если нужны частые Insert, то видимо Hadoop не нужно выбирать.

2. MapReduce - читает ВСЕ данные и форматирует по нужному шаблону.

Все. :-)
Дальше можно навешать множество "приблуд" сверху в зависимости от своих задач.

Но важно помнить, что Hadoop для огромных и, как правило, не меняющихся данных, которые могут нам когда-то пригодиться. Инструмент для обработки таких данных (MapReduce) - это простой скрипт или Java-программа которые запускаются в парралель на тех же серверах где и лежат куски данных.

"Приблуды" коих становится все больше могут, иногда, облегчить такую обработку.

...

Рейтинг:

0 / 0

27.05.2015, 13:23

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38969744

babona

Участник

Откуда: Батуринск

Сообщения: 1 205

Рейтинг: 0 / 0

вопрос:

продвинутым пользователям экномистам, финансистам (Power Users) - adHoc выборки данных как делать?

...

Рейтинг:

0 / 0

27.05.2015, 13:29

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38969748

Вжик

Участник

Откуда: Москва

Сообщения: 642

Рейтинг: 0 / 0

Через SQL - подобные "прослойки" к Hadoop: Hive, Cloudera Impala, Spark.
Либо цепляете через эти драйвера BI систему: MicroStrategy, Tableau и другие.
+ в некоторых СУБД, в т.ч. MS SQL заявлена "прозрачность" схемы как реляционной, так и "Hadoop", т.е. единый SQL запрос к обоим движками, правда я это не щупал и как выглядит - не знаю)

...

Рейтинг:

0 / 0

27.05.2015, 13:35

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38969753

Alexander Ryndin

Участник

Сообщения: 4 863

Рейтинг: 0 / 0

babonaвопрос:

продвинутым пользователям экномистам, финансистам (Power Users) - adHoc выборки данных как делать?Этих людей к Hadoop-подобным штукам пускать нереально

...

Рейтинг:

0 / 0

27.05.2015, 13:38

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38972354

Игорь Бобак

Гость

Alexander RyndinЭтих людей к Hadoop-подобным штукам пускать нереально
А вот это мы проверим. Там я в другой ветке написал что собираюсь реализовать с помощью Mondrian + Spark SQL. Если выйдет - опубликую на блоге и тут ссылку сброшу.

...

Рейтинг:

0 / 0

30.05.2015, 13:41

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#38972526

Alexander Ryndin

Участник

Сообщения: 4 863

Рейтинг: 0 / 0

Игорь БобакAlexander RyndinЭтих людей к Hadoop-подобным штукам пускать нереально
А вот это мы проверим. Там я в другой ветке написал что собираюсь реализовать с помощью Mondrian + Spark SQL. Если выйдет - опубликую на блоге и тут ссылку сброшу.какой объём данных?

Модератор: Тема перенесена из форума "OLAP и DWH".

...

Рейтинг:

0 / 0

30.05.2015, 23:40

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39119466

кириллk

Участник

Сообщения: 988

Рейтинг: 0 / 0

...

Рейтинг:

0 / 0

03.12.2015, 14:21

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39140975

Станислав Клевцов

Участник

Откуда: Krasnodar-Russia

Сообщения: 529

Рейтинг: 0 / 0

Вот курс, который включает видео и тестовые задания:

https://stepic.org/course/Hadoop-Система-для-обработки-больших-объемов-данных-150/

...

Рейтинг:

0 / 0

31.12.2015, 08:34

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39151272

Don4anin

Участник

Сообщения: 28

Рейтинг: 0 / 0

Камрады, с самообучением все понятно, направление очень популярное и перспективное, но как перейти к практической части? как получить коммерческий опыт? стартапы? частичная занятость? участие в проекте за идею?

P.S. Сам чистый DBA, но решительно настроен запрыгнуть в этот экспресс, несущийся уже на бешеной скорости и набирающий все новые обороты

...

Рейтинг:

0 / 0

20.01.2016, 11:46

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39151878

Apex

Участник

Откуда: Made in USSR

Сообщения: 3 841

Рейтинг: 0 / 0

Alexander Ryndinbabonaвопрос:

продвинутым пользователям экномистам, финансистам (Power Users) - adHoc выборки данных как делать?Этих людей к Hadoop-подобным штукам пускать нереально
Ты наверное будешь смеяться, но так делали в Expedia, не знаю как там сейчас, но когда я там был, они реально так работали, финансисты и менеджеры реально сидели в Hue и гоняли там запросы. Вот вам и "продвинутость" ИТ в иностранных корпорациях:)

...

Рейтинг:

0 / 0

20.01.2016, 23:51

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39228410

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

Apex,

вообщем сделал следующее.
1. развернул виртуальную машину с cliudera
2. зашел http://quickstart.cloudera:8888/impala/ --- т.е это интерфейс клоудеры
3. написал запрос в импала (select count(*) as xx from sample_07) , причем не понятно sample_07 это таблица в hbase или hdfs
4. получил ответ.

все ок!

Теперь к практической стороне

Я вижу следующую задачу:
есть csv файл "F1".
его надо как то передать в hadoop (Loading data into HDFS using Hue) --- этот пункт хотелось бы сделать без доп интерфейсов
далее установить драйвер "Microsoft Hive ODBC Driver"
( https://www.microsoft.com/en-us/download/details.aspx?id=40886)

далее написать запрос
select * from openquery (Hadoop, 'select count(*) as xx from Sample_07')

...

Рейтинг:

0 / 0

02.05.2016, 15:39

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39228718

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

Driver Version: V1.1.0.0

Running connectivity tests...

Attempting connection
Failed to establish connection
SQLSTATE: HY000[Microsoft][HiveODBC] (34) Error from Hive: connect() failed: errno = 10061.

TESTS COMPLETED WITH ERROR

...

Рейтинг:

0 / 0

03.05.2016, 20:10

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39229182

mishanya3624

Участник

Сообщения: 802

Рейтинг: 0 / 0

мигель1,

Разрядность драйвера какая?
У меня на 64 все ок:

...

Рейтинг:

0 / 0

04.05.2016, 15:16

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39229308

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

mishanya3624мигель1,

Разрядность драйвера какая?
У меня на 64 все ок:

тоже 64

Но меня смущает что у Вас название базы "test" и нет поля "daa source name"
значит не cloudera, а сами разворачивали?

...

Рейтинг:

0 / 0

04.05.2016, 17:03

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39229347

mishanya3624

Участник

Сообщения: 802

Рейтинг: 0 / 0

мигель1,

Разворачивал все с нуля да.
поле data source name тоже самое , что и у меня data source , это название источника данных и всего, в этом проблемы не должно быть.

...

Рейтинг:

0 / 0

04.05.2016, 17:48

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39229350

mishanya3624

Участник

Сообщения: 802

Рейтинг: 0 / 0

Если пользовательский создать источник, та же фигня?

...

Рейтинг:

0 / 0

04.05.2016, 17:49

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39229360

mishanya3624

Участник

Сообщения: 802

Рейтинг: 0 / 0

мигель1,

p.s. у меня cloudera просто ставил не quikstart а отдельно через manager

...

Рейтинг:

0 / 0

04.05.2016, 17:57

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39230413

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

mishanya3624,

А можно поподробнее? С скачал на виртуальную машину cloudera на свой компьютер под виндой
Если я правильно понял, чтобы развернуть через manager , нужно самому развернуть виртуальную машину, скачать дистрибутивы, сделать несколько кластеров

Ничего не пропустил?

...

Рейтинг:

0 / 0

05.05.2016, 23:03

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39230421

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

мигель1,

Просто у меня всего 8 гб оперативки
Пробовал ставить horton но он вообще не загрузился

...

Рейтинг:

0 / 0

05.05.2016, 23:22

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39230861

mishanya3624

Участник

Сообщения: 802

Рейтинг: 0 / 0

мигель1mishanya3624,

А можно поподробнее? С скачал на виртуальную машину cloudera на свой компьютер под виндой
Если я правильно понял, чтобы развернуть через manager , нужно самому развернуть виртуальную машину, скачать дистрибутивы, сделать несколько кластеров

Ничего не пропустил?
Да, все верно, чтоб не создавать ноды каждый по отдельности, можно клонировать.

...

Рейтинг:

0 / 0

06.05.2016, 14:05

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39231324

Вжик

Участник

Откуда: Москва

Сообщения: 642

Рейтинг: 0 / 0

Всем привет.
По ссылке, может кому поможет.
http://webfiles.ru/files/44991504

...

Рейтинг:

0 / 0

07.05.2016, 15:51

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39231654

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

Вжик,

пока не помогла , половина файла о том как устанавливать virtualbox
и ни слова что когда запускаю файл cloudera-manager-installer.bin
из адреса " http://archive.cloudera.com/cm5/installer/latest/cloudera-manager-installer.bin"

появляется ошибка "отказано в доступе"

...

Рейтинг:

0 / 0

08.05.2016, 23:44

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39231655

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

мигель1,

вот тут

http://www.cloudera.com/downloads/manager/5-7-0.html

написано надо дать права
$ chmod u+x cloudera-manager-installer.bin

я дал появилась другая ошибка

"SELinux is enabled it must be desabled"

...

Рейтинг:

0 / 0

08.05.2016, 23:49

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39231657

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

мигель1,

Security- Enhanced Linux (SELinux) является особенностью механизма в Linux, что обеспечивает поддержку политик безопасности контроля доступа.

отключается здесь
cat /etc/sysconfig/selinux

...

Рейтинг:

0 / 0

08.05.2016, 23:59

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39231664

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

мигель1,

установилось, а что дальше? )

где кластеры hdfs , hue и прочие hive?

...

Рейтинг:

0 / 0

09.05.2016, 00:20

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39231665

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

мигель1,

надо отдельно скачать cdh5

http://www.cloudera.com/downloads/cdh/5-7-0.html

...

Рейтинг:

0 / 0

09.05.2016, 00:25

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39231666

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

мигель1,

или нет. читаю статью
Installation Path A - Automated Installation by Cloudera Manager

http://www.cloudera.com/documentation/enterprise/latest/topics/cm_ig_install_path_a.html#cmig_topic_6_5_unique_2

...

Рейтинг:

0 / 0

09.05.2016, 00:33

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39231669

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

мигель1,

http://www.cloudera.com/documentation/enterprise/latest/topics/cm_ig_permissions.html#xd_583c10bfdbd326ba--6eed2fb8-14349d04bee--7eb1

Permission Requirements for Package-based Installations and Upgrades of CDH

Запускаем службу

service cloudera-scm-server start

...

Рейтинг:

0 / 0

09.05.2016, 00:45

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39231716

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

мигель1мигель1,

или нет. читаю статью
Installation Path A - Automated Installation by Cloudera Manager

http://www.cloudera.com/documentation/enterprise/latest/topics/cm_ig_install_path_a.html#cmig_topic_6_5_unique_2

после распаковки в папке cloudera есть 2 файла CSD , parcel-repo

...

Рейтинг:

0 / 0

09.05.2016, 10:46

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39231718

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

мигель1мигель1мигель1,

или нет. читаю статью
Installation Path A - Automated Installation by Cloudera Manager

http://www.cloudera.com/documentation/enterprise/latest/topics/cm_ig_install_path_a.html#cmig_topic_6_5_unique_2

после распаковки в папке cloudera есть 2 файла CSD , parcel-repo

2 папки. и обе пустые...

...

Рейтинг:

0 / 0

09.05.2016, 10:52

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39231724

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

мигель1,

если я правильно понял логику, после установки нужно создать репозиторий
Сделать это можно 2 путями (Parcel или Package)

Cloudera рекомендует Creating and Using a Parcel Repository for Cloudera Manager

...

Рейтинг:

0 / 0

09.05.2016, 10:59

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39231727

Вжик

Участник

Откуда: Москва

Сообщения: 642

Рейтинг: 0 / 0

Тут еще одна, по Cloudera, посмотрите, может поможет
http://webfiles.ru/files/44995389

В ней установка делалась на амазоне + SSH по ключу, но сам путь с Cloudera должен быть таким, с поправкой на новую версию.
По мне так Hortonworks ставится проще и документация у них лучше.

...

Рейтинг:

0 / 0

09.05.2016, 11:10

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39232546

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

Вжик,

Встрял на точке: перейти по URL откуда URl в линуксе?
это же командная строка

...

Рейтинг:

0 / 0

10.05.2016, 15:55

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39232555

mishanya3624

Участник

Сообщения: 802

Рейтинг: 0 / 0

мигель1,

ifconfig посмотри ip машины линуксовой и с винды зайди, если у тебя гуев на линуксе нет.

...

Рейтинг:

0 / 0

10.05.2016, 16:01

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39232624

Вжик

Участник

Откуда: Москва

Сообщения: 642

Рейтинг: 0 / 0

Да, все верно, через web интерфейс с другой любой тачки управляем процессом установки. Далее через такой же веб интерфейс с другой тачки можно будет рулить конфигурацией.

...

Рейтинг:

0 / 0

10.05.2016, 16:42

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39233035

Вжик

Участник

Откуда: Москва

Сообщения: 642

Рейтинг: 0 / 0

Если кому интересно, то есть вакансия, довести BI до совершенства, далее идти в Big Data, Machine Learning, строить решения на основе Lambda-architecture, Data Lake, практиковаться в решении прикладных задач:
http://www.sql.ru/forum/1212997/vakansiya-bi-developer-moskva

...

Рейтинг:

0 / 0

11.05.2016, 09:30

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39234425

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

ВжикЕсли кому интересно, то есть вакансия, довести BI до совершенства, далее идти в Big Data, Machine Learning, строить решения на основе Lambda-architecture, Data Lake, практиковаться в решении прикладных задач:
http://www.sql.ru/forum/1212997/vakansiya-bi-developer-moskva

битая ссылка
Р—Р°РїСЂР°С€РёРІР°РµРјР°СЏ СЃС‚СЂР°РЅРёС†Р° Р±С‹Р»Р° СѓРґР°Р»РµРЅР°.

...

Рейтинг:

0 / 0

12.05.2016, 15:44

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39234443

servit

Участник

Откуда: г. Кишинёв, Республика Молдова

Сообщения: 3 167

Рейтинг: 0 / 0

мигель1битая ссылка
Р—Р°РїСЂР°С€РёРІР°РµРјР°СЏ СЃС‚СЂР°РЅРёС†Р° Р±С‹Р»Р° СѓРґР°Р»РµРЅР°.Оно же:

Код: plaintext

Запрашиваемая страница была удалена.

...

Рейтинг:

0 / 0

12.05.2016, 16:04

| Ответить | Цитировать | Написать

Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

#39429008

JJZ

Участник

Сообщения: 66

Рейтинг: 0 / 0

Можете посоветовать книгу по Big Data (где встречаются все основные технологии Hadoop, Spark, ...), где много примеров. Желательно, чтобы примеры можно было с сайта скачать и запустить.

Нашел пока только одну по Spark: Big Data Analytics with Spark: A Practitioner's Guide to Using Spark for Large Scale Data Analysis ( https://www.amazon.com/Big-Data-Analytics-Spark-Practitioners/dp/1484209656).

А то в основном книги по терии Big Data, а хотелось бы со множеством примеров + обзор + все в одной книге.

Спасибо

...

Рейтинг:

0 / 0

29.03.2017, 10:43

| Ответить | Цитировать | Написать

75 сообщений из 75, показаны все 3 страниц

все

Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Где взять хорошие учебники/видео по Hadoop, MapReduce, Hive и т.д.?

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?all=1&fid=48&tid=1856702]:	0ms
get settings:	8ms
get forum list:	11ms
check forum access:	3ms
check topic access:	3ms
track hit:	39ms
get topic data:	7ms
get forum data:	2ms
get page messages:	60ms
get tp. blocked users:	1ms
others:	218ms

total:	352ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы