Кто Hadoop использует - скажите что вы на нем считаете? / Java

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Java [игнор отключен] [закрыт для гостей] / Кто Hadoop использует - скажите что вы на нем считаете?

2 сообщений из 2, страница 1 из 1

Кто Hadoop использует - скажите что вы на нем считаете?

#38628127

private

Участник

Сообщения: 1 707

Рейтинг: 0 / 0

Привет, сейчас есть интересное направление - BigData, Hadoop и т.д. и я даже участвовал в небольшом проекте, но всеравно не очень сильно понимаю что именно на нем считается? И как?

Мы использовали его для предварительной агрегации логов чтобы потом уже гораздо меньший обьем загрузить в обычную базу и по ней считать уже окончательную аналитику. Но множество вопросов непонятны:

- Какие задачи вы решаете?
- Что вы используете для Map/Reduce - Java, или скриптовые языки, напр. Python, Ruby?
- Сами Map/Reduce пишите или используете Pig / Hive?
- Насколько сложные вычисления достаточно ли базовых знаний статистики, алгоритмов, или используете очень сложные алгоритмы?
- На что уходит основное время разработки - на решение прикладных задач, обдумывание алгоритмов и написания их Map/Reduce или написания инфраструктуры вокруг хадупа, интеграция с другими системами?
- Допустим вы посчитали что-то - где вы храните полученные результаты? В самом Hadoop, HTable, какой-то другой базе?
- Чем деплоите кластер?

Заранее спасибо за ответы.

...

Рейтинг:

0 / 0

28.04.2014, 19:11

| Ответить | Цитировать | Написать

Кто Hadoop использует - скажите что вы на нем считаете?

#38628455

Alexey Tomin

Участник

Откуда: Самара

Сообщения: 1 715

Рейтинг: 0 / 0

privateПривет, сейчас есть интересное направление - BigData, Hadoop и т.д. и я даже участвовал в небольшом проекте, но всеравно не очень сильно понимаю что именно на нем считается? И как?

- Какие задачи вы решаете?

Разные. Тут один товарищ из Оракла сказал- "хадуп это антресолька". Т.е. дешёвое хранилище больших объёмов.

private- Что вы используете для Map/Reduce - Java, или скриптовые языки, напр. Python, Ruby?

java, просто потому, что единственный апологет python'а у нас- PM, а это по вопросу выбора языка имеет только совещательный голос :)

private- Сами Map/Reduce пишите или используете Pig / Hive?

Для больших задач- сами, если надо чего быстро прикинуть- то Hive. Глючен он страшно...

private- Насколько сложные вычисления достаточно ли базовых знаний статистики, алгоритмов, или используете очень сложные алгоритмы?

И сложные тоже есть.

private- На что уходит основное время разработки - на решение прикладных задач, обдумывание алгоритмов и написания их Map/Reduce или написания инфраструктуры вокруг хадупа, интеграция с другими системами?

У сложной задачи и алгоритм придумать сложно, чтобы кластер не треснул, и потом кластер держать, чтобы не развалился, тоже надо.

private- Допустим вы посчитали что-то - где вы храните полученные результаты? В самом Hadoop, HTable, какой-то другой базе?

Некоторые выгружаем в "обычные" БД. Все храним в hbas/hdfs.

private- Чем деплоите кластер?

Не понял. Можно на любую машину кластера (или вообще любой машины с хадупом) закинуть fat-jar и запустить "hadoop jar task.jar"
Можно (если в task.jar ещё и библиотеки хадупа запихнуть) вообще с любого компьютера "java -jar task.jar" выполнить- если доступ есть- оно само на кластер задеплоится.

Вот если SOLR нужен- тут да, посложнее...

...

Рейтинг:

0 / 0

29.04.2014, 09:37

| Ответить | Цитировать | Написать

2 сообщений из 2, страница 1 из 1

Форумы / Java [игнор отключен] [закрыт для гостей] / Кто Hadoop использует - скажите что вы на нем считаете?

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=59&tid=2127264]:	0ms
get settings:	7ms
get forum list:	19ms
check forum access:	2ms
check topic access:	2ms
track hit:	157ms
get topic data:	9ms
get forum data:	2ms
get page messages:	38ms
get tp. blocked users:	1ms
others:	217ms

total:	454ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы