Ктото реально юзал Kudu ? (Hadoop) / NoSQL, Big Data

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Ктото реально юзал Kudu ? (Hadoop)

19 сообщений из 19, страница 1 из 1

Ктото реально юзал Kudu ? (Hadoop)

#39148031

dmsnet

Участник

Сообщения: 4 409

Рейтинг: 0 / 0

Есть у кого опыт по проектах?
если кратко впечатления можете описать ? минусы ...

ато есть хайлоад проект метаясь тут в раздумиях ...

...

Рейтинг:

0 / 0

15.01.2016, 10:54

| Ответить | Цитировать | Написать

Ктото реально юзал Kudu ? (Hadoop)

#39148033

dmsnet

Участник

Сообщения: 4 409

Рейтинг: 0 / 0

http://m.habrahabr.ru/post/272267/

хвалят ... но как в реальности оно , эт вопрос

...

Рейтинг:

0 / 0

15.01.2016, 10:56

| Ответить | Цитировать | Написать

Ктото реально юзал Kudu ? (Hadoop)

#39150031

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

dmsnet http://m.habrahabr.ru/post/272267/

хвалят ... но как в реальности оно , эт вопрос

почитал )

В заключении следует сказать, что в данный момент Kudu находится в стадии активной разработки и не готов для использования в продакшн.

...

Рейтинг:

0 / 0

18.01.2016, 19:03

| Ответить | Цитировать | Написать

Период между сообщениями больше года.

Ктото реально юзал Kudu ? (Hadoop)

#39409103

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

мигель1,
Статья на хабре
3 декабря 2015 в 17:39

год прошел )

Я смотрю на бигдату апача не спешат переходить..

боятся опенсорс??

...

Рейтинг:

0 / 0

22.02.2017, 13:04

| Ответить | Цитировать | Написать

Ктото реально юзал Kudu ? (Hadoop)

#39409370

ASCRUS

Участник

Откуда: МО Электросталь

Сообщения: 5 642

Рейтинг: 0 / 0

Да вот оно все в теории красиво. На практике как обычно вылазят различные нюансы и благодаря им Хадуп при работе с структурированными данными здорово уступает заточенным на работу с ними РСУБД и по скорости и по функционалу и по надежности. Приходится мухлевать - сейчас вот например связку тестируем Hive на ORC для сбора и прожевывания данных плюс Вертика, которая таблицы Hive как внешние таблицы гоняет в запросах из HDFS.

...

Рейтинг:

0 / 0

22.02.2017, 19:37

| Ответить | Цитировать | Написать

Ктото реально юзал Kudu ? (Hadoop)

#39410952

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

ASCRUS,

получается интересная вещь

есть куча данных на дисках (HDFS)
а аналитики хотят быстро их гонять. Теперь вопрос... где?
вот и приходятся все равно их перегонять в колоночные таблицы (вертика, импала, монетдб, итд)

...

Рейтинг:

0 / 0

27.02.2017, 14:50

| Ответить | Цитировать | Написать

Ктото реально юзал Kudu ? (Hadoop)

#39410980

Дедушка

Участник

Откуда: Город трёх революций

Сообщения: 4 572

Рейтинг: 0 / 0

мигель1Теперь вопрос... где?Spark?

...

Рейтинг:

0 / 0

27.02.2017, 15:12

| Ответить | Цитировать | Написать

Ктото реально юзал Kudu ? (Hadoop)

#39411066

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

Дедушкамигель1Теперь вопрос... где?Spark?

Спарк я думаю хорош для анализа.
Аналитку на нем не построить. ИМХО

...

Рейтинг:

0 / 0

27.02.2017, 16:46

| Ответить | Цитировать | Написать

Ктото реально юзал Kudu ? (Hadoop)

#39411139

Дедушка

Участник

Откуда: Город трёх революций

Сообщения: 4 572

Рейтинг: 0 / 0

мигель1,

а, что вы в данном контексте подразумеваете под "аналитикой"?
прямой запрос sql или в hive не будет аналитикой?

...

Рейтинг:

0 / 0

27.02.2017, 18:19

| Ответить | Цитировать | Написать

Ктото реально юзал Kudu ? (Hadoop)

#39411388

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

Дедушка,

Под аналитикой я понимаю совокупность инструментов, когда пользователь из какой -то веб морды, выбирает параметры, и получает отчет.

Как я понимаю, спарк не умеет:
На сгенерированный запрос создать датасет, информацию для которого будет брать из HDFS

...

Рейтинг:

0 / 0

28.02.2017, 09:17

| Ответить | Цитировать | Написать

Ктото реально юзал Kudu ? (Hadoop)

#39411431

Yo.!

Гость

мигель1Под аналитикой я понимаю совокупность инструментов, когда пользователь из какой -то веб морды, выбирает параметры, и получает отчет.

Как я понимаю, спарк не умеет:
На сгенерированный запрос создать датасет, информацию для которого будет брать из HDFS
почему же, может. типа так

Код: java

1.
2.
3.
4.
5.
6.
7.

    val df = sparkSession.read
      .option("header", true)
      .option("delimiter", ";")
      .csv("/hdfs_path/file1.csv")
      .createOrReplaceTempView("csvtable")

   var data = sparkSession.sql("SELECT * FROM csvtable" )

...

Рейтинг:

0 / 0

28.02.2017, 10:53

| Ответить | Цитировать | Написать

Ктото реально юзал Kudu ? (Hadoop)

#39411493

Дедушка

Участник

Откуда: Город трёх революций

Сообщения: 4 572

Рейтинг: 0 / 0

мигель1Под аналитикой я понимаю совокупность инструментов, когда пользователь из какой -то веб морды, выбирает параметры, и получает отчет.apache zeppelin?

...

Рейтинг:

0 / 0

28.02.2017, 12:08

| Ответить | Цитировать | Написать

Ктото реально юзал Kudu ? (Hadoop)

#39411825

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

Дедушка,

Нашел статью на хабре
https://habrahabr.ru/company/jetinfosystems/blog/269769/

Пока такие танцы с бубном, бизнес не будет использовать окружение апача

...

Рейтинг:

0 / 0

28.02.2017, 17:01

| Ответить | Цитировать | Написать

Ктото реально юзал Kudu ? (Hadoop)

#39411841

Yo.!

Гость

мигель1Нашел статью на хабре
https://habrahabr.ru/company/jetinfosystems/blog/269769/

Пока такие танцы с бубном, бизнес не будет использовать окружение апача
сомневаюсь, что бизнес станет связываться наркоманами пытающимся диалект спарка или посгреса обращаться к неподдерживаемому ораклу.
человеку уже на уровне идеи подружить тулзу к бигдата с ораклом стоило бы сказать нет наркотикам, а не принимать убойную дозу.

суть тулзы - дать доступ к дребедени поверх hadoop и его hdfs: hive, spark

...

Рейтинг:

0 / 0

28.02.2017, 17:18

| Ответить | Цитировать | Написать

Ктото реально юзал Kudu ? (Hadoop)

#39412252

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

Yo.!мигель1Под аналитикой я понимаю совокупность инструментов, когда пользователь из какой -то веб морды, выбирает параметры, и получает отчет.

Как я понимаю, спарк не умеет:
На сгенерированный запрос создать датасет, информацию для которого будет брать из HDFS
почему же, может. типа так

Код: java

1.
2.
3.
4.
5.
6.
7.

    val df = sparkSession.read
      .option("header", true)
      .option("delimiter", ";")
      .csv("/hdfs_path/file1.csv")
      .createOrReplaceTempView("csvtable")

   var data = sparkSession.sql("SELECT * FROM csvtable" )

Скажите пожалуйста, а где запускать этот чудесный код?

...

Рейтинг:

0 / 0

01.03.2017, 11:30

| Ответить | Цитировать | Написать

Ктото реально юзал Kudu ? (Hadoop)

#39412331

Yo.!

Гость

мигель1Скажите пожалуйста, а где запускать этот чудесный код?

в гуйне databriks облака, oracle BI, apache zeppelin и т.п.
вобщем там где спарк супортиться

...

Рейтинг:

0 / 0

01.03.2017, 12:48

| Ответить | Цитировать | Написать

Ктото реально юзал Kudu ? (Hadoop)

#39413112

ASCRUS

Участник

Откуда: МО Электросталь

Сообщения: 5 642

Рейтинг: 0 / 0

мигель1ASCRUS,

получается интересная вещь

есть куча данных на дисках (HDFS)
а аналитики хотят быстро их гонять. Теперь вопрос... где?
вот и приходятся все равно их перегонять в колоночные таблицы (вертика, импала, монетдб, итд)
Ну вот не обязательно перегонять. В той же Вертике таблица Hive цепляется как внешняя и дальше запросы Вертики работают с ней, как родной таблицей. Причем это не тупо чтение всего с HDFS и пост обработка. С тем же форматом ORC Вертика оперирует партициями и тащит только нужные куски таблицы. Так же оперирует статистикой читаемых блоков и не читает тех, кто изначально не подходит под условия запросов. Плюс данные тащатся параллельно с нод кластера Хадуп нодами кластера Вертики, нет такого, что хдфс собирает весь файл из кусков и отдает Вертике. Если Вертика на тех же нодах живет, до тучи она еще и локально сразу куски видит, не тащит их через webhdfs, а читает напрямую. В общем медленнее чем на собственных ROS контейнерах локальных дисков, но все равно оптимизация присутствует и она сильно пошустрее, чем оптимизация того же Hive :)

...

Рейтинг:

0 / 0

02.03.2017, 13:42

| Ответить | Цитировать | Написать

Ктото реально юзал Kudu ? (Hadoop)

#39413259

мигель1

Участник

Сообщения: 3 349

Рейтинг: 0 / 0

ASCRUS,

Я правильно понимаю, что Вы утверждаете, что Vertica на HDFS быстрее, чем Impala или Spark ?

...

Рейтинг:

0 / 0

02.03.2017, 16:42

| Ответить | Цитировать | Написать

Ктото реально юзал Kudu ? (Hadoop)

#39413318

Yo.!

Гость

мигель1Я правильно понимаю, что Вы утверждаете, что Vertica на HDFS быстрее, чем Impala или Spark ?
нет, он говорил о hive, который превращает SQL в неспешный map-reduce.
impala и спарк по другим принципам работают.

...

Рейтинг:

0 / 0

02.03.2017, 18:04

| Ответить | Цитировать | Написать

19 сообщений из 19, страница 1 из 1

Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Ктото реально юзал Kudu ? (Hadoop)

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=48&msg=39411493&tid=1856705]:	0ms
get settings:	8ms
get forum list:	20ms
check forum access:	4ms
check topic access:	4ms
track hit:	58ms
get topic data:	13ms
get forum data:	3ms
get page messages:	78ms
get tp. blocked users:	2ms
others:	216ms

total:	406ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы