|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
Есть у кого опыт по проектах? если кратко впечатления можете описать ? минусы ... ато есть хайлоад проект метаясь тут в раздумиях ... ... |
|||
:
Нравится:
Не нравится:
|
|||
15.01.2016, 10:54 |
|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
... |
|||
:
Нравится:
Не нравится:
|
|||
15.01.2016, 10:56 |
|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
dmsnet http://m.habrahabr.ru/post/272267/ хвалят ... но как в реальности оно , эт вопрос почитал ) В заключении следует сказать, что в данный момент Kudu находится в стадии активной разработки и не готов для использования в продакшн. ... |
|||
:
Нравится:
Не нравится:
|
|||
18.01.2016, 19:03 |
|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
мигель1, Статья на хабре 3 декабря 2015 в 17:39 год прошел ) Я смотрю на бигдату апача не спешат переходить.. боятся опенсорс?? ... |
|||
:
Нравится:
Не нравится:
|
|||
22.02.2017, 13:04 |
|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
Да вот оно все в теории красиво. На практике как обычно вылазят различные нюансы и благодаря им Хадуп при работе с структурированными данными здорово уступает заточенным на работу с ними РСУБД и по скорости и по функционалу и по надежности. Приходится мухлевать - сейчас вот например связку тестируем Hive на ORC для сбора и прожевывания данных плюс Вертика, которая таблицы Hive как внешние таблицы гоняет в запросах из HDFS. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.02.2017, 19:37 |
|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
ASCRUS, получается интересная вещь есть куча данных на дисках (HDFS) а аналитики хотят быстро их гонять. Теперь вопрос... где? вот и приходятся все равно их перегонять в колоночные таблицы (вертика, импала, монетдб, итд) ... |
|||
:
Нравится:
Не нравится:
|
|||
27.02.2017, 14:50 |
|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
мигель1Теперь вопрос... где?Spark? ... |
|||
:
Нравится:
Не нравится:
|
|||
27.02.2017, 15:12 |
|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
Дедушкамигель1Теперь вопрос... где?Spark? Спарк я думаю хорош для анализа. Аналитку на нем не построить. ИМХО ... |
|||
:
Нравится:
Не нравится:
|
|||
27.02.2017, 16:46 |
|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
мигель1, а, что вы в данном контексте подразумеваете под "аналитикой"? прямой запрос sql или в hive не будет аналитикой? ... |
|||
:
Нравится:
Не нравится:
|
|||
27.02.2017, 18:19 |
|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
Дедушка, Под аналитикой я понимаю совокупность инструментов, когда пользователь из какой -то веб морды, выбирает параметры, и получает отчет. Как я понимаю, спарк не умеет: На сгенерированный запрос создать датасет, информацию для которого будет брать из HDFS ... |
|||
:
Нравится:
Не нравится:
|
|||
28.02.2017, 09:17 |
|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
мигель1Под аналитикой я понимаю совокупность инструментов, когда пользователь из какой -то веб морды, выбирает параметры, и получает отчет. Как я понимаю, спарк не умеет: На сгенерированный запрос создать датасет, информацию для которого будет брать из HDFS почему же, может. типа так Код: java 1. 2. 3. 4. 5. 6. 7.
... |
|||
:
Нравится:
Не нравится:
|
|||
28.02.2017, 10:53 |
|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
мигель1Под аналитикой я понимаю совокупность инструментов, когда пользователь из какой -то веб морды, выбирает параметры, и получает отчет.apache zeppelin? ... |
|||
:
Нравится:
Не нравится:
|
|||
28.02.2017, 12:08 |
|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
Дедушка, Нашел статью на хабре https://habrahabr.ru/company/jetinfosystems/blog/269769/ Пока такие танцы с бубном, бизнес не будет использовать окружение апача ... |
|||
:
Нравится:
Не нравится:
|
|||
28.02.2017, 17:01 |
|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
мигель1Нашел статью на хабре https://habrahabr.ru/company/jetinfosystems/blog/269769/ Пока такие танцы с бубном, бизнес не будет использовать окружение апача сомневаюсь, что бизнес станет связываться наркоманами пытающимся диалект спарка или посгреса обращаться к неподдерживаемому ораклу. человеку уже на уровне идеи подружить тулзу к бигдата с ораклом стоило бы сказать нет наркотикам, а не принимать убойную дозу. суть тулзы - дать доступ к дребедени поверх hadoop и его hdfs: hive, spark ... |
|||
:
Нравится:
Не нравится:
|
|||
28.02.2017, 17:18 |
|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
Yo.!мигель1Под аналитикой я понимаю совокупность инструментов, когда пользователь из какой -то веб морды, выбирает параметры, и получает отчет. Как я понимаю, спарк не умеет: На сгенерированный запрос создать датасет, информацию для которого будет брать из HDFS почему же, может. типа так Код: java 1. 2. 3. 4. 5. 6. 7.
Скажите пожалуйста, а где запускать этот чудесный код? ... |
|||
:
Нравится:
Не нравится:
|
|||
01.03.2017, 11:30 |
|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
мигель1Скажите пожалуйста, а где запускать этот чудесный код? в гуйне databriks облака, oracle BI, apache zeppelin и т.п. вобщем там где спарк супортиться ... |
|||
:
Нравится:
Не нравится:
|
|||
01.03.2017, 12:48 |
|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
мигель1ASCRUS, получается интересная вещь есть куча данных на дисках (HDFS) а аналитики хотят быстро их гонять. Теперь вопрос... где? вот и приходятся все равно их перегонять в колоночные таблицы (вертика, импала, монетдб, итд) Ну вот не обязательно перегонять. В той же Вертике таблица Hive цепляется как внешняя и дальше запросы Вертики работают с ней, как родной таблицей. Причем это не тупо чтение всего с HDFS и пост обработка. С тем же форматом ORC Вертика оперирует партициями и тащит только нужные куски таблицы. Так же оперирует статистикой читаемых блоков и не читает тех, кто изначально не подходит под условия запросов. Плюс данные тащатся параллельно с нод кластера Хадуп нодами кластера Вертики, нет такого, что хдфс собирает весь файл из кусков и отдает Вертике. Если Вертика на тех же нодах живет, до тучи она еще и локально сразу куски видит, не тащит их через webhdfs, а читает напрямую. В общем медленнее чем на собственных ROS контейнерах локальных дисков, но все равно оптимизация присутствует и она сильно пошустрее, чем оптимизация того же Hive :) ... |
|||
:
Нравится:
Не нравится:
|
|||
02.03.2017, 13:42 |
|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
ASCRUS, Я правильно понимаю, что Вы утверждаете, что Vertica на HDFS быстрее, чем Impala или Spark ? ... |
|||
:
Нравится:
Не нравится:
|
|||
02.03.2017, 16:42 |
|
Ктото реально юзал Kudu ? (Hadoop)
|
|||
---|---|---|---|
#18+
мигель1Я правильно понимаю, что Вы утверждаете, что Vertica на HDFS быстрее, чем Impala или Spark ? нет, он говорил о hive, который превращает SQL в неспешный map-reduce. impala и спарк по другим принципам работают. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.03.2017, 18:04 |
|
|
start [/forum/topic.php?fid=48&msg=39411493&tid=1856705]: |
0ms |
get settings: |
10ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
172ms |
get topic data: |
7ms |
get forum data: |
2ms |
get page messages: |
53ms |
get tp. blocked users: |
1ms |
others: | 15ms |
total: | 282ms |
0 / 0 |