|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
Доброго времени суток. Архитектура: https://prnt.sc/19ae6qg 1) DWH - Clickhouse. 2) процессинг - ?? Для процессинга кубов рассматриваю SQL Server Analysis services (SSAS) и Cube Wizard(от apache kylin). 3) UI - Tableau Подскажите, какое решение/процессинг выбрать для построения OLAP кубов в связке Clickhouse и Tableau? ... |
|||
:
Нравится:
Не нравится:
|
|||
07.07.2021, 19:21 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
posdev Подскажите, какое решение/процессинг выбрать для построения OLAP кубов в связке Clickhouse и Tableau? Поддерживаемые источники для табулярных моделей Поддерживаемые источники для многомерных моделей ... |
|||
:
Нравится:
Не нравится:
|
|||
07.07.2021, 19:58 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
posdev, Зачем вам SSAS и Clickhouse одновременно? ... |
|||
:
Нравится:
Не нравится:
|
|||
07.07.2021, 20:27 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
Да и вообще у вас довольно странное представление о вычислительном слое ) Я бы отнес кубы к визуализации ... |
|||
:
Нравится:
Не нравится:
|
|||
07.07.2021, 20:29 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
накой тебе вообще ssas. Эксельки заполнять? ... |
|||
:
Нравится:
Не нравится:
|
|||
08.07.2021, 11:50 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
posdev, 2 варианта, или ставьте Вертику, но надо проверить как она забирать из Clickhouse будет. Или, как в Вымпелкоме, просто поставите поверх Clickhouse Qlik Sense - он прекрасно данные забирает и сам формирует промежуточные слои. У вас будет настоящий Self-Service BI, не будет узкого горлышка в виде аналитического отдела, который всем отчеты на табло паяяет (как было в Билайне, пока указанный продукт просто не выкинули). С Уважением, Георгий ... |
|||
:
Нравится:
Не нравится:
|
|||
08.07.2021, 13:45 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
ну про селф-сервис на клике можете тоже даже не начинать ... |
|||
:
Нравится:
Не нравится:
|
|||
08.07.2021, 14:00 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
Bigheadman posdev Подскажите, какое решение/процессинг выбрать для построения OLAP кубов в связке Clickhouse и Tableau? Поддерживаемые источники для табулярных моделей Поддерживаемые источники для многомерных моделей А что Microsoft никак не может приконнектиться к clickhouse -- ни через LinkedServer ни через коннекшн? ... |
|||
:
Нравится:
Не нравится:
|
|||
08.07.2021, 14:17 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
posdev, а что вы собираетесь делать в Computer layer? Tableau разве сам не может делать расчеты для отчетов? ... |
|||
:
Нравится:
Не нравится:
|
|||
08.07.2021, 14:45 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
bideveloper Tableau разве сам не может делать расчеты для отчетов? Ivan Durak ну про селф-сервис на клике можете тоже даже не начинать ... |
|||
:
Нравится:
Не нравится:
|
|||
08.07.2021, 17:07 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
Нафига кубы и Табло если табло сам умеет агрегировать данные в свои экстракты и строить отчеты уже по ним, не обращаясь к базе? мы поэтому от кубов и ушли. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.07.2021, 17:57 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
posdev, поверх clickhouse используют pentaho mondrian - Достаточно успешно, и получают куб и XML/A, MDX для разных BI тулов... поищите например https://altinity.com/blog/accessing-clickhouse-from-excel-using-mondrian-rolap-engine ... |
|||
:
Нравится:
Не нравится:
|
|||
08.07.2021, 22:54 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
товарищъ, там очень ограниченный функционал, нет многие ко многим, итд максимум 1 мера и кучка справочников ... |
|||
:
Нравится:
Не нравится:
|
|||
10.07.2021, 22:53 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
По mondrian тут почти нет топиков, что явно говорит о его "популярности" ... |
|||
:
Нравится:
Не нравится:
|
|||
10.07.2021, 23:35 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
Товарищи, а может кто-то объяснить как удается использовать ClickHouse в качестве DWH? Ну ведь нет там строгой consistency. Да, клики считать - ОК. Какую-то служебную инфу (вечно любят логи вспоминать, как будто в этих логах бизнес ценность имеется) - хорошо. Всякие маркетинговые компании или поведение клиентов - тоже гуд. Но как там цифры по реальным платежам можно держать? Итого, по моему скромному мнению, ClickHouse хорош для определенных витрин. Но никак не для DWH. Объясните где я неправ? ... |
|||
:
Нравится:
Не нравится:
|
|||
29.10.2021, 15:25 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
AData, У нас CH используется совместно с традиционным SQL DWH. Если какие-то строки удалены(это можно узнать сравнив изменения из источника с текущими данными в SQL) пишем "антистроки" в CH, они обнуляют ранее записанное. В самом КХ таблица на движке MergeTree(в ней вся история изменений в нее и грузим строки) и на ней основывается MV с движком ReplacingMergeTree, с уникальным ключом(например ИД документа, строка) и в ней уже текущие данные. Если все это сделать корректно, оно вполне работает. Плюс КХ, что он очень быстро обрабатывает запросы, разгружается основное хранилище и рады любители всяких новых модных технологий. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.11.2021, 10:20 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
KAB, "Если все это сделать корректно, оно вполне работает." Что значит корректно? Логирования в КХ нету, транзакций нету, синхронной записи на диск тоже. То есть это на уровне архитектуры невозможно сделать. Да, снизить вероятность проблем можно, но критичные данные точно стоят таких рисков? Собственно ко всяким Хадупам такие же претензии. Все эти БигДаты явно не для строгой отчетности. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.11.2021, 19:03 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
AData Собственно ко всяким Хадупам такие же претензии. Все эти БигДаты явно не для строгой отчетности. на собесе только такое не ляпни, засмеют. в хадупах пишут в темп фолдер, а потом атомарной командой ренеймят фолдер. т.е. все совершенно консистентно и зачастую более консистентно чем танцы с exchange partition какие приходится устраивать в реляционках. на сколько я помню в оракле exchange partition это ddl обрывающий транзакцию. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.11.2021, 21:20 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
H5N1, судя по хамоватому общению и актуальности собеседований - из молодых хуру? Currently, Impala does not support multi-statement transactions Ну то есть атомарный Insert пройдет а batch уже нет. С Hive аналогично Update через Kudu который в свою очередь Kudu currently does not enforce strong consistency during concurrent DML operations, be aware that the results after this statement finishes might be different than you intuitively expect HDFS архитектурно не поддерживает изменений, ровно поэтому приходится в хадупах пишут в темп фолдер, а потом атомарной командой ренеймят фолдер С другой стороны, если мне нужно 100 строк добавить в много-миллионную таблицу, то перезаписывать ее полностью - это конечно красивое и правильное решение. ... |
|||
:
Нравится:
Не нравится:
|
|||
04.11.2021, 12:59 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
AData H5N1, судя по хамоватому общению и актуальности собеседований - из молодых хуру? Currently, Impala does not support multi-statement transactions Ну то есть атомарный Insert пройдет а batch уже нет. С Hive аналогично Update через Kudu который в свою очередь Kudu currently does not enforce strong consistency during concurrent DML operations, be aware that the results after this statement finishes might be different than you intuitively expect HDFS архитектурно не поддерживает изменений, ровно поэтому приходится в хадупах пишут в темп фолдер, а потом атомарной командой ренеймят фолдер С другой стороны, если мне нужно 100 строк добавить в много-миллионную таблицу, то перезаписывать ее полностью - это конечно красивое и правильное решение. если тебе нужно 100 строк добавить то ты промахнулся форумом. я из старых, что только тут такой молодняк добрых лет 15 троллит. итак, если ты думаешь, что серьезные хранилища на рсубд заливают данные в единой транзакции то тебя на собесе ждет сюрприз и волчий билет. ... |
|||
:
Нравится:
Не нравится:
|
|||
04.11.2021, 13:18 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
H5N1, чувак, если хочешь чтобы с тобой общались - научись это делать вежливо. И подлечи уже свою психологическую травму после собеседований. Слишком бросается в глаза. С моей стороны - игнор. ... |
|||
:
Нравится:
Не нравится:
|
|||
04.11.2021, 15:28 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
AData чувак, если хочешь чтобы с тобой общались - научись это делать вежливо. И подлечи уже свою психологическую травму после собеседований. Слишком бросается в глаза. С моей стороны - игнор. это могло бы быть разумной просьбой, если бы у тебя был бы хоть какой-то опыт, но ты приперся сюда с уровнем ниже джуна с представлением, что в хранилища заливают данные в рамках единой транзакции и с вбросом "БигДаты явно не для строгой отчетности". прости, но ты сюда приперся и я чувствую обязанным тебя подтянуть хотя бы на уровень джуна. ... |
|||
:
Нравится:
Не нравится:
|
|||
04.11.2021, 15:39 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
Вообще, похоже не зря в Хадупе сервисы с животными ассоциируют. Ибо это лютый зоопарк. В Hive, например, добавили функционал транзакционных таблиц - однако Spark корректно с ними не работает. Способов прострелить себе ногу неисчислимое количество. Справедливости ради надо сказать, что нормальное решение все-таки появилось. Delta Lake от Databricks решает проблемы. Но они его только в облаках предлагают. Amazon и Microsoft тоже у себя в облаке дают. В дистрибутивах у Cloudera его нету. И как его у себя поднимать - надо разбираться. Но по крайней мере - это должно нормально работать. ... |
|||
:
Нравится:
Не нравится:
|
|||
06.11.2021, 12:17 |
|
Какое решение/процессинг выбрать для построения OLAP кубов
|
|||
---|---|---|---|
#18+
джун, вещать о зоопарке в хадупах в эпоху, когда майкрософт нахлабучила файлики mssql на тот же самый хадуп, вкрячив сбоку тот же самый спарк и проталкивает это как вершину тяжелой аналитики azure synapse/sql server big data edition - это мощно. снова совет не ляпнуть на собесе. на хадупах сейчас три серьезные либы вокргу parquet формата Hudi, Iceberg, Delta от датабликса. опенсоурсную Delta от датабрикса мы уже год-полтора пользуем на cloudera, как сторидж для спарка он неплох, но ни hive ни impala этот формат не понимают и интегрировать нереально. но главное - ни одна из этих трех, включая датабрикс не обеспечивает атомарности далее одной таблицы, т.е. все так же как в реальной жизни на легаси рдбмс - acid на запись в одну таблицу. в эпоху стриминга и массивно-параллельности это и нафиг никому не надо, в том числе и деньги считать. что на легаси рдбмс, что у датабрикс облаке. ... |
|||
:
Нравится:
Не нравится:
|
|||
06.11.2021, 13:24 |
|
|
start [/forum/topic.php?fid=49&tid=1857057]: |
0ms |
get settings: |
22ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
42ms |
get topic data: |
12ms |
get forum data: |
2ms |
get page messages: |
466ms |
get tp. blocked users: |
2ms |
others: | 361ms |
total: | 928ms |
0 / 0 |