Гость
Map
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / Какое решение/процессинг выбрать для построения OLAP кубов / 25 сообщений из 26, страница 1 из 2
07.07.2021, 19:21
    #40082415
posdev
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
Доброго времени суток.
Архитектура: https://prnt.sc/19ae6qg
1) DWH - Clickhouse.
2) процессинг - ?? Для процессинга кубов рассматриваю SQL Server Analysis services (SSAS) и Cube Wizard(от apache kylin).
3) UI - Tableau

Подскажите, какое решение/процессинг выбрать для построения OLAP кубов в связке Clickhouse и Tableau?
...
Рейтинг: 0 / 0
07.07.2021, 19:58
    #40082422
Bigheadman
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
posdev
Подскажите, какое решение/процессинг выбрать для построения OLAP кубов в связке Clickhouse и Tableau?
Учтите , что SSAS не поддерживает Clickhouse в качестве источника данных.
Поддерживаемые источники для табулярных моделей
Поддерживаемые источники для многомерных моделей
...
Рейтинг: 0 / 0
07.07.2021, 20:27
    #40082425
Критик
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
posdev,

Зачем вам SSAS и Clickhouse одновременно?
...
Рейтинг: 0 / 0
07.07.2021, 20:29
    #40082426
Критик
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
Да и вообще у вас довольно странное представление о вычислительном слое )
Я бы отнес кубы к визуализации
...
Рейтинг: 0 / 0
08.07.2021, 11:50
    #40082599
Ivan Durak
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
накой тебе вообще ssas. Эксельки заполнять?
...
Рейтинг: 0 / 0
08.07.2021, 13:45
    #40082651
George Nordic
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
posdev, 2 варианта, или ставьте Вертику, но надо проверить как она забирать из Clickhouse будет. Или, как в Вымпелкоме, просто поставите поверх Clickhouse Qlik Sense - он прекрасно данные забирает и сам формирует промежуточные слои. У вас будет настоящий Self-Service BI, не будет узкого горлышка в виде аналитического отдела, который всем отчеты на табло паяяет (как было в Билайне, пока указанный продукт просто не выкинули).

С Уважением,
Георгий
...
Рейтинг: 0 / 0
08.07.2021, 14:00
    #40082660
Ivan Durak
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
ну про селф-сервис на клике можете тоже даже не начинать
...
Рейтинг: 0 / 0
08.07.2021, 14:17
    #40082664
a_voronin
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
Bigheadman
posdev
Подскажите, какое решение/процессинг выбрать для построения OLAP кубов в связке Clickhouse и Tableau?
Учтите , что SSAS не поддерживает Clickhouse в качестве источника данных.
Поддерживаемые источники для табулярных моделей
Поддерживаемые источники для многомерных моделей


А что Microsoft никак не может приконнектиться к clickhouse -- ни через LinkedServer ни через коннекшн?
...
Рейтинг: 0 / 0
08.07.2021, 14:45
    #40082687
bideveloper
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
posdev,

а что вы собираетесь делать в Computer layer? Tableau разве сам не может делать расчеты для отчетов?
...
Рейтинг: 0 / 0
08.07.2021, 17:07
    #40082731
George Nordic
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
bideveloper
Tableau разве сам не может делать расчеты для отчетов?
У него кеширование есть, но слабое. Т.е. чем быстрее источник отдаёт данные, тем быстрее все работает.
Ivan Durak
ну про селф-сервис на клике можете тоже даже не начинать
Я говорил и не раз - по свидетельству компаний, которые понимают что такое НАСТОЯЩИЙ Self-Service, и развернули самообслуживание на сотни, тысячи и десятки тысяч пользователей, это единственная система, в которой пользователи сами могут паять себе отчеты, не бегая каждую минуту к IT или аналитический отдел. А в X5, Магнит, РГС, Сбербанке, Вымпелкоме и еще в десятках крупных компаний - было куча BI решений. Теперь проблема - грамотность работы с данными. Дать инструмент - мало, надо научить кучу пользователей им пользоваться. Вот как это выглядит в "Билайне". Думаю, многим будет полезно:

YouTube Video
...
Рейтинг: 0 / 0
08.07.2021, 17:57
    #40082754
Santa89
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
Нафига кубы и Табло если табло сам умеет агрегировать данные в свои экстракты и строить отчеты уже по ним, не обращаясь к базе?
мы поэтому от кубов и ушли.
...
Рейтинг: 0 / 0
08.07.2021, 22:54
    #40082809
товарищъ
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
posdev,
поверх clickhouse используют pentaho mondrian - Достаточно успешно, и получают куб и XML/A, MDX для разных BI тулов... поищите
например https://altinity.com/blog/accessing-clickhouse-from-excel-using-mondrian-rolap-engine
...
Рейтинг: 0 / 0
10.07.2021, 22:53
    #40083176
мигель1
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
товарищъ,

там очень ограниченный функционал, нет многие ко многим, итд

максимум 1 мера и кучка справочников
...
Рейтинг: 0 / 0
10.07.2021, 23:35
    #40083178
Критик
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
По mondrian тут почти нет топиков, что явно говорит о его "популярности"
...
Рейтинг: 0 / 0
29.10.2021, 15:25
    #40108106
AData
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
Товарищи, а может кто-то объяснить как удается использовать ClickHouse в качестве DWH?

Ну ведь нет там строгой consistency.
Да, клики считать - ОК. Какую-то служебную инфу (вечно любят логи вспоминать, как будто в этих логах бизнес ценность имеется) - хорошо. Всякие маркетинговые компании или поведение клиентов - тоже гуд. Но как там цифры по реальным платежам можно держать?

Итого, по моему скромному мнению, ClickHouse хорош для определенных витрин. Но никак не для DWH. Объясните где я неправ?
...
Рейтинг: 0 / 0
03.11.2021, 10:20
    #40108904
KAB
KAB
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
AData,

У нас CH используется совместно с традиционным SQL DWH.
Если какие-то строки удалены(это можно узнать сравнив изменения из источника с текущими данными в SQL) пишем "антистроки" в CH, они обнуляют ранее записанное.
В самом КХ таблица на движке MergeTree(в ней вся история изменений в нее и грузим строки) и на ней основывается MV с движком ReplacingMergeTree, с уникальным ключом(например ИД документа, строка) и в ней уже текущие данные.
Если все это сделать корректно, оно вполне работает.
Плюс КХ, что он очень быстро обрабатывает запросы, разгружается основное хранилище и рады любители всяких новых модных технологий.
...
Рейтинг: 0 / 0
03.11.2021, 19:03
    #40109072
AData
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
KAB,
"Если все это сделать корректно, оно вполне работает."
Что значит корректно?
Логирования в КХ нету, транзакций нету, синхронной записи на диск тоже. То есть это на уровне архитектуры невозможно сделать. Да, снизить вероятность проблем можно, но критичные данные точно стоят таких рисков?

Собственно ко всяким Хадупам такие же претензии. Все эти БигДаты явно не для строгой отчетности.
...
Рейтинг: 0 / 0
03.11.2021, 21:20
    #40109096
H5N1
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
AData

Собственно ко всяким Хадупам такие же претензии. Все эти БигДаты явно не для строгой отчетности.

на собесе только такое не ляпни, засмеют.
в хадупах пишут в темп фолдер, а потом атомарной командой ренеймят фолдер. т.е. все совершенно консистентно и зачастую более консистентно чем танцы с exchange partition какие приходится устраивать в реляционках. на сколько я помню в оракле exchange partition это ddl обрывающий транзакцию.
...
Рейтинг: 0 / 0
04.11.2021, 12:59
    #40109194
AData
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
H5N1, судя по хамоватому общению и актуальности собеседований - из молодых хуру?

Currently, Impala does not support multi-statement transactions
Ну то есть атомарный Insert пройдет а batch уже нет. С Hive аналогично
Update через Kudu который в свою очередь
Kudu currently does not enforce strong consistency during concurrent DML operations, be aware that the results after this statement finishes might be different than you intuitively expect

HDFS архитектурно не поддерживает изменений, ровно поэтому приходится
в хадупах пишут в темп фолдер, а потом атомарной командой ренеймят фолдер
С другой стороны, если мне нужно 100 строк добавить в много-миллионную таблицу, то перезаписывать ее полностью - это конечно красивое и правильное решение.
...
Рейтинг: 0 / 0
04.11.2021, 13:18
    #40109195
H5N1
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
AData
H5N1, судя по хамоватому общению и актуальности собеседований - из молодых хуру?

Currently, Impala does not support multi-statement transactions
Ну то есть атомарный Insert пройдет а batch уже нет. С Hive аналогично
Update через Kudu который в свою очередь
Kudu currently does not enforce strong consistency during concurrent DML operations, be aware that the results after this statement finishes might be different than you intuitively expect

HDFS архитектурно не поддерживает изменений, ровно поэтому приходится
в хадупах пишут в темп фолдер, а потом атомарной командой ренеймят фолдер
С другой стороны, если мне нужно 100 строк добавить в много-миллионную таблицу, то перезаписывать ее полностью - это конечно красивое и правильное решение.

если тебе нужно 100 строк добавить то ты промахнулся форумом. я из старых, что только тут такой молодняк добрых лет 15 троллит.
итак, если ты думаешь, что серьезные хранилища на рсубд заливают данные в единой транзакции то тебя на собесе ждет сюрприз и волчий билет.
...
Рейтинг: 0 / 0
04.11.2021, 15:28
    #40109229
AData
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
H5N1,
чувак, если хочешь чтобы с тобой общались - научись это делать вежливо. И подлечи уже свою психологическую травму после собеседований. Слишком бросается в глаза. С моей стороны - игнор.
...
Рейтинг: 0 / 0
04.11.2021, 15:39
    #40109233
H5N1
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
AData

чувак, если хочешь чтобы с тобой общались - научись это делать вежливо. И подлечи уже свою психологическую травму после собеседований. Слишком бросается в глаза. С моей стороны - игнор.

это могло бы быть разумной просьбой, если бы у тебя был бы хоть какой-то опыт, но ты приперся сюда с уровнем ниже джуна с представлением, что в хранилища заливают данные в рамках единой транзакции и с вбросом "БигДаты явно не для строгой отчетности". прости, но ты сюда приперся и я чувствую обязанным тебя подтянуть хотя бы на уровень джуна.
...
Рейтинг: 0 / 0
06.11.2021, 12:17
    #40109627
AData
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
Вообще, похоже не зря в Хадупе сервисы с животными ассоциируют. Ибо это лютый зоопарк. В Hive, например, добавили функционал транзакционных таблиц - однако Spark корректно с ними не работает. Способов прострелить себе ногу неисчислимое количество.
Справедливости ради надо сказать, что нормальное решение все-таки появилось. Delta Lake от Databricks решает проблемы. Но они его только в облаках предлагают. Amazon и Microsoft тоже у себя в облаке дают. В дистрибутивах у Cloudera его нету. И как его у себя поднимать - надо разбираться. Но по крайней мере - это должно нормально работать.
...
Рейтинг: 0 / 0
06.11.2021, 13:24
    #40109632
H5N1
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
джун, вещать о зоопарке в хадупах в эпоху, когда майкрософт нахлабучила файлики mssql на тот же самый хадуп, вкрячив сбоку тот же самый спарк и проталкивает это как вершину тяжелой аналитики azure synapse/sql server big data edition - это мощно. снова совет не ляпнуть на собесе.
на хадупах сейчас три серьезные либы вокргу parquet формата Hudi, Iceberg, Delta от датабликса. опенсоурсную Delta от датабрикса мы уже год-полтора пользуем на cloudera, как сторидж для спарка он неплох, но ни hive ни impala этот формат не понимают и интегрировать нереально. но главное - ни одна из этих трех, включая датабрикс не обеспечивает атомарности далее одной таблицы, т.е. все так же как в реальной жизни на легаси рдбмс - acid на запись в одну таблицу. в эпоху стриминга и массивно-параллельности это и нафиг никому не надо, в том числе и деньги считать. что на легаси рдбмс, что у датабрикс облаке.
...
Рейтинг: 0 / 0
02.12.2021, 00:27
    #40116584
мигель1
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение/процессинг выбрать для построения OLAP кубов
H5N1,

щас тестим Hudi, Iceberg, Delta

худи говорят пободрее, будет проверять )
...
Рейтинг: 0 / 0
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / Какое решение/процессинг выбрать для построения OLAP кубов / 25 сообщений из 26, страница 1 из 2
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]