powered by simpleCommunicator - 2.0.30     © 2024 Programmizd 02
Map
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / Какое решение/процессинг выбрать для построения OLAP кубов
25 сообщений из 26, страница 1 из 2
Какое решение/процессинг выбрать для построения OLAP кубов
    #40082415
posdev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Доброго времени суток.
Архитектура: https://prnt.sc/19ae6qg
1) DWH - Clickhouse.
2) процессинг - ?? Для процессинга кубов рассматриваю SQL Server Analysis services (SSAS) и Cube Wizard(от apache kylin).
3) UI - Tableau

Подскажите, какое решение/процессинг выбрать для построения OLAP кубов в связке Clickhouse и Tableau?
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40082422
Bigheadman
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
posdev
Подскажите, какое решение/процессинг выбрать для построения OLAP кубов в связке Clickhouse и Tableau?
Учтите , что SSAS не поддерживает Clickhouse в качестве источника данных.
Поддерживаемые источники для табулярных моделей
Поддерживаемые источники для многомерных моделей
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40082425
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
posdev,

Зачем вам SSAS и Clickhouse одновременно?
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40082426
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Да и вообще у вас довольно странное представление о вычислительном слое )
Я бы отнес кубы к визуализации
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40082599
Ivan Durak
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
накой тебе вообще ssas. Эксельки заполнять?
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40082651
Фотография George Nordic
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
posdev, 2 варианта, или ставьте Вертику, но надо проверить как она забирать из Clickhouse будет. Или, как в Вымпелкоме, просто поставите поверх Clickhouse Qlik Sense - он прекрасно данные забирает и сам формирует промежуточные слои. У вас будет настоящий Self-Service BI, не будет узкого горлышка в виде аналитического отдела, который всем отчеты на табло паяяет (как было в Билайне, пока указанный продукт просто не выкинули).

С Уважением,
Георгий
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40082660
Ivan Durak
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ну про селф-сервис на клике можете тоже даже не начинать
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40082664
Фотография a_voronin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Bigheadman
posdev
Подскажите, какое решение/процессинг выбрать для построения OLAP кубов в связке Clickhouse и Tableau?
Учтите , что SSAS не поддерживает Clickhouse в качестве источника данных.
Поддерживаемые источники для табулярных моделей
Поддерживаемые источники для многомерных моделей


А что Microsoft никак не может приконнектиться к clickhouse -- ни через LinkedServer ни через коннекшн?
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40082687
bideveloper
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
posdev,

а что вы собираетесь делать в Computer layer? Tableau разве сам не может делать расчеты для отчетов?
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40082731
Фотография George Nordic
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
bideveloper
Tableau разве сам не может делать расчеты для отчетов?
У него кеширование есть, но слабое. Т.е. чем быстрее источник отдаёт данные, тем быстрее все работает.
Ivan Durak
ну про селф-сервис на клике можете тоже даже не начинать
Я говорил и не раз - по свидетельству компаний, которые понимают что такое НАСТОЯЩИЙ Self-Service, и развернули самообслуживание на сотни, тысячи и десятки тысяч пользователей, это единственная система, в которой пользователи сами могут паять себе отчеты, не бегая каждую минуту к IT или аналитический отдел. А в X5, Магнит, РГС, Сбербанке, Вымпелкоме и еще в десятках крупных компаний - было куча BI решений. Теперь проблема - грамотность работы с данными. Дать инструмент - мало, надо научить кучу пользователей им пользоваться. Вот как это выглядит в "Билайне". Думаю, многим будет полезно:

YouTube Video
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40082754
Santa89
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Нафига кубы и Табло если табло сам умеет агрегировать данные в свои экстракты и строить отчеты уже по ним, не обращаясь к базе?
мы поэтому от кубов и ушли.
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40082809
Фотография товарищъ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
posdev,
поверх clickhouse используют pentaho mondrian - Достаточно успешно, и получают куб и XML/A, MDX для разных BI тулов... поищите
например https://altinity.com/blog/accessing-clickhouse-from-excel-using-mondrian-rolap-engine
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40083176
мигель1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
товарищъ,

там очень ограниченный функционал, нет многие ко многим, итд

максимум 1 мера и кучка справочников
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40083178
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
По mondrian тут почти нет топиков, что явно говорит о его "популярности"
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40108106
AData
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Товарищи, а может кто-то объяснить как удается использовать ClickHouse в качестве DWH?

Ну ведь нет там строгой consistency.
Да, клики считать - ОК. Какую-то служебную инфу (вечно любят логи вспоминать, как будто в этих логах бизнес ценность имеется) - хорошо. Всякие маркетинговые компании или поведение клиентов - тоже гуд. Но как там цифры по реальным платежам можно держать?

Итого, по моему скромному мнению, ClickHouse хорош для определенных витрин. Но никак не для DWH. Объясните где я неправ?
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40108904
KAB
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AData,

У нас CH используется совместно с традиционным SQL DWH.
Если какие-то строки удалены(это можно узнать сравнив изменения из источника с текущими данными в SQL) пишем "антистроки" в CH, они обнуляют ранее записанное.
В самом КХ таблица на движке MergeTree(в ней вся история изменений в нее и грузим строки) и на ней основывается MV с движком ReplacingMergeTree, с уникальным ключом(например ИД документа, строка) и в ней уже текущие данные.
Если все это сделать корректно, оно вполне работает.
Плюс КХ, что он очень быстро обрабатывает запросы, разгружается основное хранилище и рады любители всяких новых модных технологий.
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40109072
AData
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
KAB,
"Если все это сделать корректно, оно вполне работает."
Что значит корректно?
Логирования в КХ нету, транзакций нету, синхронной записи на диск тоже. То есть это на уровне архитектуры невозможно сделать. Да, снизить вероятность проблем можно, но критичные данные точно стоят таких рисков?

Собственно ко всяким Хадупам такие же претензии. Все эти БигДаты явно не для строгой отчетности.
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40109096
H5N1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AData

Собственно ко всяким Хадупам такие же претензии. Все эти БигДаты явно не для строгой отчетности.

на собесе только такое не ляпни, засмеют.
в хадупах пишут в темп фолдер, а потом атомарной командой ренеймят фолдер. т.е. все совершенно консистентно и зачастую более консистентно чем танцы с exchange partition какие приходится устраивать в реляционках. на сколько я помню в оракле exchange partition это ddl обрывающий транзакцию.
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40109194
AData
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
H5N1, судя по хамоватому общению и актуальности собеседований - из молодых хуру?

Currently, Impala does not support multi-statement transactions
Ну то есть атомарный Insert пройдет а batch уже нет. С Hive аналогично
Update через Kudu который в свою очередь
Kudu currently does not enforce strong consistency during concurrent DML operations, be aware that the results after this statement finishes might be different than you intuitively expect

HDFS архитектурно не поддерживает изменений, ровно поэтому приходится
в хадупах пишут в темп фолдер, а потом атомарной командой ренеймят фолдер
С другой стороны, если мне нужно 100 строк добавить в много-миллионную таблицу, то перезаписывать ее полностью - это конечно красивое и правильное решение.
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40109195
H5N1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AData
H5N1, судя по хамоватому общению и актуальности собеседований - из молодых хуру?

Currently, Impala does not support multi-statement transactions
Ну то есть атомарный Insert пройдет а batch уже нет. С Hive аналогично
Update через Kudu который в свою очередь
Kudu currently does not enforce strong consistency during concurrent DML operations, be aware that the results after this statement finishes might be different than you intuitively expect

HDFS архитектурно не поддерживает изменений, ровно поэтому приходится
в хадупах пишут в темп фолдер, а потом атомарной командой ренеймят фолдер
С другой стороны, если мне нужно 100 строк добавить в много-миллионную таблицу, то перезаписывать ее полностью - это конечно красивое и правильное решение.

если тебе нужно 100 строк добавить то ты промахнулся форумом. я из старых, что только тут такой молодняк добрых лет 15 троллит.
итак, если ты думаешь, что серьезные хранилища на рсубд заливают данные в единой транзакции то тебя на собесе ждет сюрприз и волчий билет.
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40109229
AData
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
H5N1,
чувак, если хочешь чтобы с тобой общались - научись это делать вежливо. И подлечи уже свою психологическую травму после собеседований. Слишком бросается в глаза. С моей стороны - игнор.
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40109233
H5N1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AData

чувак, если хочешь чтобы с тобой общались - научись это делать вежливо. И подлечи уже свою психологическую травму после собеседований. Слишком бросается в глаза. С моей стороны - игнор.

это могло бы быть разумной просьбой, если бы у тебя был бы хоть какой-то опыт, но ты приперся сюда с уровнем ниже джуна с представлением, что в хранилища заливают данные в рамках единой транзакции и с вбросом "БигДаты явно не для строгой отчетности". прости, но ты сюда приперся и я чувствую обязанным тебя подтянуть хотя бы на уровень джуна.
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40109627
AData
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Вообще, похоже не зря в Хадупе сервисы с животными ассоциируют. Ибо это лютый зоопарк. В Hive, например, добавили функционал транзакционных таблиц - однако Spark корректно с ними не работает. Способов прострелить себе ногу неисчислимое количество.
Справедливости ради надо сказать, что нормальное решение все-таки появилось. Delta Lake от Databricks решает проблемы. Но они его только в облаках предлагают. Amazon и Microsoft тоже у себя в облаке дают. В дистрибутивах у Cloudera его нету. И как его у себя поднимать - надо разбираться. Но по крайней мере - это должно нормально работать.
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40109632
H5N1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
джун, вещать о зоопарке в хадупах в эпоху, когда майкрософт нахлабучила файлики mssql на тот же самый хадуп, вкрячив сбоку тот же самый спарк и проталкивает это как вершину тяжелой аналитики azure synapse/sql server big data edition - это мощно. снова совет не ляпнуть на собесе.
на хадупах сейчас три серьезные либы вокргу parquet формата Hudi, Iceberg, Delta от датабликса. опенсоурсную Delta от датабрикса мы уже год-полтора пользуем на cloudera, как сторидж для спарка он неплох, но ни hive ни impala этот формат не понимают и интегрировать нереально. но главное - ни одна из этих трех, включая датабрикс не обеспечивает атомарности далее одной таблицы, т.е. все так же как в реальной жизни на легаси рдбмс - acid на запись в одну таблицу. в эпоху стриминга и массивно-параллельности это и нафиг никому не надо, в том числе и деньги считать. что на легаси рдбмс, что у датабрикс облаке.
...
Рейтинг: 0 / 0
Какое решение/процессинг выбрать для построения OLAP кубов
    #40116584
мигель1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
H5N1,

щас тестим Hudi, Iceberg, Delta

худи говорят пободрее, будет проверять )
...
Рейтинг: 0 / 0
25 сообщений из 26, страница 1 из 2
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / Какое решение/процессинг выбрать для построения OLAP кубов
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]