|
|
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
Вот смотрю, что MS уже практически не развивают MOLAP . Сам сейчас перехожу на ROLAP, ибо держать 100+ измерений на на МОЛАПе - самоубийство. Я так понимаю, что MS хочет всех перевести на Tabular. Вообще чем пользуются местные олаперы или что планируют пробовать/изучать в 2017+? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.01.2017, 19:04 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
SkyTodВот смотрю, что MS уже практически не развивают MOLAP . Сам сейчас перехожу на ROLAP, ибо держать 100+ измерений на на МОЛАПе - самоубийство. Я так понимаю, что MS хочет всех перевести на Tabular. Вообще чем пользуются местные олаперы или что планируют пробовать/изучать в 2017+? Делать кубы в 100+ измерений - вот это самоубийство ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.01.2017, 20:51 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
T87, ну почему, если это измерения не одного куба а нескольких для какой-то SSAS:DB - то ничего особенного, обычное дело в крупной корпоративной среде (с контролем версий и множеством разных команд разработчиков под разные департаменты, релизы вообще ещё то развлечение), неудобство в том что измерения в памяти хранятся - и с ростом их ширины/глубины требования к памяти растут , к тому-же множество клиентов типа Excel можно сказать гениальны по способностям конструировать MDX запросы {но конечно лучше чем ничего/без них}, так что crossjoin-ы получаются ого какие, и только потом non empty на оси - т.к. на стороне ETL это не всегда решаемо (а Degenerate очень затратно) - приходится потом делать автоматизацию подмены источника и Process Update на полупустые измерения из nonempty очищеных таблиц делать.. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.01.2017, 22:37 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
T87Делать кубы в 100+ измерений - вот это самоубийство Что предлагаете? Плодить кубы на каждую бизнес задачу? Я загнусь их поддерживать. У меня все крутится вокруг продаж, что по сути является одной большой группой мер. Копировать их на каждый куб - это большие затраты на расчет каждого куба для MOLAP. А разные заказчики хотят, увидеть все что угодно: смс в разрезе текста, звонки в разрезе двух номеров, цены в разрезе определенных промежутков… ROLAP решает эту проблему тем, что не надо вычислять группы мер. Сделал легкий процесс базы и вуаля. С MOLAP сложнее: пришлось покупать SSD, ибо он не справляется с вычислением измерений, групп мер, изменения xmla и еще получения данных (всякие большие MDX). Кстати, только после года использования я понял, что MDX - зло. Сначала я его очень любил, но когда начал чуть ли не везде его использовать (чего там - рантайм же), а тысячи пользователи материть, что все тупит, то я понял одну хорошую практику: 1. Считай все в DWH. 2. Если надо MDX, то не используй всякие сетовые функции (Sum, NonEmpty, Filter, Existing и тому подобные). Поэтому и возник вопрос, есть ли смысл учить DAX? Или Tabular на практике тоже не очень? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.01.2017, 01:13 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
SkyTod, 1. 100+ измерений -> может какие-то можно объединить в одно измерение 2. Посмотрите Profiler-ом какие запросы ROLAP пуляет и как эти запросы будут отрабатываться на 0,5-1 млрд. записей 3. так по пробуйте Tabular на больших объемах и потом расскажите как у Вас получилось ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.01.2017, 01:51 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
SkyTodT87Делать кубы в 100+ измерений - вот это самоубийство Что предлагаете? Плодить кубы на каждую бизнес задачу? Я загнусь их поддерживать. У меня все крутится вокруг продаж, что по сути является одной большой группой мер. Копировать их на каждый куб - это большие затраты на расчет каждого куба для MOLAP. А разные заказчики хотят, увидеть все что угодно: смс в разрезе текста, звонки в разрезе двух номеров, цены в разрезе определенных промежутков… ROLAP решает эту проблему тем, что не надо вычислять группы мер. Сделал легкий процесс базы и вуаля. С MOLAP сложнее: пришлось покупать SSD, ибо он не справляется с вычислением измерений, групп мер, изменения xmla и еще получения данных (всякие большие MDX). Кстати, только после года использования я понял, что MDX - зло. Сначала я его очень любил, но когда начал чуть ли не везде его использовать (чего там - рантайм же), а тысячи пользователи материть, что все тупит, то я понял одну хорошую практику: 1. Считай все в DWH. 2. Если надо MDX, то не используй всякие сетовые функции (Sum, NonEmpty, Filter, Existing и тому подобные). Поэтому и возник вопрос, есть ли смысл учить DAX? Или Tabular на практике тоже не очень? Ну не видя конкретныхзадач, предлагать что-то конкретное глупо. Навскидку: Объединение измерений по смыслу (я например не могу представить 100+ дименшенов для продаж), делать Junk для мелких дименшенов. По поводу MDX - во многом согласен, по возможности все выносить на DWH. По tabular 2016 ничего не могу сказать, но 2014 на мой взгляд очень не дотягивал до multidim. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.01.2017, 09:53 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
Alex_4961. 100+ измерений -> может какие-то можно объединить в одно измерениеТо есть увеличить количество атрибутов? Шило на мыло, как по мне. Alex_4962. Посмотрите Profiler-ом какие запросы ROLAP пуляет и как эти запросы будут отрабатываться на 0,5-1 млрд. записейЭто да. Как, кстати, в этом плане в HOLAP? Hadoop кто использовал для таких задач? Или затратно? Все-таки 2017 год. Alex_4963. так по пробуйте Tabular на больших объемах и потом расскажите как у Вас получилосьВы даже отняли у меня желание попробовать. :) T87Ну не видя конкретныхзадач, предлагать что-то конкретное глупо. Навскидку: Объединение измерений по смыслу (я например не могу представить 100+ дименшенов для продаж), делать Junk для мелких дименшенов.Я приводил примеры выше, они не всегда связаны с продажей напрямую. Например, надо посмотреть сколько клиентов начали заказывать определенное SKU после того, как получили смс с текстом (а фильтр текста - это отдельное измерение). Таких примеров тысячи. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.01.2017, 15:38 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
SkyTod, Атрибуты можно делать свойствами, выйгрыш в производительности очень большой. Если бы Вы показали свою матрицу шины, то можно было бы боллее предметно поговорить, а так разговор сферическом коне в вакууме ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.01.2017, 16:18 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
Делать кубы в 100+ измерений - вот это самоубийство Всецело поддерживаю ! А разные заказчики хотят, увидеть все что угодно: смс в разрезе текста, звонки в разрезе двух номеров, цены в разрезе определенных промежутков… Я конечно могу заблуждаться, но (M/R/H)OLAP немного для других вещей - считать фиксированные значения для различных уровней измерений ( или как комбинации измерений ) в разрезе времени . Для этого MDX и нужен. А вот для того, чтобы оценить "сколько клиентов начали заказывать определенное SKU после того, как получили смс с текстом" подойдёт скорее вот это. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.01.2017, 18:59 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
T87Если бы Вы показали свою матрицу шины, то можно было бы боллее предметно поговорить, а так разговор сферическом коне в вакуумеЕсли действительно так интересно, то могу расписать, но это займет много времени. И скорее всего мы придем к тому, что их объединять нет смысла. RioMareЯ конечно могу заблуждаться, но (M/R/H)OLAP немного для других вещей - считать фиксированные значения для различных уровней измерений ( или как комбинации измерений ) в разрезе времени . Для этого MDX и нужен. А вот для того, чтобы оценить "сколько клиентов начали заказывать определенное SKU после того, как получили смс с текстом" подойдёт скорее вот это. Мне DataMining не прижился, а тупому пользователю нужно зайти в ексельку и увидеть отчет в том разрезе, что он хочет. И я все чаще вынужден наоборот: выносить атрибуты в отдельное измерение, чем играться в SlowChanging Dimensions и DataMining. И пусть это будет MDX, но все равно измерение надо добавлять. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.01.2017, 19:57 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
Имхо, olap (не зависимо какая буква стоит впереди) умер как технология. Приход дешёвой памяти сильно изменил рынок. А текущие бизнес потребности (всё большие скорости принятия решений, машинное обучение и тд и тп) окончательно расставили точки над Ё. Будущее за MPP системами (куда включаю и NewSQL в том числе). У MDX-а могло быть будущее если бы MS стали развивать его в сторону параллельности, но походу "не успех" APS(PDW) не дал им шанса, собственно в сиквеле (который толкают вперёд) мы до сих пор не видим кластера. Что касается Tabular... в том виде (архитектурно) как есть сейчас это "уже умерло" хоть и не знает об этом.SkyTodHadoop кто использовал для таких задач?для каких "таких"? Экосистема "хадупа" довольно широка. Посмотрите на чём сидит Амазон, например. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.01.2017, 19:59 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
[quot T87]SkyTodпропущено... По tabular 2016 ничего не могу сказать, но 2014 на мой взгляд очень не дотягивал до multidim. Не всё сразу. Tabular допилят рано-вовремя-не очень поздно :) Допилят и DirectQuery под него. Понятно, что сложные проекты с Tabular сейчас не взлетят, т.к. функциональность не дотягивает до miltidim... Всему свое время, прогнозы пока рано делать, что уже, а что еще не умерло :) И еще, как тут уже сказали, не все задачи подряд нужно одним "молотком" забивать... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.01.2017, 22:09 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
ДедушкаИмхо, olap (не зависимо какая буква стоит впереди) умер как технология.Это как? Концепция же остается: возможность затем просматривать кубы без знания языков запросов. Какие здесь альтернативы? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.01.2017, 02:36 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
Дедушка, ну да, сервер HP BL660c Gen9 E5-4627v4 (40 cores, 1024GB RAM) = $44К и + дисковый массив на 7Tb без резервирования = $23К 32 планки по 16Гб, модель HP 672633-B21 = $8,6К ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.01.2017, 09:29 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
SkyTod, если хочется именно OLAP/MDX : Как я понимаю ваша задача обычная marketing automation - Измерение Nr.1 : [Marketing_campaing].[ID] где [ID] - это кому куда слали СМС с текстом/promo-code/ & etc. ну и факты соответственно [dateID].[marketing_campain_id].[customer_id].[итд_итп].[слали_СМС] ну и потом как-то так - Код: sql 1. 2. 3. 4. 5. 6. 7. 8. Зачем там 100 измерений ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.01.2017, 10:34 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
SkyTod, емнип, MS как изначально позиционировали Tabular "маленький объем/простота для вхождения в мир настоящего BI" так и оставили его в этом углу ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.01.2017, 12:16 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
StarikNavySkyTod, емнип, MS как изначально позиционировали Tabular "маленький объем/простота для вхождения в мир настоящего BI" так и оставили его в этом углу..походу при этом забросив развитие настоящего БИ (облачные попытки с миграцией на Azure/PDW пока сложно назвать особо выдающимися) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.01.2017, 12:25 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
SkyTod, а если из области общей эрудиции :) IMHO MS решили пойти по пути "заработаем $1 на миллионе клиентов, чем $1,000,000 на одном" и поэтому развивают продукты, которые можно продать миллиону, а остальные поддерживают в работоспособном состоянии. Поэтому SQL Server развивают, а Analysis Services - нет. ( поскольку он нужен одному, а не миллиону ) и через пару релизов в каком-нибудь SQL2020 его больше вообще поставлять не будут. А OLAP не умерла, просто стала узкоспециализированной - для объёмов, которые in-memory движки просто не тянут ( пока ). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.01.2017, 15:49 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
IMHO, MS вляпались в Agile, поэтому количество багов, порой самых грубо очевидных, в службах MS SQL 2016 стало больше, а коммуникация с MS в рамках премьер-поддержки => то ещё развлечение, столько времени отъедает на переписку. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.01.2017, 16:22 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
RioMareА OLAP не умерла, просто стала узкоспециализированной - для объёмов, которые in-memory движки просто не тянут ( пока ).ну я не рискну предположить какой объём данных не сможет вытянуть аналитика на Spark (например), shared nothing тож не просто так (не нужно всё тянуть в память на одном серваке) пример кластер Exasol ну и тд. Технология обработки данных на одном сервере (а в случае с MDX ещё и в один поток) не жилец (исключительно имхо). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.01.2017, 17:31 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
Дедушка, а может, команде-разработчиков SSAS Multidim не дали развивать проект? История об этом умалчивает, например, почему ушел Моша, причины нам не известны. Задачи типа задействования FE в несколько потоков - вряд ли концептуально не разрешимая. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.01.2017, 17:39 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
RioMareSkyTod, если хочется именно OLAP/MDX : Как я понимаю ваша задача обычная marketing automation - Измерение Nr.1 : [Marketing_campaing].[ID] где [ID] - это кому куда слали СМС с текстом/promo-code/ & etc. ну и факты соответственно [dateID].[marketing_campain_id].[customer_id].[итд_итп].[слали_СМС] ну и потом как-то так - Код: sql 1. 2. 3. 4. 5. 6. 7. 8. Зачем там 100 измерений ? Сотни измерений это я, конечно, перегнул, но такое количество вполне реально. Проблема в том, что мы разрабатываем куб для многих подразделений. Не только маркенг. Есть некоторые тексты, которые интересуют только маркетинг или только логистику или только менеджеров, а есть несколько подразделений одновременно. А еще есть партнеры, дочерние предприятия, куда тоже отдаются какую-то информацию. И они сами выбирать как фильтровать текст смс. Атрибутов в смс нет, кстати, просто текст. И это только одно измерение. У нас есть еще аналитика нескольких CRM, сайта, телефонии, которые могут иметь от 0 до 20 новых измерений, которых уже невозможно объединить с существующими (например, номера входящих и исходящих вызовов, канал вызова, оператор). Также иногда приходится дублировать два измерения (например, клиентов для задач, где один клиент привел другого клиента) и тд. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.01.2017, 18:04 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
ДедушкаТехнология обработки данных на одном сервере (а в случае с MDX ещё и в один поток) не жилец (исключительно имхо). Там же только формульный движок однопоточный, просто пишем меньше вычислений в кубе, и все будет нормально. Также при желании можно самому поднять ферму из olap-серверов после балансировщика. Конечно, это не идеальное решение, но это вполне работает на довольно больших объемах и с большим количеством пользователей. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.01.2017, 19:11 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
Хотя, и мне тоже не нравится нулевое развитие AS за последние годы ) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.01.2017, 19:12 |
|
||
|
The future for MOLAP
|
|||
|---|---|---|---|
|
#18+
SkyTodИ это только одно измерение. У нас есть еще аналитика нескольких CRM, сайта, телефонии, которые могут иметь от 0 до 20 новых измерений, которых уже невозможно объединить с существующими (например, номера входящих и исходящих вызовов, канал вызова, оператор). Также иногда приходится дублировать два измерения (например, клиентов для задач, где один клиент привел другого клиента) и тд. OLAP - это в первую очередь аналитическая отчетность, в кубах вы можете показывать только сгруппированные данные. Кого они не устраивают - добро пожаловать в детальную sql-витрину, пусть пишут adhoc-запросы. Номера входящих и номера исходящих при желании объединяются в одно измерние "номера телефонов". Аналогично с клиентами. Канал вызова, оператор - не должны вызвать никаких проблем, т.к. должны иметь крайне малую мощность. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.01.2017, 19:20 |
|
||
|
|

start [/forum/topic.php?fid=49&msg=39380620&tid=1858390]: |
0ms |
get settings: |
9ms |
get forum list: |
15ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
73ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
61ms |
get tp. blocked users: |
1ms |
| others: | 246ms |
| total: | 427ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...