Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / какие кубы выбрать? / 25 сообщений из 31, страница 1 из 2
03.09.2015, 09:17
    #39042049
fduch f.f.
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
нужно сделать куб.
пока предполагается 3 меры и 15 дименшинов
в нем будет около 5 миллиардов строк
раньше работал только с Multidimentional, но сейчас Микрософт их не развивает
думаю сделать на Tabular

какие могут быть нюансы на таких объемах данных?
...
Рейтинг: 0 / 0
03.09.2015, 11:03
    #39042175
George Nordic
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
fduch f.f., а на MS жесткая завязка? Попробуйте in-memory, тот же Qlik такую простую модель сожрет и не поморщится, и 5млрд строк будут шустро отрабатывать на довольно простом железе. Ну, можем поэксперементировать, если есть желание, о результатах поделитесь.

С Уважением,
Георгий.
...
Рейтинг: 0 / 0
03.09.2015, 11:07
    #39042184
a_voronin
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
fduch f.f.нужно сделать куб.
пока предполагается 3 меры и 15 дименшинов
в нем будет около 5 миллиардов строк
раньше работал только с Multidimentional, но сейчас Микрософт их не развивает
думаю сделать на Tabular

какие могут быть нюансы на таких объемах данных?

На Tabular ограничения пол размерам и параллельность обещали только в 2016. Tabular задуман как простая технология для не таких больших объемов. Делайте MOLAP и хорошо продумывайте партиционирование.

Можно подумать про партиционированный COLUMSTORE с кубом на ROLAP партициях.

Также посмотрите, может вы сможете предагрегировать данные и уменьшить число строк.
...
Рейтинг: 0 / 0
03.09.2015, 11:21
    #39042200
fduch f.f.
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
George Nordicfduch f.f., а на MS жесткая завязка? Попробуйте in-memory, тот же Qlik такую простую модель сожрет и не поморщится, и 5млрд строк будут шустро отрабатывать на довольно простом железе. Ну, можем поэксперементировать, если есть желание, о результатах поделитесь.

С Уважением,
Георгий.

MS стек у нас куплен, а Qlik же не бесплатный
но попробовать было бы интересно если там хотя бы триал бесплатный есть
...
Рейтинг: 0 / 0
03.09.2015, 11:24
    #39042205
fduch f.f.
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
a_voroninfduch f.f.нужно сделать куб.
пока предполагается 3 меры и 15 дименшинов
в нем будет около 5 миллиардов строк
раньше работал только с Multidimentional, но сейчас Микрософт их не развивает
думаю сделать на Tabular

какие могут быть нюансы на таких объемах данных?

На Tabular ограничения пол размерам и параллельность обещали только в 2016. Tabular задуман как простая технология для не таких больших объемов. Делайте MOLAP и хорошо продумывайте партиционирование.

Можно подумать про партиционированный COLUMSTORE с кубом на ROLAP партициях.

Также посмотрите, может вы сможете предагрегировать данные и уменьшить число строк.

партиционированный COLUMSTORE уже есть.
Предполагается делать еще MOLAP с партициями, не знаю какие у ROLAP преимущества? разве что процессить не нужно ?
...
Рейтинг: 0 / 0
03.09.2015, 11:52
    #39042255
a_voronin
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
fduch f.f.a_voroninпропущено...


На Tabular ограничения пол размерам и параллельность обещали только в 2016. Tabular задуман как простая технология для не таких больших объемов. Делайте MOLAP и хорошо продумывайте партиционирование.

Можно подумать про партиционированный COLUMSTORE с кубом на ROLAP партициях.

Также посмотрите, может вы сможете предагрегировать данные и уменьшить число строк.

партиционированный COLUMSTORE уже есть.
Предполагается делать еще MOLAP с партициями, не знаю какие у ROLAP преимущества? разве что процессить не нужно ?

COLUMSTORE + MOLAP -- это неправильно и не оптимально

COLUMSTORE + ROLAP -- это правильно

MOLAP делает прямолинейные сканы всех строк в партиции и COLUMSTORE на них не оптимален

ROLAP -- будет хорошо работать на сильно отфильтрованных данных. Но не так хорошо как на большом объеме (агрегации всей партии).
...
Рейтинг: 0 / 0
03.09.2015, 11:54
    #39042257
a_voronin
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
...
Рейтинг: 0 / 0
03.09.2015, 13:23
    #39042471
George Nordic
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
fduch f.f.MS стек у нас куплен, а Qlik же не бесплатныйДа, увы, это так и есть. Поэтому и спросил первым делом про MS - не куплен ли. fduch f.f.но попробовать было бы интересно если там хотя бы триал бесплатный естьДа есть бесплатный триал, только Вам придется серверную лицензию генерировать - не уверен, что 5 млрд на компе заработает :) Это чеки? Они хорошо жмутся, но все равно in-memory модель без агрегирования (полная) может отъесть как минимум 32, а то и все 64Гб оперативки. Но не проблема - настроим / проверим.

Если что - georgend@mail.ru
Георгий
...
Рейтинг: 0 / 0
03.09.2015, 13:45
    #39042520
a_voronin
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
George Nordic,

Сколько времени Qlik будет 5 лярдов переваривать?

Как он работает с инкрементальным обновлением?

И коронный вопрос, а он справляется с обновлением данных задним числом? DELETE ? UPDATE ?
...
Рейтинг: 0 / 0
03.09.2015, 21:32
    #39042851
Jurii
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
Думаю стоит потестировать кубы IBM Cognos BI - виртуальные кубы Dynamic Cubes с настройкой кэширования агрегатов, и физические кубы Transformer с секционированием. Тогда и проблем с созданием отчетов не будет.
...
Рейтинг: 0 / 0
03.09.2015, 21:49
    #39042860
babona
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
Автор топика про MS BI стек спрашивает, поскольку в компании закуплен. А консультанты-маркетологи ему предлагают попробовать других вендоров. Вот уж действительно.... :)
Как будто Автор топика принимает решения о закупках и владеет бюджетами.
Ну тогда до кучи попробуйте Oracle Exadata - для 5 млрд. строк и кубы не нужны будут
...
Рейтинг: 0 / 0
03.09.2015, 22:19
    #39042879
Критик
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
fduch f.f.,

собственно, есть только один вариант - Multidimentional,
на Tabular или памяти не хватит прямо сейчас, или не будет хватать чуть позже, когда пользователи захотят развития куба
...
Рейтинг: 0 / 0
04.09.2015, 00:33
    #39042960
Jurii
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
2 babona:

Автор топика про MS BI стек спрашивает, поскольку в компании закуплен. А консультанты-маркетологи ему предлагают попробовать других вендоров. Вот уж действительно.... :)
Как будто Автор топика принимает решения о закупках и владеет бюджетами.


Автор топика хочет увеличить свои доходы, и снизить расходы своей компании. Вот местные гуру ему и дают дельные советы.
...
Рейтинг: 0 / 0
04.09.2015, 11:16
    #39043197
a_voronin
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
Jurii2 babona:

Автор топика про MS BI стек спрашивает, поскольку в компании закуплен. А консультанты-маркетологи ему предлагают попробовать других вендоров. Вот уж действительно.... :)
Как будто Автор топика принимает решения о закупках и владеет бюджетами.


Автор топика хочет увеличить свои доходы, и снизить расходы своей компании. Вот местные гуру ему и дают дельные советы.

Наймите babona он вам все оптимизирует ибо он считает себя наиболее крутым.
...
Рейтинг: 0 / 0
04.09.2015, 12:17
    #39043276
Jurii
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
2 a_voronin:

Наймите babona он вам все оптимизирует ибо он считает себя наиболее крутым.

Г-н babona стесняется своих постов, проявляет неуверенность в себе таким образом. Надеется, что технологии Big Data не смогут раскрыть его анонимность. А зря ;)
...
Рейтинг: 0 / 0
06.09.2015, 21:50
    #39044426
Владимир Штепа
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
fduch f.f.нужно сделать куб.
пока предполагается 3 меры и 15 дименшинов
в нем будет около 5 миллиардов строк
раньше работал только с Multidimentional, но сейчас Микрософт их не развивает
думаю сделать на Tabular

какие могут быть нюансы на таких объемах данных?

куб кубу рознь. можно сделать на всех перечисленных технологиях. ньюансы будут на всех.

какого типа будет куб? transaction, periodic snapshot, cumulative snapshot? на сколько разнообразные вычисления?

количество фактов не проблема. какие измерения предполагаются?

Если измерения больше 200 млн то molap не комильфо будет.
На сколко критично время полного процессинга и есть ли изменения задним числом?
...
Рейтинг: 0 / 0
22.09.2015, 14:54
    #39058419
George Nordic
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
a_voroninGeorge Nordic, Сколько времени Qlik будет 5 лярдов переваривать? Как он работает с инкрементальным обновлением?
И коронный вопрос, а он справляется с обновлением данных задним числом? DELETE ? UPDATE ?
1. Вот история еще "Копейки", теперь это решение работает в Х5 . Единственное, которое они оставили после поглощения. Только проект уже далеко ушел :) Анализ всех чеков подобной группы - это поболее означенной Вами цифры будет, и все резво работает. Но схема данных на таком объеме - очень проста. И, сами понимаете, можно разглашать только то, что согласовал и разрешил опубликовать Заказчик. Многие считают подобные технологии серьезным конкурентным преимуществом. Например, как Магнит .
Инкрементальная загрузка есть. Грузится diff, если вы можете четко указать, где был diff по DELETE / UPDATE (по recId или ModifiedDate etc), то проблем нет. Но иногда данные перегружают по закрытию месяца. Это уже вопрос конкретной архитектурной реализации.

С Уважением,
Георгий
...
Рейтинг: 0 / 0
09.10.2015, 11:30
    #39072739
fduch f.f.
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
Владимир Штепаfduch f.f.нужно сделать куб.
пока предполагается 3 меры и 15 дименшинов
в нем будет около 5 миллиардов строк
раньше работал только с Multidimentional, но сейчас Микрософт их не развивает
думаю сделать на Tabular

какие могут быть нюансы на таких объемах данных?

куб кубу рознь. можно сделать на всех перечисленных технологиях. ньюансы будут на всех.

какого типа будет куб? transaction, periodic snapshot, cumulative snapshot? на сколько разнообразные вычисления?

количество фактов не проблема. какие измерения предполагаются?

Если измерения больше 200 млн то molap не комильфо будет.
На сколко критично время полного процессинга и есть ли изменения задним числом?

нужно хранить данные о транзакциях, вычисления пока простые, но будут усложняться
измерения не большие , десятки тысяч строк
изменений задним числом не будет, однако потребуется расширение таблицы фактов в перспективе
время полного процессинга очень критично, данные должны быть доступны каждый день
...
Рейтинг: 0 / 0
09.10.2015, 11:35
    #39072747
fduch f.f.
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
сейчас строк порядка 5 миллиардов, но в год объем будет удваиваться
учитывая что микрософт на развивает больше SSAS Multidimentional, то может вообще не стоит с ним связываться?

платные продукты не микрософт рассматривать не можем

может при таких объемах пора смотреть на бигдату? что-то типо HBase, Hadoop?
...
Рейтинг: 0 / 0
09.10.2015, 11:37
    #39072751
fduch f.f.
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
вообще что микрософт позиционирует в качестве альтернативы Multidimentional ?
Tabular для систем уровня отдела
а что для масштаба большого предприятия?
...
Рейтинг: 0 / 0
09.10.2015, 12:11
    #39072796
essbase.ru
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
fduch f.f.HBase, Hadoop
это не уровень анализа данных. это ниже - это уровень доступа к данным.
...
Рейтинг: 0 / 0
09.10.2015, 12:45
    #39072846
vikkiv
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
как мне тут уже намекали BigData не о объёмах а о структурах данных (т.е. как минимум слабоструктурированные)
а ваши объёмы решаются и на MS платформе при разумной организации, тем более что это не трансакционная база а хранилище следовательно оптимизируйте на хранение/чтение а не на запись (OLTP) и дальше уже по прямому предназначению для агрегаций >> OLAP/SSAS
да и MDX может и особо не развивается - но имеющейся функциональности вполне достаточно, вопрос только в уровне владения.
...
Рейтинг: 0 / 0
09.10.2015, 14:15
    #39072956
a_voronin
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
fduch f.f.,

Мы прекрасно продолжаем использовать Multidimentional . И Tabular тоже есть.
...
Рейтинг: 0 / 0
12.10.2015, 11:50
    #39074325
fduch f.f.
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
по идее меня все в Multidimentional устраивает
однако смущает то что невозможно горизонтальное масштабирование
вот будет таблица фактов 100 миллиардов, то что делать тогда?
непонятно как оптимизировать
...
Рейтинг: 0 / 0
12.10.2015, 12:54
    #39074393
babona
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
какие кубы выбрать?
fduch f.f.по идее меня все в Multidimentional устраивает
однако смущает то что невозможно горизонтальное масштабирование
вот будет таблица фактов 100 миллиардов, то что делать тогда?
непонятно как оптимизировать

а оно точно Вам точно надо 100 млрд. ?
...
Рейтинг: 0 / 0
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / какие кубы выбрать? / 25 сообщений из 31, страница 1 из 2
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]