powered by simpleCommunicator - 2.0.44     © 2025 Programmizd 02
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / Отличие OLAP-куба от витрины данных
20 сообщений из 45, страница 2 из 2
Отличие OLAP-куба от витрины данных
    #40066728
Фотография a_voronin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Витриный это исходные данные -- набор таблиц (а лучше вьюх), которые используется В ТОМ ЧИСЛЕ для построение кубов, а также отчетов и т.п.

Куб это сформированный набор агрегатов и измерений.

Куб это презентационный слой -- то, что смотрят юзера. Витрины это оформленные данные в самом хранилище (БД).
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40066787
Фотография StarikNavy
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
.Евгений
Может быть, просто меня прихватило приступом занудства, но .


вэком ту зе клаб ))

.Евгений

Речь идет не о какой-нибудь "Quick analytical processing", а об "On-Line". Данное слово характеризуется не столько быстротой вообще, сколько нахождением клиента в общем потоке действий, минимальной задержкой (смещением) относительно него.


как бы переводят "интерактивная", т.е. это и не про поток, и не про скорость, а про методику работы
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40066793
.Евгений
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
StarikNavy
вэком ту зе клаб ))
...
как бы переводят "интерактивная", т.е. это и не про поток, и не про скорость, а про методику работы

Вы серьезно?
Ну давайте обратимся к авторитету
Связанные с интернетом значения, очевидно, здесь не актуальны.
"connected to a system" или "using a computer to communicate with other computers, or of or about a computer that is connected to another computer:" т.е. включенные в общий обмен данными, а не изолированные на целый день?

Даже если это и выглядит натяжкой, то про взаимодействие с пользователем в целом и интерактивность в частности там ничего не сказано.
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40066800
Фотография George Nordic
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Такой заруб что не мимо не пройти

А права пользователям где давать? На витрину или все-таки в кубах? Давайте с этой стороны рассмотрим, и все станет на свои места.

С Уважением,
Георгий
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40066828
.Евгений
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
George Nordic
Такой заруб что не мимо не пройти

Терминологически-идеологические споры - одни из самых ожесточеннных.
Главное - это срезать их в реальной жизни фразой наподобие "Wer Jude ist bestimme ich!" ( "Я здесь решаю, кто еврей" )
George Nordic
А права пользователям где давать? На витрину или все-таки в кубах? Давайте с этой стороны рассмотрим, и все станет на свои места.

Я так не думаю. Давайте мысленно отделим или оставим заведомо неиспользуемым функционал раздачи прав в кубах. Оставшееся можно будет называть кубами или это будет по сути уже нечто иное?
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40066984
Фотография товарищъ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
a_voronin
Витриный это исходные данные -- набор таблиц
Куб это презентационный слой


мне больше понятно определение тут https://en.wikipedia.org/wiki/Data_mart
оно логично

витрина данных - это заранее подготовленное представление данных одной предметной области ориентированное на анализ данных. Обычно в витрине используется звезда с измерениями или снежинка. И куб в данном случае является специфической реализацией витрины данных.
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40067083
Фотография George Nordic
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
.Евгений
Давайте мысленно отделим или оставим заведомо неиспользуемым функционал раздачи прав в кубах. Оставшееся можно будет называть кубами или это будет по сути уже нечто иное?
Будет:
товарищъ
И куб в данном случае является специфической реализацией витрины данных.

.Евгений
Терминологически-идеологические споры - одни из самых ожесточеннных.
Правильно. Когда я вижу подобные споры, я считаю что все дело в том что все по-разному понимают определения. Поэтому лучше перефразировать на более общее:

____________________________________________/ [ODS]
Источники данных -> [возможно DataStage] -> DWH -> [возможно Витрина Данных] -> Аналитическое Хранилище Данных -> Визуализация
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~\ [HDS]

Здесь:
* Источники данных - думаю, всем понятно.
* DataStage - необходимо, но не обязательно. Видел когда напрямую в КХД данные из ERP льют (я и не такое видел, я видел как ERP как КХД использовали).
DWH - понятно.
ODS - необходимо для формирования оперативной отчетности. иногда прямо из DataStage собирают.
HDS - долгосрочно хранение информации. Иногда напрямую, иногда через ODS собирают - зависит от задач и набора данных.
DataMart, витрина данных - тоже очень желательно. Но иногда витрины данных собираются не в КХД, а сразу в ADWH. Тут тоже сильно зависит от задач и от архитектора. Витрина - это хорошо. Все данные по областям собраны и готовы к использованию (быстрой выгрузке). С другой стороны, лишняя цепочка, следить за актуальностью, чтобы данные не разъезжались, да изменение структуры DWH может привести и к пересобиранию витрин...
------------------
вот до этого этапа мы обычно о правах не думаем. Все данные [обычно] доступны, но доступны только избранных, ибо содержат очень чувствительную бизнес-информацию, пользователю не отдашь, максимум - дата-сатанисту.
------------------
из витрин данные попадают в ADWH. Куб как раз и представляет собой частный случай ADWH. Вот тут уже идут преобразования для быстрой работы с информацией - поколоночное хранение, группировки, агрегации. И тут уже настраиваются права доступа к данных.
Обратная ситуация, если DWH построена на технологиях, которые позволяют быстро выгружать информацию - Teradata / Exadata / Vertica и прочий гринплам то ADWH может стать лишним звеном и витрин будет достаточно, на них сразу можно дать права и сверху ставить "гляделку".
ну и сверху ADWH уже идет визуализация, с дополнительными настройками доступа к отчетам и данным.

Мнения, критика, дополнения?

С Уважением,
Георгий
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40067177
Фотография StarikNavy
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
.Евгений

Вы серьезно?
Ну давайте обратимся к авторитету
.

ок, был неправ, это наши уже нагородили.
Припадем к первоисточнику:
The term OLAP was created as a slight modification of the traditional database term online transaction processing (OLTP)

как мы видим, про "скорость" и "актуальность данных" нету никаких пояснений (как и в термине "OLTP" собственно тоже)
----

зы
Если есть Business Intelligence (BI), Business Stupidity тоже должно быть?
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40067187
Бумбараш
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
StarikNavy
.Евгений

Вы серьезно?
Ну давайте обратимся к авторитету
.

ок, был неправ, это наши уже нагородили.
Припадем к первоисточнику:
The term OLAP was created as a slight modification of the traditional database term online transaction processing (OLTP)

как мы видим, про "скорость" и "актуальность данных" нету никаких пояснений (как и в термине "OLTP" собственно тоже)
----

зы
Если есть Business Intelligence (BI), Business Stupidity тоже должно быть?


В OLTP онлайн значит, что транзации происходят онлайн.
В OLAP онлайн значит, что ты заходишь, и делаешь аналитику онлайн.

Вот и всё. Никаких противоречий тут нет.
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40067209
.Евгений
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
George Nordic
Будет:

Я вас правильно понял - вы действительно считаете, что удаление из куба информации о доступе пользователей сделает его витриной?
StarikNavy
ок, был неправ, это наши уже нагородили.
Припадем к первоисточнику:
The term OLAP was created as a slight modification of the traditional database term online transaction processing (OLTP)

Другими словами, бездумно скопировали. Что вполне совместимо с моим мнением: OLAP на самом деле не Online.
StarikNavy
Если есть Business Intelligence (BI), Business Stupidity тоже должно быть?
Не очень понял логику (почему должно быть), но демонстрацию соответствующего поведения наблюдал неоднократно.
Бумбараш
В OLTP онлайн значит, что транзации происходят онлайн.
В OLAP онлайн значит, что ты заходишь, и делаешь аналитику онлайн.

Вот и всё. Никаких противоречий тут нет.
А если куб посмел задуматься на хитровыдуманным запросом, то он уже не OLAP.
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40067220
Фотография George Nordic
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
.Евгений
Я вас правильно понял - вы действительно считаете, что удаление из куба информации о доступе пользователей сделает его витриной?
Я говорю несколько иное: куб - это частный случай аналитического хранилища данных, ADWH. Если удалить из куба группировки и пользователей, то чем он будет отличаться от DataMart? Тем что находится в другой БД? Ну, витрины тоже иногда выносят в отдельную схему или базу данных.

С Уважением,
Георгий
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40067235
.Евгений
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
George Nordic
Я говорю несколько иное: куб - это частный случай аналитического хранилища данных, ADWH. Если удалить из куба группировки и пользователей, то чем он будет отличаться от DataMart? Тем что находится в другой БД? Ну, витрины тоже иногда выносят в отдельную схему или базу данных.

Мне кажется, здесь выбран изначально порочный подход - определять частное через общее. Как если бы заявить, что прямая - вырожденный случай параболы. Формально оно, конечно, так - но на практике скорее отдалит от понимания, чем приблизит к нему.

Я считаю, что витрина данных - это заведомо таблица, имеющая реляционную физическую модель данных. Куб - напротив, либо имеет многомерную физическую структуру, либо имитирует ее для пользователя.
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40067329
s_ustinov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
.Евгений

Я считаю, что витрина данных - это заведомо таблица, имеющая реляционную физическую модель данных. Куб - напротив, либо имеет многомерную физическую структуру, либо имитирует ее для пользователя.

Я считаю, что витрина - это несколько представлений (таблиц).
Все данные объединять в одну таблицу - как то слишком жестокий способ убийства СУБД.

Но это мне так удобно классифицировать.
Если кто то скажет, что куб - это витрина данных - он тоже будет прав. Термины достаточно размытые.
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40067366
Гулин Федор
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
George Nordic
Такой заруб что не мимо не пройти

А права пользователям где давать? На витрину или все-таки в кубах? Давайте с этой стороны рассмотрим, и все станет на свои места.

С Уважением,
Георгий

Меня то вот больше всего заинтересовал вопрос прав

Если предположить что скажем SSAS кубы с своей сисетмой прав в кубах.

а витрины это набор таблиц и вью к которым идет доступ через SQL (я не делал в такой связке но знаю подход )
то как тогда права перенести с куба на датамарт

в простейшем случае давать на все - а если НЕТ ?
Если нужно тоже разделение прав
Дублировать как-то на SQL сильно хитро и долго
Если кто делал что-то похожее напишите про общий подход.
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40067381
bideveloper
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
.Евгений

Я считаю, что витрина данных - это заведомо таблица, имеющая реляционную физическую модель данных. Куб - напротив, либо имеет многомерную физическую структуру, либо имитирует ее для пользователя.

А мне кажется Георгий тут более прав.
Логически, витрина это набор данных из одной области из которых пользователям/разработчикам удобно извлекать информацию для отчетов. А физически это может быть набор таблиц, куб, или еще какая-нибудь модель.
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40067591
s_ustinov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
George Nordic
Поэтому лучше перефразировать на более общее:

____________________________________________/ [ODS]
Источники данных -> [возможно DataStage] -> DWH -> [возможно Витрина Данных] -> Аналитическое Хранилище Данных -> Визуализация
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~\ [HDS]

Здесь:
* Источники данных - думаю, всем понятно.
* DataStage - необходимо, но не обязательно. Видел когда напрямую в КХД данные из ERP льют (я и не такое видел, я видел как ERP как КХД использовали).
DWH - понятно.
ODS - необходимо для формирования оперативной отчетности. иногда прямо из DataStage собирают.
HDS - долгосрочно хранение информации. Иногда напрямую, иногда через ODS собирают - зависит от задач и набора данных.
DataMart, витрина данных - тоже очень желательно. Но иногда витрины данных собираются не в КХД, а сразу в ADWH. Тут тоже сильно зависит от задач и от архитектора. Витрина - это хорошо. Все данные по областям собраны и готовы к использованию (быстрой выгрузке). С другой стороны, лишняя цепочка, следить за актуальностью, чтобы данные не разъезжались, да изменение структуры DWH может привести и к пересобиранию витрин...
------------------
вот до этого этапа мы обычно о правах не думаем. Все данные [обычно] доступны, но доступны только избранных, ибо содержат очень чувствительную бизнес-информацию, пользователю не отдашь, максимум - дата-сатанисту.
------------------
из витрин данные попадают в ADWH. Куб как раз и представляет собой частный случай ADWH. Вот тут уже идут преобразования для быстрой работы с информацией - поколоночное хранение, группировки, агрегации. И тут уже настраиваются права доступа к данных.
Обратная ситуация, если DWH построена на технологиях, которые позволяют быстро выгружать информацию - Teradata / Exadata / Vertica и прочий гринплам то ADWH может стать лишним звеном и витрин будет достаточно, на них сразу можно дать права и сверху ставить "гляделку".
ну и сверху ADWH уже идет визуализация, с дополнительными настройками доступа к отчетам и данным.

Мнения, критика, дополнения?

Уточню для данных, связанных с ERP и похожих задач:
В источниках данных часто денормализованные данные. В DataStage аналогично - почти полностью повторяет структуру источника.
В DWH - предпочтительнее НФБК, якорная модель или что то аналогичное с высоким уровнем нормализации. Также обычно желательна "историчность" данных (SCD2), которая часто отсутствует в источниках или реализована не очень удобно для хранилища. Когда в основном хранилище делают звезду - тяжело добавлять новые объекты и многие сложные отчеты строить тяжелее, чем на табличках обычной модели.
Витрины - лучше делать в виде view (материализованных / индексированных), и если не получается - то в виде табличек. Если в дальнейшем данные из витрины выгружаются в Аналитическое Хранилище - то в схеме звезда.
Аналитическое Хранилище - обычно со схемой звезда делается, так как именно в таком виде данные наиболее "понятны" и удобны для пользователей без специальной подготовки.
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40067685
Charles Weyland
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
.Евгений
Не хотите ли вы сказать, что до 21 века никакой бизнес не был заинтересован принимать быстрые и обоснованные решения?

До 21 века бизнес просил сформировать отчёт и получал его через час, через сутки или через неделю, смотря кто её формировал и в какие сроки требуется.
А потом бизнес запрашивал уточнения и ждал ещё час, сутки или неделю.

Внедрение OLAP-кубов позволило бизнесу работать с аналитикой в диалоговом режиме: запросил - получил ответ, уточнил - снова ответ. Не данные в режиме онлайн, а работа с данными в режиме онлайн. А данные зачастую интересовали не те, которые только что получены, а сравнение итогов двух прошедших кварталов и прогноз на следующий год.
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40067696
Ivan Durak
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
так и есть.
А для другого имеется и другой термин - streaming
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40071618
Кесарь
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
StarikNavy
но обычно считается (используется подход) что "кубы" это сущность из следующего слоя за витриной


Да уж, видно что терминология не устоялась, ибо она парадоксальна.

Так по логике слов витрина - это последнее звено, представляющее потребителю необходимое. А если за ним следует ещё одно звено, то это уже странно. Имеется в виду для работы с информацией. В магазине витрина не последнее звено, но так там физические товары....


P.S. Ни на что не претендую, с этой областью только начал знакомиться.
...
Рейтинг: 0 / 0
Отличие OLAP-куба от витрины данных
    #40071627
Кесарь
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Charles Weyland
.Евгений
Не хотите ли вы сказать, что до 21 века никакой бизнес не был заинтересован принимать быстрые и обоснованные решения?

До 21 века бизнес просил сформировать отчёт и получал его через час, через сутки или через неделю, смотря кто её формировал и в какие сроки требуется.
А потом бизнес запрашивал уточнения и ждал ещё час, сутки или неделю.

Внедрение OLAP-кубов позволило бизнесу работать с аналитикой в диалоговом режиме: запросил - получил ответ, уточнил - снова ответ. Не данные в режиме онлайн, а работа с данными в режиме онлайн. А данные зачастую интересовали не те, которые только что получены, а сравнение итогов двух прошедших кварталов и прогноз на следующий год.


Халява развращает. Это касается любой области. Когда появилась возможность печатать документы на принтерах, вырос бумажный документооборот. Хотя компьютеры как бы в идеале должны приводить к его уменьшению. Понижение стоимости чего угодно ведёт к увеличению его потребления во-первых, и снижению требований к качеству во вторых. Все расслабляются.


Так и тут. Зачем понимать предметную область, рожая в муках постановку задачи на отчёт, если можно строить запросы произвольным образом, да ещё самому? Коррелируем огурцы и смертность и вот вам отличная работа по анализу: все умерли, кто ел огурцы на протяжении последних 60 лет!
...
Рейтинг: 0 / 0
20 сообщений из 45, страница 2 из 2
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / Отличие OLAP-куба от витрины данных
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]