Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / best practices медленно меняющееся измерение / 5 сообщений из 5, страница 1 из 1
13.11.2019, 18:17
    #39888761
IlyamI
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
best practices медленно меняющееся измерение
Всех приветствую.

Кто может поделиться опытом разработки кубов с медленно меняющимися измерениями?
Что я имею в виду:

Есть таблица фактов с количеством записей в пару-тройку сотен миллионов, гранулярностью до дня. Есть, например, измерение "клиент", представленный в фактах id. Имеется таблица переходов клиентов из одного состояния в другое с записью вида: клиент-состояние-с дата-по дата. Есть справочник состояний, пусть пока простой: id, name.

Как лучше отобразить состояние клиента в кубе на конкретную дату? Джойнить факты с таблицей переходов клиент-состояние с хранением состояния в фактах? Или "раскручивать" таблицу переходов состояний на каждый день для каждого клиента и связывать, фактически две фактовые таблицы через измерения? С учетом того, что самих клиентов может быть несколько миллионов и календарь охватывать несколько лет?

А если еще хочется иерархию родитель-потомок по состоянию?
...
Рейтинг: 0 / 0
13.11.2019, 18:42
    #39888767
londinium
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
best practices медленно меняющееся измерение
а может просто "состояние клиента на дату" положить в таблицу фактов?
...
Рейтинг: 0 / 0
13.11.2019, 18:51
    #39888768
IlyamI
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
best practices медленно меняющееся измерение
londinium,

"...Джойнить факты с таблицей переходов клиент-состояние с хранением состояния в фактах?..."
Именно так сейчас в большинстве случаев и реализовано. Там, где измерения очень большие
...
Рейтинг: 0 / 0
13.11.2019, 20:45
    #39888802
Критик
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
best practices медленно меняющееся измерение
Я бы просто положил в факты еще на уровне etl.
Просто и быстро.
...
Рейтинг: 0 / 0
18.11.2019, 18:08
    #39890732
doz.ace
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
best practices медленно меняющееся измерение
IlyamI, я вижу два варианта - простой и сложный
1) Сложный - таблицу измерения генерируем со всеми изменениями состояний с IDENTITY, в таблице факта по дате определяем нужный нам IDENTITY клиента и добавляем в таблицу - связь с измерением по этому полю
2) Простой - генерируем измерением ключам код клиента, код начала месяца, в таблицу факта добавляем дату начала месяца, связь по составному ключу - дата начала месяца + код клиента
...
Рейтинг: 0 / 0
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / best practices медленно меняющееся измерение / 5 сообщений из 5, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]