powered by simpleCommunicator - 2.0.60     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / MOLAP и SCD
45 сообщений из 45, показаны все 2 страниц
MOLAP и SCD
    #32399132
Alexander Stoulov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Господа, предлагаю новую тему - можно ли с помощью MOLAP решать задачи SCD? Кто знает, может есть опыт?

Константин ЛисянскийА почему нельзя? Думаю, что вполне можно.


JuriiЯ тестировал возможности OLAP-сервера PowerPlay в этой области, там заложена функциональность по работе с SCD. Вроде все работает нормально...

Юрий, можно поподробнее, какие у PowerPlay есть возможности для организации медленно меняющихся измерений?

С уважением, Стулов Александр
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32399278
Вжик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Меня тоже интересует данная тема. Буду рад поучаствовать.
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32399310
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Я думаю, в том, что PowerPlay сможет поддерживать SCD 1 сомнений ни у кго нету? :)

При правильно организованной витрине данных можно поддерживать SCD 3. Для этого можно использовать тот факт, что PowerPlay позволяет хранить две версии названия категории - полное и краткое название категории. Соответственно, в полное название записываем текущее значение категории, а в краткое - предыдущее. При анализе в PowerPlay можно налету переключать эти названия.
Если речь идёт об изменении не названия, а перепривязке к новому родителю, то можно воспользоваться альтернативными путями drill-down. Скорее всего, их можно сделать несколько. То есть, отразить несколько последних изменений родителя. Однако, не очень понятно, как это связать со временем.
Ну, и вопрос к Юрию (как стороннику решений без создания хранилищ и витрин данных) - как это реализовать без витрины данных?


По поводу SCD 2 вопрос к Юрию - как Вы считаете, можно ли сделать поддержку SCD 2 средствами PowerPlay или нет?
Если да, то как её реализовать в случае отсутствия хранилища или витрины данных?



С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32399591
Владимир Штепа
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Mne kazhetsya eta zadacha blizhe k DWH, a ne k (M/R)OLAP.
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32401933
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
To Александр & Константин:

По правде говоря, я не эксперт-теоретик по теории SCD/медленно меняющихся измерений, и думаю большинство посетителей форума - тоже не эксперты в этой области. Поэтому было бы хорошо, если бы вы дали определение каждому из 3 типов SCD и привели бы примеры для каждого из типов.

Юрий, можно поподробнее, какие у PowerPlay есть возможности для организации медленно меняющихся измерений?

Я не говорю, что PowerPlay может помочь в любых ситуациях с SCD, поскольку не все они мне попадались на практике. На практике я встречаюсь с разными учетными (OLTP) системами, которые по-разному хранят информацию об изменениях. Обычно мне помогает либо создание виртуальной вьюшки в Impromptu, которая позволяет вытащить в кубы из базы OLTP данные по нужным правилам, либо я использую параметры, которыми можно играться на первой закладке свойств уровня иерархии измерения в модели куба в PowerPlay Transformer (уникальность, перемещение категории в другую ветвь иерархии, обновление названия категории, обновление описания категории и т.п.).

Я думаю, в том, что PowerPlay сможет поддерживать SCD 1 сомнений ни у кго нету? :)

Приведу пример. Есть справочник клиентов, в котором поверх старого названия клиента ввели новое. Идентификатор клиента не изменился. При этом в кубе PowerPlay пока хранится этот идентификатор и старое название. Я могу запустить процесс генерации категорий, в ходе которого старое название обновится на новое, и потом я обновлю куб (без необходимости перегенерации куба). Это приведет к тому что в кубе название клиента изменится на новое. Если же мы не хотим терять старое название, то думаю есть несколько вариантов - например сделать в кубе в этом измерении иерархию, и один и тот же идентификатор будет раскрываться в старое и новое название (это типа когда мы делаем уровень иерархии КОРПОРАЦИЯ, внутри которой могут быть компании Альфа и Бета, но мы знаем, что это одна и та же организация).

Если речь идёт об изменении не названия, а перепривязке к новому родителю
Однако, не очень понятно, как это связать со временем
Ну, и вопрос к Юрию (как стороннику решений без создания хранилищ и витрин данных) - как это реализовать без витрины данных?


Константин, приведите пример того что Вы хотите достичь. Например я вижу 2 варианта - либо перекинуть всю старую историю на нового родителя (например если клиент Иванов переехал из региона 1 в регион 2, то в регионе 2 окажутся его покупки, которые он делал будучи еще в регионе 1), либо можно иметь одного и того же клиента Иванова в обеих ветвях иерархии (он будет иметь историю покупок в регионе 1 за прошлые годы, и начнет накапливать историю покупок в регионе 2). Подходит ли Вам один из этих вариантов, или Вы ставите задачу по-другому?

По поводу SCD 2 вопрос к Юрию - как Вы считаете, можно ли сделать поддержку SCD 2 средствами PowerPlay или нет?
Если да, то как её реализовать в случае отсутствия хранилища или витрины данных?


Также прошу Вас привести пример исходных данных и результата, которого Вы хотите достичь.
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32403314
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2Jurii:

Также прошу Вас привести пример исходных данных и результата, которого Вы хотите достичь

Допустим, что у нас есть клиенты, которые часто переезжают из города в город. Хотим отслеживать продажи им наших товаров.
Допустим, некий клиент Петров весь 2000 год жил в Москве, 2001 - в Петербурге, 2002 - в Перьми, а 2003 - в Воркуте.
Мы хотим, чтобы данные о продажах этому клиенту (а также и всем остальным) корректно агрегировались на уровне городов. То есть мы хотим, чтобы цифры по Петрову за 2000 год относились к Москве, в 2001 - к Петербургу, ну, и так далее.
Вот такая задачка. Как решать на PowerPlay?


С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32403967
Tsaryov S
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2Константин Лисянский
Тот пример, что вы привели - вообще не требует специальных доработок, если город - отдельное измерение куба. Если город - верхний уровень справочника клиентов, то мы получаем, что листья дерева должны иметь разные варианты привязки к родителям. В случае мобильных клиентов строгая иерархия между ним и городом пропадает, связь получается многие-ко-многим, и единственный вариант для OLAP - другое измерение.
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32404002
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 Tsaryov S:

Тот пример, что вы привели - вообще не требует специальных доработок, если город - отдельное измерение куба. Если город - верхний уровень справочника клиентов, то мы получаем, что листья дерева должны иметь разные варианты привязки к родителям. В случае мобильных клиентов строгая иерархия между ним и городом пропадает, связь получается многие-ко-многим, и единственный вариант для OLAP - другое измерение.

Речь идёт о том, что город в том же измерении, что и клиент, если бы это были разные измерения, то эта тема не обсуждалась бы в этом топике.
SCD - это медленно изменяющееся измерение, что подразумевает возможность изменений внутри измерения.
Я бы не стал делать категорических заявлений о единственности варианта с другим измерением. Возможно, Юрий предложит своё решение. Или ещё кто-нибудь, кто решал подобную задачу с помощью MOLAP.
Я примерно представляю, как решать её с помощью MOLAP, но, backfire прав в том, что задача требует предварительной работы с данными (создание хранилища или витрины данных).



С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32404193
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
To Константин:

Вот такая задачка. Как решать на PowerPlay?
Я примерно представляю, как решать её с помощью MOLAP, но, backfire прав в том, что задача требует предварительной работы с данными (создание хранилища или витрины данных).

Для начала приведу пример из жизни на тему анализа продаж через дистрибьюторов. В учетной системе (Аксапта) каждый документ по продажам содержит ссылку на стравичник дистрибьюторов (на тех кто продает). Кроме этого в документе есть ссылка на справочник клиентов (те кто покупают товары), и для каждого из клиентов задан один единственный дистрибьютор, который работает с этим клиентом. В идеале клиенты должны покупать только у "своих" дистрибьюторов, но реально бывают случаи, когда какой-либо дистрибьютор продает что-либо чужому клиенту.
Для анализа этих данных в PowerPlay было создано 2 измерения для дистрибьюторов - "Дистрибьютор по клиенту" и "Дистрибьютор фактический". Если вывести оба этих измерения в отчет (одно в строки, а другое в столбцы), мы увидим, какие дистрибьюторы продавали товары клиентам других дистрибьюторов.

Что касается Вашей задачки, то ее надо решать исходя из потребностей пользователей. Я бы предложил делать закачку в куб PowerPlay таким образом, чтобы наш клиент Петров встречался внутри кадждого из городов. То есть если в каждом городе он сделал лишь по одной покупке, то в куб закачаем 4 записи:

Год, Город, Клиент, Сумма
2000, Москва, Петров, 100
2001, Санкт-Петербург, Петров, 120
2002, Пермь, Петров, 30
2003, Воркута, Петров, 75

Другой вопрос, хранится ли в учетной системе информация, что Петров в такое-то время жил в таком-то городе (надеюсь хранится)...
В итоге Сумма для каждого города вычислится корректно.
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32404252
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 Jurii:

Для анализа этих данных в PowerPlay было создано 2 измерения для дистрибьюторов - "Дистрибьютор по клиенту" и "Дистрибьютор фактический". Если вывести оба этих измерения в отчет (одно в строки, а другое в столбцы), мы увидим, какие дистрибьюторы продавали товары клиентам других дистрибьюторов.

Не понимаю, какое отношение это имеет к проблеме SCD. Мы обсуждаем только одно измерение.


Что касается Вашей задачки, то ее надо решать исходя из потребностей пользователей. Я бы предложил делать закачку в куб PowerPlay таким образом, чтобы наш клиент Петров встречался внутри кадждого из городов. То есть если в каждом городе он сделал лишь по одной покупке, то в куб закачаем 4 записи:


Год, Город, Клиент, Сумма
2000, Москва, Петров, 100
2001, Санкт-Петербург, Петров, 120
2002, Пермь, Петров, 30
2003, Воркута, Петров, 75


А структура измерений какая при этом будет? ГОРОД-КЛИЕНТ?

Другой вопрос, хранится ли в учетной системе информация, что Петров в такое-то время жил в таком-то городе (надеюсь хранится)...
Если даже хранится, то при переезде Петрова может потеряться информация о том, где он жил до переезда.
Так что, без хранилища будет сложно решить эту задачу.


С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32404317
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
To Константин:

Не понимаю, какое отношение это имеет к проблеме SCD. Мы обсуждаем только одно измерение.

Иногда бывает правильным включить клиентов внутрь их дистрибьюторов, и несмотря на то что SCD приведет к тому что связь будет многие ко многим - сумма по дистрибьюторам распределится правильно. При этом подсчет клиентов и ранжирование их по общей сумме закупок надо делать на основе отдельного измерения КЛИЕНТЫ.

А структура измерений какая при этом будет? ГОРОД-КЛИЕНТ?

Да, я именно это имел в виду.

Если даже хранится, то при переезде Петрова может потеряться информация о том, где он жил до переезда.
Так что, без хранилища будет сложно решить эту задачу.


Некоторые учетные системы поддерживают темпоральность (например в них можно при указании связи указать начальную и конечную дату действия связи), такие системы можно назвать хранилищами данных... Если же система не поддерживает темпоральность, то может помочь то, что в документах есть ссылки напрямую на клиентов и на города (то есть схема звезда).
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32404577
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Похоже, Юрий, Вы плохо понимаете, что такое хранилище данных, если пытаетесь оперативную ситсему окрестить хранилищем.
Давайте закроем эту дискуссию. Уже всё понятно.


С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32404675
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Константин,

Похоже, Юрий, Вы плохо понимаете, что такое хранилище данных

Я и не скрываю того, что не являюсь экспертом в этом вопросе. На практике я решаю аналитические задачи с помощью виртуальных вьюшек Impromptu.

Давайте закроем эту дискуссию. Уже всё понятно.

Закрыть - дело не хитрое. Только вот каждый участник понял для себя что-то свое... Вы бы как эксперт по ХД и SCD хотя бы прокомментировали, поняли ли Вы, что PowerPlay позволяет решить проблемы SCD, или наоборот Вы поняли, что MOLAP такие задачи решать не умеет...

To Alexander Stoulov:

Вы бы тоже поделились бы своими мыслями, удалось ли Вам получить ответы на свой вопрос...
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32404723
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 Jurii:

Один PowerPlay не может в полной мере решить проблемы SCD. Вот по какой причине - SCD2 предполагает генерацию нового суррогатного ключа каждый раз, когда элемент измерения меняет одно из своих свойств.
Операционные системы используют другой механизм - метки времени. Сам PowerPlay (Transformer) не поддерживает такую логику. Возможно, DecisionStream поддерживает генерацию суррогатных ключей, но я, не знаком с этим продуктом. Думаю, что в России он ещё ни разу не использовался, поскольку стОит ка паровоз.
Для того, чтобы PowerPlay смог корректно поддерживать SCD2 всяко придётся изменять структуру данных (создавать хранилище и витрину).
Задачу генерации суррогатных ключей практически невозможно решить чистым SQL (проверено экспериментально - несколько лет назад бегал с такой идеей, даже SQL соответствующий был написан, но там соединение по неравенству и производительность экспоненциально снижается с ростом количества записей). Генерацию суррогатных ключей можно делать на хранимых процедурах или, например, на плоских файлах за пределами СУБД.

Соответственно, получить куб с поддержкой SCD прямо из оперативной системы мне представляется маловероятным.

Соответственно. моё мнение совпадает с мнением backfire - без построения ХД или витрины не обойтись, если требуется работа с SCD.
Что, собственно, уже неоднократно проделывалось.

Не называйте меня, пожалуйста, экспертом.
Не очень мне это нравится. Скромнее надо быть.

С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32404738
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Константин,

Задачу генерации суррогатных ключей практически невозможно решить чистым SQL (проверено экспериментально - несколько лет назад бегал с такой идеей, даже SQL соответствующий был написан, но там соединение по неравенству и производительность экспоненциально снижается с ростом количества записей).

Вот это уже интересно. Не забывайте, мы находимся на сайте www.sql.ru , и тут много профессионалов в области SQL.
Не могли бы Вы привести пример записей из одной или нескольких таблиц, и объяснить, что надо связывать неравенством. Может быть коллективный разум позволит найти решение хотя бы для не очень больших объемов данных? Кстати, Вы говорите что производительность снижается с ростом количества записей - это записи таблицы фактов или таблицы справочника/измерения?
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32404749
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вот это уже интересно. Не забывайте, мы находимся на сайте www.sql.ru , и тут много профессионалов в области SQL.
Не могли бы Вы привести пример записей из одной или нескольких таблиц, и объяснить, что надо связывать неравенством. Может быть коллективный разум позволит найти решение хотя бы для не очень больших объемов данных? Кстати, Вы говорите что производительность снижается с ростом количества записей - это записи таблицы фактов или таблицы справочника/измерения?


Я это решение уже знаю. Зачем мне здесь коллективный разум.
Могу лишь порекомендовать почитать Кимбала - он эти вопросы уже неоднократно разжёвывал.
Ссылку выложить?

С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32404756
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Константин,

Я это решение уже знаю. Зачем мне здесь коллективный разум

Коллективный разум может помочь усовершенствовать это решение, чтобы его можно было использовать и на больших объемах данных. Хотя если это Ваше ноу-хау - можете оставить это в тайне.

Могу лишь порекомендовать почитать Кимбала - он эти вопросы уже неоднократно разжёвывал.
Ссылку выложить?


У Кимбала много информации на сайте. Если не трудно - выложите ссылочку на его статью, которая относится к обсуждаемому нами вопросу.
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32405121
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Коллективный разум может помочь усовершенствовать это решение, чтобы его можно было использовать и на больших объемах данных. Хотя если это Ваше ноу-хау - можете оставить это в тайне.

Предлагаю закрыть этот вопрос. Коллективный разум (в виде нескольких моих коллег) уже участвовал в этом и принял решение, что возиться с этим не стоит.
Тем более за давностью лет всё это так далеко лежит, что даже поднимать неохота.


У Кимбала много информации на сайте. Если не трудно - выложите ссылочку на его статью, которая относится к обсуждаемому нами вопросу.

Есть, конечно разные статьи, но больше всего рекомендуется книга The Datawarehouse Toolkit и другие его книги.

Я писал свои рецензии на эти книги и выложил их на сайт (пардон за рекламу или как там это называется? ПиАр что ли?):
http://lissianski.narod.ru/dwmodelbooks.html

Кроме Кимбала ещё есть одна довольно толковая книжица Data Warehouse Design Solutions by Christopher Adamson, Michael Venerable

Можно ещё смотреть статьи, ссылки на которые есть здесь:
http://lissianski.narod.ru/dwmodel.html

Желаю удачно разобраться в этом предмете!


С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32405447
Владимир Штепа
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Pozvolte vstavit svoi poslednie "5 kopeek".

Esche v samom nachale etogo "Flame" ya upomyanul, chto SCD eto problema DWH, a ne OLAP.

S pom chistogo OLAP mozhno chego nit sklepat dlya maschtrabov FoodMart ("dlya teh kto na bronepoezde" - FoodMart, a ne Northwind yavlyaetsya ekvivalentom Great Outdoors).
Na realnih zhe DB upretes v proizvoditelnos Joinov s neravenstvom, chto uzhe upomyanul Konstantin.

V konce koncov prishli k vivodu - uchite DWH - chtaite Ralfa Kimpbala.
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32406076
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 Константин Лисянский
Мне приходилось решать такую проблему на Oracle Express, нужно было корректно отслеживать перемещение во времени клиентов по тарифнам планам. Вся история естественно велась в DWH, а в OLAP куб закачивались уже точечные суммы на по каждому клиенту на каждый момент времени.

Я не совсем понял как вы хотите организовать это одно измерение?
Фамилия-Город или Город-Фамилия или Фамилия-Время-Город?
И почему непременно нужно одно измерение?
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32406132
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2Birkhoff:

Город-Фамилия.
На то он и SCD, что измерение меняется медленно. Два измерения в таком случае смысла иметь не имеет - теряется пространство в таблице фактов - а оно при большом количестве записей может оказаться дорогим.
Если измерения два - то никакого SCD нету. Всё, вроде бы, нормально. Однако при этом информация о том, в каком городе обитает клиент имеется только для тех клиентов, для которых есть записи в таблице фактов. А если фактов нет?

Хочу подчеркнуть, что это SCD не я выдумал. Почитайте Кимбала. Может, вопросы сами отпадут.


С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32406157
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2 Константин Лисянский

Спасибо, Кимбала я читал и что такое SCD знаю :)
Вопрос то не в том как отслеживать в хранилище а как выйти из положения в MOLAP. Иметь два измерения - один из выходов. Но вам он видимо не подходит. Может забивать кактое нибудь дефолтное значение по тем именам где нет фактов?
А если организвать измерения Город Фамилия как вы будете отслеживать перемещение конкретного человека по городам?
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32406161
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
В следующем релизе Oracle Warehouse Bulder заявлена поддержка SCD, правда в каком объеме не ясно пока.
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32406176
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Других идей кроме как держать чела во всех городах, где он успел пожить, мне в голову не приходит (это то, что предложил Юрий). На деле в SCD2 это так и происходит.
Я кроме Cognos других MOLAP-тулзов интенсивно не пользовал, думал, может есть в каких-то встроенная поддержка SCD.

Никто об этом пока не заявил. Декларативные заявления Юрия о том, что он решает проблемы SCD таковыми и остались. Я думаю, он только из этого диалога впервые о такой проблеме услышал.
Остальные тоже, вроде бы, молчат.

Кажется, пора эту веточку закрывать.

И ждать выхода следующего Warehouse Buildera :))

С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32406194
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Константин,

С одной стороны:

(это то, что предложил Юрий). На деле в SCD2 это так и происходит.

С другой стороны:

Декларативные заявления Юрия о том, что он решает проблемы SCD таковыми и остались. Я думаю, он только из этого диалога впервые о такой проблеме услышал.

Где же логика в Вашем суждении? Я довольно много полезного рассказал в этой дискуссии на тему MOLAP и SCD...

Я конечно не эксперт в области хранилищ данных, но и не ламер :) Хотя может я просто случайно угадал
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32406202
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Юрий, ну Вы же у нас на все руки эксперт.
Вон, гроссмейстеров обыгрывали :))
Ну, я же всё-таки правильно сказал, что проблема SCD для Вас была вновинку?
Я же не упрекаю Вас за это. Ну, не знал человек, что тут такого? Он и признался в этом сам.
А, вот, если человек пытается преподнести себя сильно много знающим, а на поверку оказывается, что он пороза ещё не нюхал, то это другой вопрос...

И давайте, поскорее закончип этот трёп.

Юоий, ваше традиционное послднее наставление, и хватит. ОК?

С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32406215
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
В Express встроенной поддержки SCD нет, в Olap option насколько я знаю тоже.
По MS AS нашел такую статью.
http://msdn.microsoft.com/library/default.asp?url=/library/en-us/dnolap/html/slowly2.asp

Warehouse Builder позволяет проектировать объекты и реляционные и многомерные, если будет сделана поддержка SCD в реляционных объектах это само по себе тоже полезно.
А вот если в многомерных - будет вообще здорово.
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32406240
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Константин,

Ну, я же всё-таки правильно сказал, что проблема SCD для Вас была вновинку?
Я же не упрекаю Вас за это. Ну, не знал человек, что тут такого? Он и признался в этом сам.


Тот факт что я мало читал классиков по ХД (и сейчас не тороплюсь этого делать) не говорит о том, что я не сталкивался с медленно меняющимися измерениями на практике :) Я сталкивался с такими вещами при проектировании кубов на основе данных из ERP-систем и MRP-модулей (где имеет место вариативность структуры номенклатурных позиций во времени), при анализе выполнения заказов, когда статус заказа меняется во времени, и т.п. В каждом случае я не брался за книжки, а сам придумывал решение.

P.S. Видимо это старая привычка - когда я активно занимался шахматами, я мало читал теорию дебютов, и все придумывал прямо за шахматной доской...
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32407053
Alexander Stoulov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
JuriiTo Alexander Stoulov:

Вы бы тоже поделились бы своими мыслями, удалось ли Вам получить ответы на свой вопрос...

Откровенно, говоря, получил, но не до конца. Я был на 99% уверен, что в PowerPlay нельзя решить задачу медленно меняющегося измерения (SCD1 и SCD3 в расчет не берем - это бирюльки :)).
Жаль, что к дисскуссии не присоединились господа, которые занимаются MS OLAP, похоже, что им тоже сказать нечего, а их участия я ждал больше всего.

Также я рад, что всплыл вопрос в различии терминов DWH & OLAP, просто благодаря энергии Юрия в форуме постоянно шла подмена этих терминов. По-моему, хранилище с помощью MOLAP создать нельзя, и лучшее его применение - это витрина поверх реляционного ХД.

С уважением, Стулов Александр
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32407238
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Александр,

Я был на 99% уверен, что в PowerPlay нельзя решить задачу медленно меняющегося измерения

А сейчас Вы - на 100% уверены, что в PowerPlay нельзя решить эту задачу, или по прежнему - на 99%, или Вы поняли, что кое-какие способы в PowerPlay есть?


А для меня остался неясным вот какой вопрос:

По-моему, хранилище с помощью MOLAP создать нельзя, и лучшее его применение - это витрина поверх реляционного ХД

Если в учетной системе (OLTP) хранится в каком-либо виде история, что клиент Петров сначала жил в Москве, потом в Питере, потом в Магадане - то все хорошо - можно либо создать реляционное ХД и на него навесить MOLAP, либо навешивать MOLAP сразу на OLTP. Если же учетная система не хранит историю перемещений Петрова - то никакое реляционное ХД и никакой MOLAP не помогут. Вы согласны с этим?
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32407268
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2Jurii:

Если же учетная система не хранит историю перемещений Петрова - то никакое реляционное ХД и никакой MOLAP не помогут. Вы согласны с этим?

Вот, ещё раз, Юрий, видно, что Вы не очень хорошо представляете, что такое хранилище данных и как оно обеспечивает историчность.

Дело в том, что OLTP не обязано хранить историю. Его будет хранить имнно хранилище. Достаточно постоянно делать "снимки" статусных атрибутов (таких как город клиента, например), тогда появляется возможность нормально захватывать исторические данные. Это называется CDC (changed data capture) и является одной из дисциплин построения хранилищ данных. Существует несколько способов (опять-таки, давно описанных) это делать.


С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32407321
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Константин,

Достаточно постоянно делать "снимки" статусных атрибутов (таких как город клиента, например), тогда появляется возможность нормально захватывать исторические данные. Это называется CDC (changed data capture) и является одной из дисциплин построения хранилищ данных.

В идеале надо делать 100 снимков в секунду, чтобы не потерять быстро меняющихся изменений...

На мой взгляд, инкрементальное обновление MOLAP-куба - это нечто похожее на CDC, не так ли? В реляционном ХД хранить данные конечно надежнее, но я полагаю, что спроектировать и поддерживать такое ХД - трудоемко. Не знаете, есть ли в России реальные проекты по разработке ХД с учетом всех правил знаменитых теоретиков по ХД?
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32407369
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2Jurii:

В идеале надо делать 100 снимков в секунду, чтобы не потерять быстро меняющихся изменений...

Ну, конечно, если ваши клиенты умеют так быстро перемещаться из города в город, тут же сообщать Вам об этом, то да.
А вообще, советую ещё раз посмотреть на тему этой дискуссии - речь идёт о МЕДЛЕННО изменяющихся измерениях.

На мой взгляд, инкрементальное обновление MOLAP-куба - это нечто похожее на CDC, не так ли?

Только в части добавления. Бывют ещё два вида изменений - удаление и изменение.

В реляционном ХД хранить данные конечно надежнее
Разумеется.

но я полагаю, что спроектировать и поддерживать такое ХД - трудоемко

При правильном подходе спроектировать хранилище довольно несложно.
Одна из сложных задач - это очистка и загрузка данных в хранилище.
Я ещё не видел ни одного серьёзного источника данных, который бы не нуждался в очистке - дублирующиеся и пропущенные названия, апичатки :), нереальные цифры и прочие ошибки.
Когда это всё видишь - никакого доверия к данным не испытываешь. Как можно принимать решения на данных низкого качества? Какого качества будут эти решения?
Поэтому и существует два подхода - сделать быстро или сделать качественно. Вы выбираете первый, я - второй. У каждого свои преимущества.

Не знаете, есть ли в России реальные проекты по разработке ХД с учетом всех правил знаменитых теоретиков по ХД?
Знаю. Есть. Не так много, как за границей, естественно. Здесь мы от них сильно отстали. Не хотим, понимаешь, осваивать эту науку :(



С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32407485
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Константин,

Поэтому и существует два подхода - сделать быстро или сделать качественно. Вы выбираете первый, я - второй. У каждого свои преимущества.
Знаю. Есть. Не так много, как за границей, естественно. Здесь мы от них сильно отстали. Не хотим, понимаешь, осваивать эту науку :(


Да, действительно, я предпочитаю делать проекты в более сжатые сроки и без необходимости программирования/рахработок ХД и т.п., для того чтобы аналитическая система была гарантированно высокого качества. Проблема грязных данных, с которыми я борюсь с помощью виртуальных вьюшек - имеет место, не все можно отловить. Но меня успокаивает, что степень скрытой загрязненности данных - обычно невысока, и по той причине, что пользователи проводят сверки своих старых отчетов с новыми отчетами из аналитической системы, нет риска, что аналитическая система увеличит степень загрязненности данных...
Так что наши пользователи принимают управленческие решения в условиях несколько недостаточной информации, и ROI этих проектов очень высок (так как в знаменателе не такая большая сумма затрат на проект). А на западе данные лучше очищают, но затраты на проект резко увеличиваются, и поэтому у них ROI не такой высокий.
Мне кажется, что наши пользователи лучше понимают, что такое правило Парето :)
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32408443
Alexander Stoulov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Юрий,

JuriiА сейчас Вы - на 100% уверены, что в PowerPlay нельзя решить эту задачу, или по прежнему - на 99%, или Вы поняли, что кое-какие способы в PowerPlay есть?

Уверен, что нельзя.

JuriiНе знаете, есть ли в России реальные проекты по разработке ХД с учетом всех правил знаменитых теоретиков по ХД?

Поддерживаю Константина, есть и даже думаю мы говорим о разных с ним проектах. Для сравнения - более 50 атрибутов с справочнике продукции. Вам бы, Юрий, пришлось создавать 50 измерений. И предупреждая Ваш ответ на счет использования Impromptu по OLTP системе, скажу, что в OLTP системе их как раз и нет. Большая их часть берется из внешних источников.

JuriiДа, действительно, я предпочитаю делать проекты в более сжатые сроки и без необходимости программирования/рахработок ХД и т.п., для того чтобы аналитическая система была гарантированно высокого качества.

По-моему, в русском языке есть более четкое определение такого гарантированного качества данных - дешево и сердито :)

JuriiТак что наши пользователи принимают управленческие решения в условиях несколько недостаточной информации, и ROI этих проектов очень высок (так как в знаменателе не такая большая сумма затрат на проект). А на западе данные лучше очищают, но затраты на проект резко увеличиваются, и поэтому у них ROI не такой высокий.
Мне кажется, что наши пользователи лучше понимают, что такое правило Парето :)

Юрий, Вам как специалисту по маркетингу (в лучшем смысле этого слова и без иронии) хочу подкинуть идею - попробуйте организвать MLM сеть по продаже Cognos, у Вас должно получиться :)

С уважением, Стулов Александр
BI Partner
www.bipartner.ru
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32408639
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Александр,

Для сравнения - более 50 атрибутов с справочнике продукции. Вам бы, Юрий, пришлось создавать 50 измерений.

Можно создать 5 измерений, в каждом из которых будет по 10 альтернативных Дрилл-Даунов. Да даже если делать 50 измерений - это тоже будет неплохо работать, куб от этого не распухнет, хотя в оси фильтра в OLAP-клиенте будет несколько строк...

И предупреждая Ваш ответ на счет использования Impromptu по OLTP системе, скажу, что в OLTP системе их как раз и нет. Большая их часть берется из внешних источников.

В Impromptu можно внешние источники подключать в виде хот-файлов, это будет выглядеть как будто в основной базе данных появились новые таблицы.
Но более интересный вариант - использовать возможность OLAP-сервера создавать многомерные кубы на основе нескольких источников данных разного формата. Например, часть атрибутов брать из основного источника данных, а часть - из внешних источников.

По-моему, в русском языке есть более четкое определение такого гарантированного качества данных - дешево и сердито :)

Дешево и сердито - это когда качество получаемых услуг и приобретаемых товаров невысокое. Я считаю, что качество подходов "без ХД" и "с ХД" соотносится не как "среднее и дешевое" и "высокое и дорогое", а как "высокое и дешевое" и "очень высокое и дорогое".

попробуйте организвать MLM сеть по продаже Cognos, у Вас должно получиться :)

Сети MLM - это когда основная цель - "впарить" товар. Что касается продвижения Cognos, то тут более уместен термин "развитие партнерской сети", поскольку продукты Cognos надо не только продавать, но и качественно внедрять.
У меня есть ряд партнеров, я продолжаю развивать партнерскую сеть, даже раздел отдельный имеется для этого на сайте http://cognos.narod.ru ... Так что спасибо за идею, но Ваша квалификация в области маркетинга примерно такая же, как и у меня, поэтому мы и мыслим примерно одинаково :)
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32408709
Владимир Иванов
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Коллеги, хотелось бы поделится опытом, но сначала пара замечаний.
1) Мы живем не в башне из слоновой кости и не работаем в Microsoft Research, а делаем конкрентные бизнес-приложения. SCD это не термин для бизнес-приложения, следует перейти к практическим примерам таким как "правка задним числом", "переклассификация" и т.д. В данной постановке вопроса мне интересно делится опытом. Если кому интересно порассуждать о "понятиях" это не ко мне.
2) Мы занятые специалисты и давайте ценить время. Я не отвечаю на флейм и замечания студентов.

Теперь по-сути. Несколько близких бизнес-ситуаций.
Есть стандартные приемы в том числе на Virtual Dimention, которые описаны в MSDN.
Однако историчность можно побороть круче если перейти на 2 других приема.
1. Инкрементальное обновление и сторнирующий DWH. В данном случае история из системы никогда не удаляется, а только сторнируется. Если добавить измерение "Время правки" (не путать с временем проведения), можно легко решить массу вопросов по гулящим аналитикам просто накладывая фильтр по данному измерению. Такой метод я применил в Сатурне.
2. Network Dimention. Создается не Tree, а Сеть. Частный случай это вхождение объекта в несколько узлов в том числе узлы истории. Так делали в Лукойле
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32409813
Владимир Штепа
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
JuriДа, действительно, я предпочитаю делать проекты в более сжатые сроки и без необходимости программирования/рахработок ХД и т.п., для того чтобы аналитическая система была гарантированно высокого качества.
Cto to trudno naiti logiku v vashem utverzhdenii. Visokoe kachestvo soverschenno ne sleduet iz szhatih srokov i otkaza ot DWH.

JuriiПроблема грязных данных, с которыми я борюсь с помощью виртуальных вьюшек
Esli vi reshaete takei problemi na view, to u vas libo hardware nemeryannoe ili ob'emi DB malenkie.

JuriiЯ считаю, что качество подходов "без ХД" и "с ХД" соотносится не как "среднее и дешевое" и "высокое и дорогое", а как "высокое и дешевое" и "очень высокое и дорогое".
Pozvolte ne soglasitsya s vami. Esli OLTP, sluzhaschaya istochnikom dannih, takaya zha ne namniogo starshe vashego OLAP-resheniya, to mozhet vi i pravi. Esli zhe OLTP rodilas ranshe, chem upala Berlinskaya Stena (da, ne udivlyaetes, na Zapade eto ne islklyuchenie, a surovaya pravda zhizni), to vash podhod bez DWH voobsche ne proidet.

Ivanov
SCD это не термин для бизнес-приложения

SCS - 3-buklvi i vsem vse ponyatno.


Ivanov
Однако историчность можно побороть круче если перейти на 2 других приема.
1. Инкрементальное обновление и сторнирующий DWH. В данном случае история из системы никогда не удаляется, а только сторнируется. Если добавить измерение "Время правки" (не путать с временем проведения), можно легко решить массу вопросов по гулящим аналитикам просто накладывая фильтр по данному измерению. Такой метод я применил в Сатурне.

A ne mogli bi vi nemnogo podrobnee osvetit vash priem. Chto zhe kokretno imeetsya vvidu?

Ivanov
2. Network Dimention. Создается не Tree, а Сеть. Частный случай это вхождение объекта в несколько узлов в том числе узлы истории. Так делали в Лукойле.

Chto takoe Network Dimension v ponyatiyah MS AS ili Cognos?
Kakim instrumentariem vi delaete Network Dimension? Kak on ustroen?
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32410308
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
To backfire:

Cto to trudno naiti logiku v vashem utverzhdenii. Visokoe kachestvo soverschenno ne sleduet iz szhatih srokov i otkaza ot DWH.

Я имею в виду, что когда аналитические модели/OLAP-кубы проектируются визуальными средствами - то качество будет высоким. Если же надо писать ручками MDX-выражения, SQL-запросы, создавать новую реляционную БД (ХД), и т.п. - то вступает в силу человеческий фактор, и качество из-за этого страдает.

Проблема грязных данных, с которыми я борюсь с помощью виртуальных вьюшек
Esli vi reshaete takei problemi na view, to u vas libo hardware nemeryannoe ili ob'emi DB malenkie.


Виртуальные вьюшки - это не объекты базы данных (не реальные вьюшки). Виртуальные вьюшки - это фактически SQL-запросы, создаваемые визуальными средствами в модуле Cognos Impromptu. В тех случаях когда данные очищать не нужно, виртуальная вьюшка создается путем простого выбора полей и создания производных вычисляемых полей на основе связанных таблиц. Когда же данные надо очищать - вычисления усложняются, в них включаются правила, в соответствии с которыми надо проводить очистку.
Я приводил примеры своих проектов - объемы там очень даже приличные, а железо - довольно скромное. Мощное железо не требуется, поскольку подкачка через виртуальные вьюшки в MOLAP-кубы PowerPlay производится малыми порциями (инкрементально). А в кубах, как известно, пользователи проводят многомерный интерактивный анализ и строят отчеты, не нагружая при этом реляционный сервер SQL-запросами.

Esli OLTP, sluzhaschaya istochnikom dannih, takaya zha ne namniogo starshe vashego OLAP-resheniya, to mozhet vi i pravi.
Esli zhe OLTP rodilas ranshe, chem upala Berlinskaya Stena (da, ne udivlyaetes, na Zapade eto ne islklyuchenie, a surovaya pravda zhizni), to vash podhod bez DWH voobsche ne proidet.

Я помню лето 1990 года, когда от Берлинской Стены остались последние камни (жаль правда что не догадался тогда взять себе один на память :)
Но все же это было давно... На территории бывшего СССР мало кто пользовался компьюьерными учетными системами, и еще меньшее их количество сохранилось до сих пор. Думаю не вызывает сомнений, что подавляющее большинство учетных систем в России и СНГ появились либо в начале/середине 90-х годов, либо позже - они работают либо на файл-серверных, либо на клиент-серверных реляционных базах данных, таких форматов как DBF, Paradox, FoxPro/VFP, MS SQL, Interbase, Oracle, DB2, Informix, Sybase, Progress. Ко всем этим источникам данных можно легко приконнектиться (либо через прямой драйвер, либо через ODBC) и спроектировать на их основе аналитические модели - перекачивать данные из них в отдетьную БД (ХД) вовсе не обязательно...
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32410375
Владимир Штепа
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
To Jurii

A kak vi postupaete v teh sluchayah, kogda OLTP sistema archiviruetsya (usekaetsya, obrezaetsya).

V OLTP sistemah vryad li kto hranit dannie o tranzakciyah bolee chem za 1-2 goda. V to vremya kak dlya analiza neredko ispolzuetsya glubina do 10 let.

Kak vi postupaete v teh sluchayah, esli vashu analiticheskuyu model nado modificirovat (dobavit dlya analiza novie fakti, atributi, ili izmereniya).
Chto vi delaete v takom sluchae, kogda v kube imeyutsya dannie po transakziyam, kotorih uzhe net v OLTP?
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32410524
Tulenev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Я имею в виду, что когда аналитические модели/OLAP-кубы проектируются визуальными средствами - то качество будет высоким. Если же надо писать ручками MDX-выражения, SQL-запросы, создавать новую реляционную БД (ХД), и т.п. - то вступает в силу человеческий фактор, и качество из-за этого страдает.

Это хорошо в том случае, если визуальные средства функционально эквивалентны выражениям языков MDX и SQL, в чем я сомневаюсь. Делая инструмент более доступным для бизнес-пользователя связываем руки профессиональным разработчикам - известная дилемма... А потеря качества из-за нехватки в визуальных средствах возможностей оптимизации производительности вас не смущает?


A kak vi postupaete v teh sluchayah, kogda OLTP sistema archiviruetsya (usekaetsya, obrezaetsya).
V OLTP sistemah vryad li kto hranit dannie o tranzakciyah bolee chem za 1-2 goda. V to vremya kak dlya analiza neredko ispolzuetsya glubina do 10 let.
Kak vi postupaete v teh sluchayah, esli vashu analiticheskuyu model nado modificirovat (dobavit dlya analiza novie fakti, atributi, ili izmereniya).
Chto vi delaete v takom sluchae, kogda v kube imeyutsya dannie po transakziyam, kotorih uzhe net v OLTP?


Вот это интересная тема. В таких случаях обычно без железного лома и такой-то матери не обходится :)
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32410561
Владимир Штепа
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
To Tulenev

Lom i Mater :-) ? Zachem tak zhestoko.

Ya prosto hotel podvesti sozdatelei skorospelih i ne sposobnih evolucionirovat ,a znachit ne dolgo zhivuschih reshenii k tomu, chto bez DWH - grosh cena Kubikam.

Eto vse ravno kak inexed view bez nizlezhaschei tablici. Kto mozhet sebe takoe predstavit?
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32410754
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
To Tulenev:

Это хорошо в том случае, если визуальные средства функционально эквивалентны выражениям языков MDX и SQL, в чем я сомневаюсь. Делая инструмент более доступным для бизнес-пользователя связываем руки профессиональным разработчикам - известная дилемма... А потеря качества из-за нехватки в визуальных средствах возможностей оптимизации производительности вас не смущает?

Если почитать множество задач, которые выносятся на этот форум пользователями MS AS, то практически все они легко решаются в PowerPlay визуальными средствами (хотя в PowerPlay нет языка MDX). О чем это может говорить? Я думаю дело в том, что Cognos выпустил этот OLAP-сервер примерно 14 лет назад, и за эти годы, прислушиваясь к требованиям миллионов конечных пользователей, в PowerPlay был заложен широчайший спектр функциональности для решения типичных задач. Это называется термином Completeness of Vision в отчетах компании Gartner, по которому Cognos - явный лидер ( http://mediaproducts.gartner.com/reprints/cognos/116968.html ).

Что касается "нехватки визуальных средств для оптимизации": например, задача по вычислению остатков на основе данных по приходам и расходам. Эта задача в PowerPlay решается легко и все летает (оптимизировать ничего не надо, так как визуальные средства оптимально используют агрегаты). А вот на MDX эту задачу можно решать по-разному, и надо долго оптимизировать, чтобы производительность достигла приличного уровня...

Что касается таких типов оптимизации как разбиение на партиции, многотомные кубы и т.п. - то у Cognos это опять-таки делается визуальными средствами.

Разница между подходами Cognos и Microsoft в следующем: Cognos выпустил очень навороченный OLAP-сервер и заточил на него свои стандартные клиентские интерфейсы из среды Windows, Web и Excel. Microsoft сделал "универсальную" аналитическую платформу (что не менее трудоемко, чем сделать навороченные визуальные средства), чтобы партнеры Microsoft могли с нуля писать под нее клиентские приложения (что приводит к распылению ресурсов).

To backfire:

A kak vi postupaete v teh sluchayah, kogda OLTP sistema archiviruetsya (usekaetsya, obrezaetsya).
V OLTP sistemah vryad li kto hranit dannie o tranzakciyah bolee chem za 1-2 goda. V to vremya kak dlya analiza neredko ispolzuetsya glubina do 10 let.
Kak vi postupaete v teh sluchayah, esli vashu analiticheskuyu model nado modificirovat (dobavit dlya analiza novie fakti, atributi, ili izmereniya).
Chto vi delaete v takom sluchae, kogda v kube imeyutsya dannie po transakziyam, kotorih uzhe net v OLTP?


Такие ситуации встречались в моей практике. Иногда некое хранилище данных уже существовало, и к нему прикручивался инструментарий Cognos напрямую. Бывали случаи, когда в это хранилище закачивались уже несколько агрегированные данные, и не было желания хранить там данные с атомарным уровнем детализации (или хранилища вообще не было). Соответственно приходилось брать стриммерные ленточки, копировать с них на жесткий диск несколько кусков базы данных, настраивать виртуальную вьюшку, и несколько раз выполнять операцию инкрементальной подкачки данных в куб. Но все же, в большинстве случаев в учетной системе (в OLTP) хранились данные за всю историю, и такой проблемы просто не возникало.
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32425599
Владимир Штепа
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
о Mosha

Technet отвечает:
Distinct count measures are also much improved in “Yukon”. A distinct count measure can now be defined on string data, and queries can be defined that will perform a Distinct Count over an arbitrary set. Analysis Services 2000 performed distinct counts only on the predefined hierarchical structure.


BackfireНу наконец-то, а то МДХ такю лажу в 2К версии поставляет - он просто арифметически суммирует значение мер для элементов slicer, а не считает distinct count, для slicer по некольким элементам одного измерения.
Да, мой восторг по поводу distinct count был к сожалению преждевременен.
Ваша цитата из TechNet явно прждевременна. Это мягко говоря "не соответсвует действительности".

Создайте в "Adventure Works" на поле FactSales.ProductKey меру [Product Key]
задав тип аггрегации DistinctCount и выполните следующий запросик.

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
with

set [Set0] as 
[Customer].[Customer Geography].[All].[Germany].children

member [Customer].[Customer Geography].[MemberAggregate0] as
aggregate([Set0])

member [Customer].[Customer Geography].[MemberAggregate1] as
aggregate([Customer].[Customer Geography].[All].[Germany].children)

member [Customer].[Customer Geography].[MemberAggregate2] as
aggregate({
[Customer].[Customer Geography].[All].[Germany].Bayern,
[Customer].[Customer Geography].[All].[Germany].Hamburg,
[Customer].[Customer Geography].[All].[Germany].Hessen,
[Customer].[Customer Geography].[All].[Germany].Saarland,
[Customer].[Customer Geography].[All].[Germany].[Nordrhein-Westfalen]
})

member [Customer].[Customer Geography].[MemberSum0] as
sum([Customer].[Customer Geography].[All].[Germany].children, [Measures].currentmember)

select {
  [Order Time].[Calendar Time].[All],
  [Order Time].[Calendar Time].[All].&[ 2002 ],
  [Order Time].[Calendar Time].[All].&[ 2001 ],
  [Order Time].[Calendar Time].[All].&[ 2003 ]
} on columns,
crossjoin ({
  [Customer].[Customer Geography].[All].[Germany],
  [Customer].[Customer Geography].[MemberAggregate0],
  [Customer].[Customer Geography].[MemberAggregate1],
  [Customer].[Customer Geography].[MemberAggregate2],
  [Customer].[Customer Geography].[MemberSum0],
  [Set0]
},{[Measures].[Product Key]}) on rows 
from [Adventure Works]


Для убедительности даже результат приведу

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
                                All     2002 	   2001     2003 
Germany             Product Key  158      53 	   18 	  128 
MemberAggregate0    Product Key	#Error #Error #Error #Error
MemberAggregate1    Product Key	 158      158 	   158 	  158 
MemberAggregate2    Product Key	#Error #Error #Error #Error
MemberSum0          Product Key	 654      139 	   45 	  471 
Bayern              Product Key	 115      21 	   8 	      74 
Hamburg             Product Key	 122      24 	   7 	      92 
Hessen              Product Key	 137      33 	   11 	  99 
Nordrhein-Westfalen Product Key	 135      25 	   8 	      97 
Saarland            Product Key	 145      36 	   11 	  109 
...
Рейтинг: 0 / 0
MOLAP и SCD
    #32425600
Владимир Штепа
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Прошу прощения, не в ту тему :-(
...
Рейтинг: 0 / 0
45 сообщений из 45, показаны все 2 страниц
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / MOLAP и SCD
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]