Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
Юрий, ну Вы же у нас на все руки эксперт. Вон, гроссмейстеров обыгрывали :)) Ну, я же всё-таки правильно сказал, что проблема SCD для Вас была вновинку? Я же не упрекаю Вас за это. Ну, не знал человек, что тут такого? Он и признался в этом сам. А, вот, если человек пытается преподнести себя сильно много знающим, а на поверку оказывается, что он пороза ещё не нюхал, то это другой вопрос... И давайте, поскорее закончип этот трёп. Юоий, ваше традиционное послднее наставление, и хватит. ОК? С уважением, Константин Лисянский http://lissianski.narod.ru ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2004, 18:24 |
|
||
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
В Express встроенной поддержки SCD нет, в Olap option насколько я знаю тоже. По MS AS нашел такую статью. http://msdn.microsoft.com/library/default.asp?url=/library/en-us/dnolap/html/slowly2.asp Warehouse Builder позволяет проектировать объекты и реляционные и многомерные, если будет сделана поддержка SCD в реляционных объектах это само по себе тоже полезно. А вот если в многомерных - будет вообще здорово. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2004, 18:29 |
|
||
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
Константин, Ну, я же всё-таки правильно сказал, что проблема SCD для Вас была вновинку? Я же не упрекаю Вас за это. Ну, не знал человек, что тут такого? Он и признался в этом сам. Тот факт что я мало читал классиков по ХД (и сейчас не тороплюсь этого делать) не говорит о том, что я не сталкивался с медленно меняющимися измерениями на практике :) Я сталкивался с такими вещами при проектировании кубов на основе данных из ERP-систем и MRP-модулей (где имеет место вариативность структуры номенклатурных позиций во времени), при анализе выполнения заказов, когда статус заказа меняется во времени, и т.п. В каждом случае я не брался за книжки, а сам придумывал решение. P.S. Видимо это старая привычка - когда я активно занимался шахматами, я мало читал теорию дебютов, и все придумывал прямо за шахматной доской... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.02.2004, 18:40 |
|
||
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
JuriiTo Alexander Stoulov: Вы бы тоже поделились бы своими мыслями, удалось ли Вам получить ответы на свой вопрос... Откровенно, говоря, получил, но не до конца. Я был на 99% уверен, что в PowerPlay нельзя решить задачу медленно меняющегося измерения (SCD1 и SCD3 в расчет не берем - это бирюльки :)). Жаль, что к дисскуссии не присоединились господа, которые занимаются MS OLAP, похоже, что им тоже сказать нечего, а их участия я ждал больше всего. Также я рад, что всплыл вопрос в различии терминов DWH & OLAP, просто благодаря энергии Юрия в форуме постоянно шла подмена этих терминов. По-моему, хранилище с помощью MOLAP создать нельзя, и лучшее его применение - это витрина поверх реляционного ХД. С уважением, Стулов Александр ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.02.2004, 13:27 |
|
||
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
Александр, Я был на 99% уверен, что в PowerPlay нельзя решить задачу медленно меняющегося измерения А сейчас Вы - на 100% уверены, что в PowerPlay нельзя решить эту задачу, или по прежнему - на 99%, или Вы поняли, что кое-какие способы в PowerPlay есть? А для меня остался неясным вот какой вопрос: По-моему, хранилище с помощью MOLAP создать нельзя, и лучшее его применение - это витрина поверх реляционного ХД Если в учетной системе (OLTP) хранится в каком-либо виде история, что клиент Петров сначала жил в Москве, потом в Питере, потом в Магадане - то все хорошо - можно либо создать реляционное ХД и на него навесить MOLAP, либо навешивать MOLAP сразу на OLTP. Если же учетная система не хранит историю перемещений Петрова - то никакое реляционное ХД и никакой MOLAP не помогут. Вы согласны с этим? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.02.2004, 14:52 |
|
||
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
2Jurii: Если же учетная система не хранит историю перемещений Петрова - то никакое реляционное ХД и никакой MOLAP не помогут. Вы согласны с этим? Вот, ещё раз, Юрий, видно, что Вы не очень хорошо представляете, что такое хранилище данных и как оно обеспечивает историчность. Дело в том, что OLTP не обязано хранить историю. Его будет хранить имнно хранилище. Достаточно постоянно делать "снимки" статусных атрибутов (таких как город клиента, например), тогда появляется возможность нормально захватывать исторические данные. Это называется CDC (changed data capture) и является одной из дисциплин построения хранилищ данных. Существует несколько способов (опять-таки, давно описанных) это делать. С уважением, Константин Лисянский http://lissianski.narod.ru ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.02.2004, 15:05 |
|
||
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
Константин, Достаточно постоянно делать "снимки" статусных атрибутов (таких как город клиента, например), тогда появляется возможность нормально захватывать исторические данные. Это называется CDC (changed data capture) и является одной из дисциплин построения хранилищ данных. В идеале надо делать 100 снимков в секунду, чтобы не потерять быстро меняющихся изменений... На мой взгляд, инкрементальное обновление MOLAP-куба - это нечто похожее на CDC, не так ли? В реляционном ХД хранить данные конечно надежнее, но я полагаю, что спроектировать и поддерживать такое ХД - трудоемко. Не знаете, есть ли в России реальные проекты по разработке ХД с учетом всех правил знаменитых теоретиков по ХД? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.02.2004, 15:39 |
|
||
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
2Jurii: В идеале надо делать 100 снимков в секунду, чтобы не потерять быстро меняющихся изменений... Ну, конечно, если ваши клиенты умеют так быстро перемещаться из города в город, тут же сообщать Вам об этом, то да. А вообще, советую ещё раз посмотреть на тему этой дискуссии - речь идёт о МЕДЛЕННО изменяющихся измерениях. На мой взгляд, инкрементальное обновление MOLAP-куба - это нечто похожее на CDC, не так ли? Только в части добавления. Бывют ещё два вида изменений - удаление и изменение. В реляционном ХД хранить данные конечно надежнее Разумеется. но я полагаю, что спроектировать и поддерживать такое ХД - трудоемко При правильном подходе спроектировать хранилище довольно несложно. Одна из сложных задач - это очистка и загрузка данных в хранилище. Я ещё не видел ни одного серьёзного источника данных, который бы не нуждался в очистке - дублирующиеся и пропущенные названия, апичатки :), нереальные цифры и прочие ошибки. Когда это всё видишь - никакого доверия к данным не испытываешь. Как можно принимать решения на данных низкого качества? Какого качества будут эти решения? Поэтому и существует два подхода - сделать быстро или сделать качественно. Вы выбираете первый, я - второй. У каждого свои преимущества. Не знаете, есть ли в России реальные проекты по разработке ХД с учетом всех правил знаменитых теоретиков по ХД? Знаю. Есть. Не так много, как за границей, естественно. Здесь мы от них сильно отстали. Не хотим, понимаешь, осваивать эту науку :( С уважением, Константин Лисянский http://lissianski.narod.ru ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.02.2004, 16:01 |
|
||
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
Константин, Поэтому и существует два подхода - сделать быстро или сделать качественно. Вы выбираете первый, я - второй. У каждого свои преимущества. Знаю. Есть. Не так много, как за границей, естественно. Здесь мы от них сильно отстали. Не хотим, понимаешь, осваивать эту науку :( Да, действительно, я предпочитаю делать проекты в более сжатые сроки и без необходимости программирования/рахработок ХД и т.п., для того чтобы аналитическая система была гарантированно высокого качества. Проблема грязных данных, с которыми я борюсь с помощью виртуальных вьюшек - имеет место, не все можно отловить. Но меня успокаивает, что степень скрытой загрязненности данных - обычно невысока, и по той причине, что пользователи проводят сверки своих старых отчетов с новыми отчетами из аналитической системы, нет риска, что аналитическая система увеличит степень загрязненности данных... Так что наши пользователи принимают управленческие решения в условиях несколько недостаточной информации, и ROI этих проектов очень высок (так как в знаменателе не такая большая сумма затрат на проект). А на западе данные лучше очищают, но затраты на проект резко увеличиваются, и поэтому у них ROI не такой высокий. Мне кажется, что наши пользователи лучше понимают, что такое правило Парето :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.02.2004, 17:02 |
|
||
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
Юрий, JuriiА сейчас Вы - на 100% уверены, что в PowerPlay нельзя решить эту задачу, или по прежнему - на 99%, или Вы поняли, что кое-какие способы в PowerPlay есть? Уверен, что нельзя. JuriiНе знаете, есть ли в России реальные проекты по разработке ХД с учетом всех правил знаменитых теоретиков по ХД? Поддерживаю Константина, есть и даже думаю мы говорим о разных с ним проектах. Для сравнения - более 50 атрибутов с справочнике продукции. Вам бы, Юрий, пришлось создавать 50 измерений. И предупреждая Ваш ответ на счет использования Impromptu по OLTP системе, скажу, что в OLTP системе их как раз и нет. Большая их часть берется из внешних источников. JuriiДа, действительно, я предпочитаю делать проекты в более сжатые сроки и без необходимости программирования/рахработок ХД и т.п., для того чтобы аналитическая система была гарантированно высокого качества. По-моему, в русском языке есть более четкое определение такого гарантированного качества данных - дешево и сердито :) JuriiТак что наши пользователи принимают управленческие решения в условиях несколько недостаточной информации, и ROI этих проектов очень высок (так как в знаменателе не такая большая сумма затрат на проект). А на западе данные лучше очищают, но затраты на проект резко увеличиваются, и поэтому у них ROI не такой высокий. Мне кажется, что наши пользователи лучше понимают, что такое правило Парето :) Юрий, Вам как специалисту по маркетингу (в лучшем смысле этого слова и без иронии) хочу подкинуть идею - попробуйте организвать MLM сеть по продаже Cognos, у Вас должно получиться :) С уважением, Стулов Александр BI Partner www.bipartner.ru ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.02.2004, 12:21 |
|
||
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
Александр, Для сравнения - более 50 атрибутов с справочнике продукции. Вам бы, Юрий, пришлось создавать 50 измерений. Можно создать 5 измерений, в каждом из которых будет по 10 альтернативных Дрилл-Даунов. Да даже если делать 50 измерений - это тоже будет неплохо работать, куб от этого не распухнет, хотя в оси фильтра в OLAP-клиенте будет несколько строк... И предупреждая Ваш ответ на счет использования Impromptu по OLTP системе, скажу, что в OLTP системе их как раз и нет. Большая их часть берется из внешних источников. В Impromptu можно внешние источники подключать в виде хот-файлов, это будет выглядеть как будто в основной базе данных появились новые таблицы. Но более интересный вариант - использовать возможность OLAP-сервера создавать многомерные кубы на основе нескольких источников данных разного формата. Например, часть атрибутов брать из основного источника данных, а часть - из внешних источников. По-моему, в русском языке есть более четкое определение такого гарантированного качества данных - дешево и сердито :) Дешево и сердито - это когда качество получаемых услуг и приобретаемых товаров невысокое. Я считаю, что качество подходов "без ХД" и "с ХД" соотносится не как "среднее и дешевое" и "высокое и дорогое", а как "высокое и дешевое" и "очень высокое и дорогое". попробуйте организвать MLM сеть по продаже Cognos, у Вас должно получиться :) Сети MLM - это когда основная цель - "впарить" товар. Что касается продвижения Cognos, то тут более уместен термин "развитие партнерской сети", поскольку продукты Cognos надо не только продавать, но и качественно внедрять. У меня есть ряд партнеров, я продолжаю развивать партнерскую сеть, даже раздел отдельный имеется для этого на сайте http://cognos.narod.ru ... Так что спасибо за идею, но Ваша квалификация в области маркетинга примерно такая же, как и у меня, поэтому мы и мыслим примерно одинаково :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.02.2004, 13:32 |
|
||
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
Коллеги, хотелось бы поделится опытом, но сначала пара замечаний. 1) Мы живем не в башне из слоновой кости и не работаем в Microsoft Research, а делаем конкрентные бизнес-приложения. SCD это не термин для бизнес-приложения, следует перейти к практическим примерам таким как "правка задним числом", "переклассификация" и т.д. В данной постановке вопроса мне интересно делится опытом. Если кому интересно порассуждать о "понятиях" это не ко мне. 2) Мы занятые специалисты и давайте ценить время. Я не отвечаю на флейм и замечания студентов. Теперь по-сути. Несколько близких бизнес-ситуаций. Есть стандартные приемы в том числе на Virtual Dimention, которые описаны в MSDN. Однако историчность можно побороть круче если перейти на 2 других приема. 1. Инкрементальное обновление и сторнирующий DWH. В данном случае история из системы никогда не удаляется, а только сторнируется. Если добавить измерение "Время правки" (не путать с временем проведения), можно легко решить массу вопросов по гулящим аналитикам просто накладывая фильтр по данному измерению. Такой метод я применил в Сатурне. 2. Network Dimention. Создается не Tree, а Сеть. Частный случай это вхождение объекта в несколько узлов в том числе узлы истории. Так делали в Лукойле ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.02.2004, 14:07 |
|
||
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
JuriДа, действительно, я предпочитаю делать проекты в более сжатые сроки и без необходимости программирования/рахработок ХД и т.п., для того чтобы аналитическая система была гарантированно высокого качества. Cto to trudno naiti logiku v vashem utverzhdenii. Visokoe kachestvo soverschenno ne sleduet iz szhatih srokov i otkaza ot DWH. JuriiПроблема грязных данных, с которыми я борюсь с помощью виртуальных вьюшек Esli vi reshaete takei problemi na view, to u vas libo hardware nemeryannoe ili ob'emi DB malenkie. JuriiЯ считаю, что качество подходов "без ХД" и "с ХД" соотносится не как "среднее и дешевое" и "высокое и дорогое", а как "высокое и дешевое" и "очень высокое и дорогое". Pozvolte ne soglasitsya s vami. Esli OLTP, sluzhaschaya istochnikom dannih, takaya zha ne namniogo starshe vashego OLAP-resheniya, to mozhet vi i pravi. Esli zhe OLTP rodilas ranshe, chem upala Berlinskaya Stena (da, ne udivlyaetes, na Zapade eto ne islklyuchenie, a surovaya pravda zhizni), to vash podhod bez DWH voobsche ne proidet. Ivanov SCD это не термин для бизнес-приложения SCS - 3-buklvi i vsem vse ponyatno. Ivanov Однако историчность можно побороть круче если перейти на 2 других приема. 1. Инкрементальное обновление и сторнирующий DWH. В данном случае история из системы никогда не удаляется, а только сторнируется. Если добавить измерение "Время правки" (не путать с временем проведения), можно легко решить массу вопросов по гулящим аналитикам просто накладывая фильтр по данному измерению. Такой метод я применил в Сатурне. A ne mogli bi vi nemnogo podrobnee osvetit vash priem. Chto zhe kokretno imeetsya vvidu? Ivanov 2. Network Dimention. Создается не Tree, а Сеть. Частный случай это вхождение объекта в несколько узлов в том числе узлы истории. Так делали в Лукойле. Chto takoe Network Dimension v ponyatiyah MS AS ili Cognos? Kakim instrumentariem vi delaete Network Dimension? Kak on ustroen? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.02.2004, 18:52 |
|
||
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
To backfire: Cto to trudno naiti logiku v vashem utverzhdenii. Visokoe kachestvo soverschenno ne sleduet iz szhatih srokov i otkaza ot DWH. Я имею в виду, что когда аналитические модели/OLAP-кубы проектируются визуальными средствами - то качество будет высоким. Если же надо писать ручками MDX-выражения, SQL-запросы, создавать новую реляционную БД (ХД), и т.п. - то вступает в силу человеческий фактор, и качество из-за этого страдает. Проблема грязных данных, с которыми я борюсь с помощью виртуальных вьюшек Esli vi reshaete takei problemi na view, to u vas libo hardware nemeryannoe ili ob'emi DB malenkie. Виртуальные вьюшки - это не объекты базы данных (не реальные вьюшки). Виртуальные вьюшки - это фактически SQL-запросы, создаваемые визуальными средствами в модуле Cognos Impromptu. В тех случаях когда данные очищать не нужно, виртуальная вьюшка создается путем простого выбора полей и создания производных вычисляемых полей на основе связанных таблиц. Когда же данные надо очищать - вычисления усложняются, в них включаются правила, в соответствии с которыми надо проводить очистку. Я приводил примеры своих проектов - объемы там очень даже приличные, а железо - довольно скромное. Мощное железо не требуется, поскольку подкачка через виртуальные вьюшки в MOLAP-кубы PowerPlay производится малыми порциями (инкрементально). А в кубах, как известно, пользователи проводят многомерный интерактивный анализ и строят отчеты, не нагружая при этом реляционный сервер SQL-запросами. Esli OLTP, sluzhaschaya istochnikom dannih, takaya zha ne namniogo starshe vashego OLAP-resheniya, to mozhet vi i pravi. Esli zhe OLTP rodilas ranshe, chem upala Berlinskaya Stena (da, ne udivlyaetes, na Zapade eto ne islklyuchenie, a surovaya pravda zhizni), to vash podhod bez DWH voobsche ne proidet. Я помню лето 1990 года, когда от Берлинской Стены остались последние камни (жаль правда что не догадался тогда взять себе один на память :) Но все же это было давно... На территории бывшего СССР мало кто пользовался компьюьерными учетными системами, и еще меньшее их количество сохранилось до сих пор. Думаю не вызывает сомнений, что подавляющее большинство учетных систем в России и СНГ появились либо в начале/середине 90-х годов, либо позже - они работают либо на файл-серверных, либо на клиент-серверных реляционных базах данных, таких форматов как DBF, Paradox, FoxPro/VFP, MS SQL, Interbase, Oracle, DB2, Informix, Sybase, Progress. Ко всем этим источникам данных можно легко приконнектиться (либо через прямой драйвер, либо через ODBC) и спроектировать на их основе аналитические модели - перекачивать данные из них в отдетьную БД (ХД) вовсе не обязательно... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.02.2004, 12:41 |
|
||
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
To Jurii A kak vi postupaete v teh sluchayah, kogda OLTP sistema archiviruetsya (usekaetsya, obrezaetsya). V OLTP sistemah vryad li kto hranit dannie o tranzakciyah bolee chem za 1-2 goda. V to vremya kak dlya analiza neredko ispolzuetsya glubina do 10 let. Kak vi postupaete v teh sluchayah, esli vashu analiticheskuyu model nado modificirovat (dobavit dlya analiza novie fakti, atributi, ili izmereniya). Chto vi delaete v takom sluchae, kogda v kube imeyutsya dannie po transakziyam, kotorih uzhe net v OLTP? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.02.2004, 13:16 |
|
||
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
Я имею в виду, что когда аналитические модели/OLAP-кубы проектируются визуальными средствами - то качество будет высоким. Если же надо писать ручками MDX-выражения, SQL-запросы, создавать новую реляционную БД (ХД), и т.п. - то вступает в силу человеческий фактор, и качество из-за этого страдает. Это хорошо в том случае, если визуальные средства функционально эквивалентны выражениям языков MDX и SQL, в чем я сомневаюсь. Делая инструмент более доступным для бизнес-пользователя связываем руки профессиональным разработчикам - известная дилемма... А потеря качества из-за нехватки в визуальных средствах возможностей оптимизации производительности вас не смущает? A kak vi postupaete v teh sluchayah, kogda OLTP sistema archiviruetsya (usekaetsya, obrezaetsya). V OLTP sistemah vryad li kto hranit dannie o tranzakciyah bolee chem za 1-2 goda. V to vremya kak dlya analiza neredko ispolzuetsya glubina do 10 let. Kak vi postupaete v teh sluchayah, esli vashu analiticheskuyu model nado modificirovat (dobavit dlya analiza novie fakti, atributi, ili izmereniya). Chto vi delaete v takom sluchae, kogda v kube imeyutsya dannie po transakziyam, kotorih uzhe net v OLTP? Вот это интересная тема. В таких случаях обычно без железного лома и такой-то матери не обходится :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.02.2004, 14:33 |
|
||
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
To Tulenev Lom i Mater :-) ? Zachem tak zhestoko. Ya prosto hotel podvesti sozdatelei skorospelih i ne sposobnih evolucionirovat ,a znachit ne dolgo zhivuschih reshenii k tomu, chto bez DWH - grosh cena Kubikam. Eto vse ravno kak inexed view bez nizlezhaschei tablici. Kto mozhet sebe takoe predstavit? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.02.2004, 14:53 |
|
||
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
To Tulenev: Это хорошо в том случае, если визуальные средства функционально эквивалентны выражениям языков MDX и SQL, в чем я сомневаюсь. Делая инструмент более доступным для бизнес-пользователя связываем руки профессиональным разработчикам - известная дилемма... А потеря качества из-за нехватки в визуальных средствах возможностей оптимизации производительности вас не смущает? Если почитать множество задач, которые выносятся на этот форум пользователями MS AS, то практически все они легко решаются в PowerPlay визуальными средствами (хотя в PowerPlay нет языка MDX). О чем это может говорить? Я думаю дело в том, что Cognos выпустил этот OLAP-сервер примерно 14 лет назад, и за эти годы, прислушиваясь к требованиям миллионов конечных пользователей, в PowerPlay был заложен широчайший спектр функциональности для решения типичных задач. Это называется термином Completeness of Vision в отчетах компании Gartner, по которому Cognos - явный лидер ( http://mediaproducts.gartner.com/reprints/cognos/116968.html ). Что касается "нехватки визуальных средств для оптимизации": например, задача по вычислению остатков на основе данных по приходам и расходам. Эта задача в PowerPlay решается легко и все летает (оптимизировать ничего не надо, так как визуальные средства оптимально используют агрегаты). А вот на MDX эту задачу можно решать по-разному, и надо долго оптимизировать, чтобы производительность достигла приличного уровня... Что касается таких типов оптимизации как разбиение на партиции, многотомные кубы и т.п. - то у Cognos это опять-таки делается визуальными средствами. Разница между подходами Cognos и Microsoft в следующем: Cognos выпустил очень навороченный OLAP-сервер и заточил на него свои стандартные клиентские интерфейсы из среды Windows, Web и Excel. Microsoft сделал "универсальную" аналитическую платформу (что не менее трудоемко, чем сделать навороченные визуальные средства), чтобы партнеры Microsoft могли с нуля писать под нее клиентские приложения (что приводит к распылению ресурсов). To backfire: A kak vi postupaete v teh sluchayah, kogda OLTP sistema archiviruetsya (usekaetsya, obrezaetsya). V OLTP sistemah vryad li kto hranit dannie o tranzakciyah bolee chem za 1-2 goda. V to vremya kak dlya analiza neredko ispolzuetsya glubina do 10 let. Kak vi postupaete v teh sluchayah, esli vashu analiticheskuyu model nado modificirovat (dobavit dlya analiza novie fakti, atributi, ili izmereniya). Chto vi delaete v takom sluchae, kogda v kube imeyutsya dannie po transakziyam, kotorih uzhe net v OLTP? Такие ситуации встречались в моей практике. Иногда некое хранилище данных уже существовало, и к нему прикручивался инструментарий Cognos напрямую. Бывали случаи, когда в это хранилище закачивались уже несколько агрегированные данные, и не было желания хранить там данные с атомарным уровнем детализации (или хранилища вообще не было). Соответственно приходилось брать стриммерные ленточки, копировать с них на жесткий диск несколько кусков базы данных, настраивать виртуальную вьюшку, и несколько раз выполнять операцию инкрементальной подкачки данных в куб. Но все же, в большинстве случаев в учетной системе (в OLTP) хранились данные за всю историю, и такой проблемы просто не возникало. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.02.2004, 16:32 |
|
||
|
MOLAP и SCD
|
|||
|---|---|---|---|
|
#18+
о Mosha Technet отвечает: Distinct count measures are also much improved in “Yukon”. A distinct count measure can now be defined on string data, and queries can be defined that will perform a Distinct Count over an arbitrary set. Analysis Services 2000 performed distinct counts only on the predefined hierarchical structure. BackfireНу наконец-то, а то МДХ такю лажу в 2К версии поставляет - он просто арифметически суммирует значение мер для элементов slicer, а не считает distinct count, для slicer по некольким элементам одного измерения. Да, мой восторг по поводу distinct count был к сожалению преждевременен. Ваша цитата из TechNet явно прждевременна. Это мягко говоря "не соответсвует действительности". Создайте в "Adventure Works" на поле FactSales.ProductKey меру [Product Key] задав тип аггрегации DistinctCount и выполните следующий запросик. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. Для убедительности даже результат приведу Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.03.2004, 01:15 |
|
||
|
|

start [/forum/topic.php?fid=49&msg=32407238&tid=1872811]: |
0ms |
get settings: |
7ms |
get forum list: |
19ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
43ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
74ms |
get tp. blocked users: |
1ms |
| others: | 231ms |
| total: | 396ms |

| 0 / 0 |
