Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
2 Volj Нет просто из списка возможных измерений выбираются те, которые нужны для текущего отчета, и по ним автоматом строится GROUP BY SQL выражение, обычно с суммой. Ну и плюс можно иерархии прописывать между измерениями. Поэтому куба нет как такового, есть виртуальный куб, который рисуется после отработки SQL выражения. Для пользователя это видится почти как настоящий OLAP. Для вашей задачи это по-моему подходит больше. Тем более представьте мучения пользователя, которому для каждого конкретного отчета нужны 3-4-5 измерений, а у него на экране нависают все 30 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.11.2003, 17:58 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
2 Jurii Для поиска скрытых закономерностей в основном нужна голова или data mining. Технология визуализации данных имеет второстепенное значение. :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.11.2003, 18:00 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
To Birkhoff: Для пользователя это видится почти как настоящий OLAP. Только вот время отклика будет похуже и по иерархиям не очень удобно будет перемещаться... Тем более представьте мучения пользователя, которому для каждого конкретного отчета нужны 3-4-5 измерений, а у него на экране нависают все 30 Продвинутые OLAP-клиенты позволяют скрыть ненужные измерения, чтобы не нависали :) Для поиска скрытых закономерностей в основном нужна голова или data mining. Технология визуализации данных имеет второстепенное значение Голова всегда нужна :) А OLAP ценен не только визуализацией, но и наличием возможности быстро выбирать нужные оси координат отчета, быстро накладывать фильтры, и мгновенно получать отчет. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.11.2003, 18:19 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
2 Birkhoff: ...и по ним автоматом строится GROUP BY SQL выражение, обычно с суммой Это не совсем то что нужно... Я на 99% уверен, что потребуются, скажем, среднеквадратичные отклонения по вычисляемым показателям, которые строятся на основе нескольких уже существующих. Или сортировка по нескольким открытым последовательно измерениям. Как это сделать SQL-запросом? Опять же "исключение" членов измерений немного муторно через SQL-запросы осуществлять, а уж выброс их в графу "прочие"... Тем более представьте мучения пользователя, которому для каждого конкретного отчета нужны 3-4-5 измерений, а у него на экране нависают все 30 Повторяюсь: если бы заранее можно было бы сказать, по каким измерениям мне нужно делать выборку, я бы сюда со своими вопросами не сунулся :/ Возможно, в будущем это прояснится, но уже после того, как по этому вопросу защитят пару кандидатских... А что касается "нависания", то для этого есть "page"-область :) А про data mining мне бы очень хотелось узнать побольше. Есть ли продукт, в котором интегрирован OLAP и data mining? И где вообще про data mining можно почитать умного? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.11.2003, 18:20 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
To Volj: А про data mining мне бы очень хотелось узнать побольше. Есть ли продукт, в котором интегрирован OLAP и data mining? У Cognos OLAP интегрирован с data mining. Рекомендую скачать с моего сайта небольшую презентацию по теме data mining: http://cognos.narod.ru/Scenario1.ppt Однако самое важное для data mining - это наличие факторов и целевых функций. Чтобы получить их (вычислить на основе данных из учетной системы), надо использовать продукты класса Query & Reporting и/или OLAP. У Cognos все это есть в интегрированном виде. Стоит упомянуть OLAP-сервер MS Analysis Services, в котором есть data mining, о вот функциональности Query & Reporting там нет, по крайней мере пока (это означает, что Вам придется вычислять факторы не визуальными средствами, а с помощью SQL-запросов, которые Вы будете писать вручную). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.11.2003, 18:46 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
Для пользователя это видится почти как настоящий OLAP. Только вот время отклика будет похуже и по иерархиям не очень удобно будет перемещаться... Мне кажется, что удобство перемещения по иерархиям зависит от того, как устроен клиентская часть, а не серверная. В чём, по вашему, может быть неудобство перемещения по иерархиям? Тем более представьте мучения пользователя, которому для каждого конкретного отчета нужны 3-4-5 измерений, а у него на экране нависают все 30 Продвинутые OLAP-клиенты позволяют скрыть ненужные измерения, чтобы не нависали :) Я думаю, что это умеют любые клиенты, а не только продвинутые. Я на 99% уверен, что потребуются, скажем, среднеквадратичные отклонения по вычисляемым показателям, которые строятся на основе нескольких уже существующих. Или сортировка по нескольким открытым последовательно измерениям. Как это сделать SQL-запросом? Опять же "исключение" членов измерений немного муторно через SQL-запросы осуществлять, а уж выброс их в графу "прочие"... В этом плане у Microstrategy всё в порядке - 45 встроенных статистических функции. А уж с вычисляемыми показателями тем более (конечный пользователь имеет возможность создавать свои показатели на основе уже существующих и тут же использовать их в отчётах без необходимости перегенерации кубов). Что касается генерации SQL-запросов для этого, то он генерирует многопроходный SQL, оптимизированный под СУБД, на которой хранятся данные. Исключение членов из измерения делается просто и выброс в графу "прочие" - тоже с помощью механизма пользовательских группировок. Более того, можно создать "виртуальное" измерение, основанное на вычисляемых показателях. Более того, оно может состоятьЭто уже обсуждалось в топике "BO: хитрое ранжирование". Так, что здесь у ROLAP позиции довльно сильные. Про data mining рекомендую почитать на www.megaputer.ru И прдукты у них есть соответствующие (не только деревья решений как у Cognos). У Microstrategy data mining отсутствует, хотя они и пишут, что он есть. Из всех производителей OLAP, мне кажется, только у Microsoft есть что-то более-менее достойное. Но если намерения серьёзные, то лучше рассматривать решения третьих компаний (Megaputer, SPSS, SAS, Angoss etc.) Успехов. С уважением, Константин Лисянский ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.11.2003, 19:10 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
Самая мощная поддержка статистики у SAS, но там своих проблем много. А OLAP и Data Mining в одном флаконе есть и у Oracle. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.11.2003, 19:27 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
To Константин: Мне кажется, что удобство перемещения по иерархиям зависит от того, как устроен клиентская часть, а не серверная. В чём, по вашему, может быть неудобство перемещения по иерархиям? В продуктах класса ROLAP, насколько я знаю, не все в порядке с поддержкой несбалансированных иерархий. Например, если по одной ветви иерархии есть 3 уровня, а по другой - 6 уровней, то в серверной части PowerPlay это решается с помощью схлопывания пустых уровней иерархии. Также не уверен, что в ROLAP можно решать такие задачи как вывод в отчет всех листьев произвольного узла иерархии. Продвинутые OLAP-клиенты позволяют скрыть ненужные измерения, чтобы не нависали :) Я думаю, что это умеют любые клиенты, а не только продвинутые. Если я не ошибаюсь, Вы больше знакомы с OLAP-клиентом PowerPlay. Это продвинутый клиент. А во многих других клиентах нет многого из того, что есть в PowerPlay... В этом плане у Microstrategy всё в порядке - 45 встроенных статистических функции. Это так, но я думаю, что г-н Volj имел в виду следующее: когда куб готов, пользователь в своем интерфейсе помечает нужные статистические показатели, они выводятся на экран, и в зависимости от изменения данных в отчете в ходе многомерного анализа - мгновенно пересчитываются. Исключение членов из измерения делается просто и выброс в графу "прочие" - тоже с помощью механизма пользовательских группировок. ROLAP-продукты это позволяют, но они на это не заточены! То есть сделать это не так удобно, как например создать вычисляемую строку прочие в OLAP-клиенте и скрыть остальные ненужные строки. Я уж не говорю про Парэто-фильтр "80 на 20" в OLAP-клиенте, когда пользователю не надо думать, кого запихивать в группу прочие... У Microstrategy data mining отсутствует, хотя они и пишут, что он есть. Из всех производителей OLAP, мне кажется, только у Microsoft есть что-то более-менее достойное В том то и проблема, что мало у кого есть Query & Reporting, OLAP и data mining в ИНТЕГРИРОВАННОМ виде. Видимо поэтому Cognos, как аналитический продукт, во всех известных рейтингах стоит либо на первом месте, либо в тройке лидеров. Конкуренцию Cognos теоретически могли бы составить Microsoft и Oracle, но у этих компаний другая стратегия - ориентироваться на разработчиков - чтобы в мире было много приложений на их платформах со средненьким качеством, а не одно - с высоким качеством (многочисленные разрозненные разработчики не могут инвестировать в разработку столько, сколько инвестирует крупный производитель BI-продуктов). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.11.2003, 10:39 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
2 Jurii В чём, по вашему, может быть неудобство перемещения по иерархиям? В продуктах класса ROLAP, насколько я знаю, не все в порядке с поддержкой несбалансированных иерархий. Попали в точку. Действительно, существуют с этим сложности. Есть, конечно, пути решения, но, наверное, в целом, у MOLAP здесь преимущество. В особенности, у MS AS, где существует явная поддержка несбалансированных иерархий. Да, и у Cognos в этом, вроде бы, всё в порядке. Например, если по одной ветви иерархии есть 3 уровня, а по другой - 6 уровней, то в серверной части PowerPlay это решается с помощью схлопывания пустых уровней иерархии. А если сервер не использовать? Если куб только на клиенте, тогда как? Я уже подзабыл как это там будет. Также не уверен, что в ROLAP можно решать такие задачи как вывод в отчет всех листьев произвольного узла иерархии. Элементарное знание SQL даёт ответ на этот вопрос - ставим фильтр на ужел иерархии, а в отчёт выбираем любой (не только листовой) уровень иерархии. В этом плане Cognos проигрывает, поскольку позволяет выбрать в клиенте только либо ближайших потомков, либо листовые уровни. Если я не ошибаюсь, Вы больше знакомы с OLAP-клиентом PowerPlay. Это продвинутый клиент. А во многих других клиентах нет многого из того, что есть в PowerPlay... Ошибаетесь, не только с PowerPlay. PowerPlay, действительно удобен, не спорю. Только функциональности очень не хватает. В этом плане у Microstrategy всё в порядке - 45 встроенных статистических функции. Это так, но я думаю, что г-н Volj имел в виду следующее: когда куб готов, пользователь в своем интерфейсе помечает нужные статистические показатели, они выводятся на экран, и в зависимости от изменения данных в отчете в ходе многомерного анализа - мгновенно пересчитываются. Возможно, он и имел это в виду - не знаю. 2 Volj - А что Вы имели в виду? Исключение членов из измерения делается просто и выброс в графу "прочие" - тоже с помощью механизма пользовательских группировок. ROLAP-продукты это позволяют, но они на это не заточены! То есть сделать это не так удобно, как например создать вычисляемую строку прочие в OLAP-клиенте и скрыть остальные ненужные строки. Я уж не говорю про Парэто-фильтр "80 на 20" в OLAP-клиенте, когда пользователю не надо думать, кого запихивать в группу прочие... Всё это делается довольно легко. Не надо строить неправильных предположений. Очевидно, Вам стоит познакомиться с Microstrategy. Тогда, Ваши аргументы, что он неудобен будут звучать убедительно. Как у Cognos с правилом 70 на 30 дела обстоят? Или с 65 на 35? Можно это так же легко сделать? У Microstrategy data mining отсутствует, хотя они и пишут, что он есть. Из всех производителей OLAP, мне кажется, только у Microsoft есть что-то более-менее достойное В том то и проблема, что мало у кого есть Query & Reporting, OLAP и data mining в ИНТЕГРИРОВАННОМ виде. Это вполне нормально. Интегрировать всё могут себе позволить только очень крупные компании. Интегрированные решения имеют компании IBM, Oracle, NCR, то есть крупнейшие игроки на рынке хранилищ данных. К вопросу о data mining - а какие у Cognos продукты класса data mining? (подсказка: 4Thought не называть - нейронные сети, как ни странно, не относятся к data mining). Видимо поэтому Cognos, как аналитический продукт, во всех известных рейтингах стоит либо на первом месте, либо в тройке лидеров. Насчёт интегрированности решения Cognos - я бы всё-таки постеснялся. Разрозненные несовместимые метаданные в нескольких продуктах и никакой возможности ими нормально управлять. У них только в последнее время наметились тенденции на интеграцию. Но, не знаю, как они смогут этот зоопарк интегрировать. Практический пример - Вы можете точно сказать в каких отчётах Impromptu и кубах PowerPlay участвуют данные из определённой таблицы базы данных? Сколько Вам понадобится времени для ответа на этот вопрос? Конкуренцию Cognos теоретически могли бы составить Microsoft и Oracle, но у этих компаний другая стратегия - ориентироваться на разработчиков - чтобы в мире было много приложений на их платформах со средненьким качеством, а не одно - с высоким качеством (многочисленные разрозненные разработчики не могут инвестировать в разработку столько, сколько инвестирует крупный производитель BI-продуктов). Как показывает практика, конкуренции с Microsoft не выдерживает ни одна маленькая компания (каковой является Cognos, да и Microstrategy и BusinessObjects). С Microsoft надо дружить, а не конкурировать, но всё равно сожрут :) С уважением, Константин Лисянский http://lissianski.narod.ru ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.11.2003, 12:16 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
Я на 99% уверен, что потребуются, скажем, среднеквадратичные отклонения по вычисляемым показателям, которые строятся на основе нескольких уже существующих. ... пользователь в своем интерфейсе помечает нужные статистические показатели, они выводятся на экран, и в зависимости от изменения данных в отчете в ходе многомерного анализа - мгновенно пересчитываются Я име в виду две задачки, одну попроще, другую посложнее... Как известно, среднеквадратичное отклонение есть функция от одномерного массива чисел (будем брать OLAP-толкование). В OLAP в качестве этого массива используются данные, саггрегированные в одну ячейку куба, отображаемого в клиенте. Так вот: нужно, как минимум, уметь строить новые вычисляемые показатели на основе вычисленных значений среднеквадратичных отклонений существующих в таблице фактов показателей. как максимум, нужно уметь строить собственные вычисляемые показатели на основе существующих в таблице фактов, а в OLAP-клиенте показывать уже ИХ среднеквадратичное отклонение. Ну и, разумеется, делать все вышеописанное достаточно быстро (до 10 секунд). В принципе, 250 000 - это действительно небольшой объем для такого рода вычислений, мгновенности я не требую :) Всем: Мне, пока я писал это, пришел в голову интересный вопрос: Допустим, в таблице фактов есть несколько записей, попадающих в одну и ту же ячейку куба. Как считается в этом случае среднеквадратичное отклоенение? Как функция от нескольких значений (реально лежащих в табл фактов) или как функция от аггрегированного значения? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.11.2003, 12:49 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
2 Константин Почему нейросети не относятся к Data Mining? 2 Volj В MOLAP не бывает, чтобы в одну ячейку несколько записей попадали. Данные должн ылибо агрегироваться по какому то принципу, либо будет храниться одно из значений. Либо нужно заводить еще одно измерение. А в ROLAP такое часто бывает, но тоже в итоге на эти несколько записей применяется какая агрегация. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.11.2003, 13:53 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
2 Volj Кстати функция вычисления среднеквадратичного отклонения насколько я помню зашита в Oracle SQL и значить ее можно использовать в любом SQL выражении и следовательно в любом ROLAP клиенте. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.11.2003, 13:58 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
2 Birkhoff: В MOLAP не бывает, чтобы в одну ячейку несколько записей попадали. Но в реальности-то сплошь и рядом :(( А среднеквадратичное отклонение (и медиана, да и многе другие статфункции, наверное), как нетрудно убедиться, при этом совсем другие получаются... И, грубо выражаясь, толку от этих функций, если они считают аггрегированное значение, просто никакого. Фикция, а не функция. Могу примеры привести, если интересует... Извините, это не наезд, просто это плохо очень тогда. 2 Константин: Еще раз спасибо за ценную инф и ссылки. Здорово! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.11.2003, 14:09 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
To Константин: В особенности, у MS AS, где существует явная поддержка несбалансированных иерархий. Этот вопрос в свое время детально обсуждался. У MS AS есть поддержка в явном виде структуры ID, Name, Parent_ID, но работает она реально на не очень ветвистых измерениях (до 5 тысяч листьев все OK, до 50 тысяч - еще можно, но более 50 тысяч - тормозит). Схлопывания пустых уровней иерархии у MS AS не было обнаружено. Таким образом, у Cognos работа с несбалансированными иерархиями иногда менее удобна, чем в MS AS, но зато - более универсальна (в случаях когда иерархия хранится не в трех полях, а по-другому, или на больших объемах данных). А если сервер не использовать? Если куб только на клиенте, тогда как? Я уже подзабыл как это там будет. Вы наверное спрашиваете про минимальную конфигурацию PowerPlay User? Если да - то ее функциональность и мощность мало отличается от более серьезных серверных конфигураций PowerPlay. Схлопывание уровней в PPU имеется. PowerPlay, действительно удобен, не спорю. Только функциональности очень не хватает. Как-то г-н GoodLeo перечислил свои требования к OLAP-клиентам, и PowerPlay наиболее полно соответствует этим требованиям. Если Вы не находите в OLAP-продукте PowerPlay той функциональности, которая есть в знакомых Вам продуктах класса Query & Reporting, то такая функциональность есть в продукте Cognos Impromptu, который обычно используется в связке с PowerPlay. Очевидно, Вам стоит познакомиться с Microstrategy С удовольствием это сделаю, как только подвернется такая возможность :) Как у Cognos с правилом 70 на 30 дела обстоят? Или с 65 на 35? Можно это так же легко сделать? Это можно делать либо в Impromptu (по аналогии с BusinessObjects или Microstrategy), либо в PowerPlay, используя функцию "Кумулятивный Процент от базы". Интегрировать всё могут себе позволить только очень крупные компании. Интегрированные решения имеют компании IBM, Oracle, NCR, то есть крупнейшие игроки на рынке хранилищ данных. Я думаю у нас разные понятия о термине интегрированность. Вы хотите сказать, что SQL-запросы, подготовленные в Oracle Discoverer можно использовать как таблицы фактов для Oracle Express? В том то и весь кайф, что результаты работы Cognos Impromptu могут быть сохранены в виде виртуальной вьюшки, и эта вьюшка служит таблицей фактов для проектирования кубов PowerPlay и источником данных для data mining в Scenario. А из куба PowerPlay ожно настроить drill through через эту вьюшку, причем визуальными средствами. К вопросу о data mining - а какие у Cognos продукты класса data mining? (подсказка: 4Thought не называть - нейронные сети, как ни странно, не относятся к data mining). Сами по себе нейронные сети может и не относятся к Data Mining, но 4Thought - это продукт, позволяющий анализировать влияние факторов на целевые функции - на мой взгляд это чистый data mining. Ну и еще к data mining относится вышеупомянутый продукт Scenario. Насчёт интегрированности решения Cognos - я бы всё-таки постеснялся. Практический пример - Вы можете точно сказать в каких отчётах Impromptu и кубах PowerPlay участвуют данные из определённой таблицы базы данных? Сколько Вам понадобится времени для ответа на этот вопрос? На практике интеграция Cognos работает через виртуальные вьюшки. И поскольку продукты Cognos умеют работать напрямую с OLTP, структура которой меняется редко - отвечать на Ваш вопрос тоже приходится редко. А те продукты, которые требуют единое ХД (MS AS и все продукты ROLAP/Query & Reporting) - действительно нуждаются в быстрых ответах на Ваш вопрос, поскольку ХД изменяется/дорабатывается часто. Как показывает практика, конкуренции с Microsoft не выдерживает ни одна маленькая компания (каковой является Cognos, да и Microstrategy и BusinessObjects). С Microsoft надо дружить, а не конкурировать, но всё равно сожрут :) Теоретически Вы правы, но на практике наблюдается обратное, причем благодаря человеческому фактору, против которого ничего не сделаешь :) Например выход MS AS - несколько лет назад я думал, что это серьезный конкурент для Cognos. И вот, MS AS вошел на массовый рынок, среднее качество внедрений его - невысокое, поскольку продукт сложный и не очень дружественный, а экспертов по нему - мало. Аналогичный случай с системой Аксапта - маркетинговая раскрутка - очень хорошая, а вот на практике при внедрениях бывают громкие провалы... Я бы на месте Microsoft попытался бы скупить всех конкурентов, но видимо это тоже не так просто (либо будет возражать Антимонопольный комитет, либо сами конкуренты не продадутся :) А что касается дружбы с Microsoft, то у Cognos это имеется (прямые драйверы к MS SQL, работа напрямую с Excel, Access, PowerPlay User - это в том числе OLAP-клиент для MS AS, Cognos поддерживает настройки безопасности Active Directory Server, использует MS Internet Explorer как Web-клиента и т.п.). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.11.2003, 14:29 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
2 Jurii Кстати в Discoverer можно во первых нажать одну кнопку и по сгенеренной в данный момент странице построится база данных экспресс с кубом. А во вторых никто не мешает использовать сгенеренный в Dsicoverer SQL для загрузки кубов. Или я не понял, что ты имел в виду? 2 Volj Давайте вы приведете какой нибудь очень простой пример и обсудим какими технологиями с ним стоит работать а какими нет? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.11.2003, 15:12 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
2 Birkhoff: Давайте вы приведете какой нибудь очень простой пример и обсудим какими технологиями с ним стоит работать а какими нет? Пример не мой (чтобы объяснить, что нужно делать мне, требуется слишком много спецтеримнов использовать :) ) но, по моему, актуальный: Поиск любых отклонений от среднестатистических величин и выявление закономерностей, присущих этому отклонению (в этих методиках используются как раз медианы и среднеквадратичные отклонения). Из жизни: поиск испорченных транков в телефонии и выявление закономерностей "падения" разговора, поиск ошибок операторов при вводе и выявление закономерностей появления ошибок (может, какой-то оператор постоянно ошибки лепит, и его пора увольнять) и т.д... Куб организован так, что есть несколько "значащих" измерений, и временная координата. Временная координата, естественно, образует еще какие-то измерения, допустим, день недели недели и час (в качестве примера). Большая детализация просто не нужна. А записи добавляются, допустим, каждые несколько секунд. Разумеется, получается, что одной ячейке куба может, теоретически, соответствовать произвольное к-во записей. А в качестве меры для статистических функций мне важны не усредненные данные в этой ячейке и не суммированные, а именно те, которые лежат в таблице фактов, иначе я не смогу отследить резкие всплески ошибок на уровне общего "фона", который является более-менее постоянным. Достаточно? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.11.2003, 18:03 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
2 Birkhoff: Добавление: вообще, возьмите любую задачу, где идет работа со статистическими функциями и где они действительно необходимы, и их использование не является придурью аналитика (что бывает ;-) ). Вот и будет вам пример :) Ведь вы не будете отрицать, надеюсь, что в случае работы с аггрегированными значениями (саггрегированными любой функцией), статфункции выдадут вам неверный результат? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.11.2003, 18:14 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
2 Volj Нет, я понимаю что такое реальные задачи. Просто интересно взять конкретную задачку чтобы все ее представляли и рассмотреть какие ограничения есть на нее при разных подходах. Например берем тесовую табличку из 10 записей с такими то колонками и пытаемся разными средствами решить задачу по подсчету отклонения, причем эталонный результат известен. Если можно написать запрос который правильно считает отклонение, то это значит что задача в принципе решаема, проблема может быть в том что вы хотите чтобы она решалась именно при тех ограничениях, которые на нее накладываются. Думаю что несколько записей в одну ячейку появляются только тогда, когда недодумана структура куба. Наверняка есть еще что то что отличает одну запись от другой. Может быть время? Чем они отличаются в самой базе? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.11.2003, 18:22 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
2 Birkhoff: Мне кажется, настало время новую тему открыть :) Киньте туда свои ответы, plz ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.11.2003, 18:29 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
2 Volj Мне кажется что это вы можете нам подкинуть интересный пример :) Вам виднее, раз вы вообще эту тему открыли. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.11.2003, 18:33 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
Jurii писал:Схлопывания пустых уровней иерархии у MS AS не было обнаружено. Наверное, плохо искали. Можно прятать уровни с пустым именем, с именем родителя, или только "единственных детей" с пустым именем или именем родителя. Разве это не оно? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.11.2003, 08:52 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
2 Volj автор писал:А записи добавляются, допустим, каждые несколько секунд В вашей задаче не ясно, нужно ли мониторить данные в реальном времени, или достаточно иметь для анализа несколько устаревшие (за последний час или день) данные. Этот вопрос серьезно может повлиять на выбор ПО. И потом, при такой скорости добавления предпосылка о 250000 записей в таблице фактов скоро станет неверной. автор писал:Поиск любых отклонений от среднестатистических величин и выявление закономерностей Все-таки, известно, на какие вопросы вы хотите найти ответ или нет? Такое ощущение, что задача плохо поставлена, поэтому вы хотите использовать OLAP как средство быстрого построения нерегламентированных запросов. Если есть модель, как решать задачу, некий алгоритм, то достаточно посчитать программно некую функцию (коэфф. ошибочной работы телефониста, грубо говоря) и найти самых тупых телефонистов и их уволить, а в следующий раз посчитать снова через месяц. При этом никакие кубы не нужны. автор писал:Ведь вы не будете отрицать, надеюсь, что в случае работы с аггрегированными значениями (саггрегированными любой функцией), статфункции выдадут вам неверный результат? Я буду. Сгласен с теми, кто говорит, что в каждая ячейка определяется уникальными значениями измерений. Любая статфункция выполняется на множестве, а следовательно, является функцией агрегации. И если уж использовать OLAP в вашем случае, то именно с такими функциями агрегации. Успехов. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.11.2003, 12:23 |
|
||
|
30 измерений в таблице фактов
|
|||
|---|---|---|---|
|
#18+
2 Tsaryov S: В первых двух вопросах Вы немного спутали мухи с котлетами - прочитайте мое сообщение от 18:03 повнимательнее, и тогда Вам станет понятно, что пример, который я привожу для г-на Birkhoff, не имеет ничего общего с моей реальной задачей. Посему комментировать два первых Ваши вопроса, я думаю, не нужно. По третьему вопросу см. тему "расчет статфункций в перенасыщенных кубах", я отвечу Вам там. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.11.2003, 13:29 |
|
||
|
|

start [/forum/topic.php?fid=49&msg=32336762&tid=1872978]: |
0ms |
get settings: |
10ms |
get forum list: |
14ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
105ms |
get topic data: |
14ms |
get forum data: |
4ms |
get page messages: |
82ms |
get tp. blocked users: |
2ms |
| others: | 262ms |
| total: | 499ms |

| 0 / 0 |
