30 измерений в таблице фактов / OLAP и DWH

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / 30 измерений в таблице фактов

23 сообщений из 48, страница 2 из 2

все

30 измерений в таблице фактов

#32335887

Birkhoff

Участник

Откуда: Москва

Сообщения: 2 987

Рейтинг: 0 / 0

2 Volj

Нет просто из списка возможных измерений выбираются те, которые нужны для текущего отчета, и по ним автоматом строится GROUP BY SQL выражение, обычно с суммой. Ну и плюс можно иерархии прописывать между измерениями.
Поэтому куба нет как такового, есть виртуальный куб, который рисуется после отработки SQL выражения.
Для пользователя это видится почти как настоящий OLAP.
Для вашей задачи это по-моему подходит больше.
Тем более представьте мучения пользователя, которому для каждого конкретного отчета нужны 3-4-5 измерений, а у него на экране нависают все 30

...

Рейтинг:

0 / 0

26.11.2003, 17:58:26

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32335894

Birkhoff

Участник

Откуда: Москва

Сообщения: 2 987

Рейтинг: 0 / 0

2 Jurii

Для поиска скрытых закономерностей в основном нужна голова или data mining. Технология визуализации данных имеет второстепенное значение. :)

...

Рейтинг:

0 / 0

26.11.2003, 18:00:15

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32335927

Jurii

Участник

Откуда: Moscow http://cognos.narod.ru

Сообщения: 2 966

Рейтинг: 0 / 0

To Birkhoff:

Для пользователя это видится почти как настоящий OLAP.

Только вот время отклика будет похуже и по иерархиям не очень удобно будет перемещаться...

Тем более представьте мучения пользователя, которому для каждого конкретного отчета нужны 3-4-5 измерений, а у него на экране нависают все 30

Продвинутые OLAP-клиенты позволяют скрыть ненужные измерения, чтобы не нависали :)

Для поиска скрытых закономерностей в основном нужна голова или data mining. Технология визуализации данных имеет второстепенное значение

Голова всегда нужна :) А OLAP ценен не только визуализацией, но и наличием возможности быстро выбирать нужные оси координат отчета, быстро накладывать фильтры, и мгновенно получать отчет.

...

Рейтинг:

0 / 0

26.11.2003, 18:19:18

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32335930

Volj

Участник

Сообщения: 150

Рейтинг: 0 / 0

2 Birkhoff:

...и по ним автоматом строится GROUP BY SQL выражение, обычно с суммой
Это не совсем то что нужно... Я на 99% уверен, что потребуются, скажем, среднеквадратичные отклонения по вычисляемым показателям, которые строятся на основе нескольких уже существующих. Или сортировка по нескольким открытым последовательно измерениям. Как это сделать SQL-запросом? Опять же "исключение" членов измерений немного муторно через SQL-запросы осуществлять, а уж выброс их в графу "прочие"...

Тем более представьте мучения пользователя, которому для каждого конкретного отчета нужны 3-4-5 измерений, а у него на экране нависают все 30
Повторяюсь: если бы заранее можно было бы сказать, по каким измерениям мне нужно делать выборку, я бы сюда со своими вопросами не сунулся :/ Возможно, в будущем это прояснится, но уже после того, как по этому вопросу защитят пару кандидатских... А что касается "нависания", то для этого есть "page"-область :)

А про data mining мне бы очень хотелось узнать побольше. Есть ли продукт, в котором интегрирован OLAP и data mining? И где вообще про data mining можно почитать умного?

...

Рейтинг:

0 / 0

26.11.2003, 18:20:26

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32335957

Jurii

Участник

Откуда: Moscow http://cognos.narod.ru

Сообщения: 2 966

Рейтинг: 0 / 0

To Volj:

А про data mining мне бы очень хотелось узнать побольше. Есть ли продукт, в котором интегрирован OLAP и data mining?

У Cognos OLAP интегрирован с data mining. Рекомендую скачать с моего сайта небольшую презентацию по теме data mining:
http://cognos.narod.ru/Scenario1.ppt

Однако самое важное для data mining - это наличие факторов и целевых функций. Чтобы получить их (вычислить на основе данных из учетной системы), надо использовать продукты класса Query & Reporting и/или OLAP. У Cognos все это есть в интегрированном виде.

Стоит упомянуть OLAP-сервер MS Analysis Services, в котором есть data mining, о вот функциональности Query & Reporting там нет, по крайней мере пока (это означает, что Вам придется вычислять факторы не визуальными средствами, а с помощью SQL-запросов, которые Вы будете писать вручную).

...

Рейтинг:

0 / 0

26.11.2003, 18:46:29

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32335978

Константин Лисянский

Участник

Откуда: Москва

Сообщения: 884

Рейтинг: 0 / 0

Для пользователя это видится почти как настоящий OLAP.

Только вот время отклика будет похуже и по иерархиям не очень удобно будет перемещаться...

Мне кажется, что удобство перемещения по иерархиям зависит от того, как устроен клиентская часть, а не серверная.
В чём, по вашему, может быть неудобство перемещения по иерархиям?

Тем более представьте мучения пользователя, которому для каждого конкретного отчета нужны 3-4-5 измерений, а у него на экране нависают все 30

Продвинутые OLAP-клиенты позволяют скрыть ненужные измерения, чтобы не нависали :)

Я думаю, что это умеют любые клиенты, а не только продвинутые.

Я на 99% уверен, что потребуются, скажем, среднеквадратичные отклонения по вычисляемым показателям, которые строятся на основе нескольких уже существующих. Или сортировка по нескольким открытым последовательно измерениям. Как это сделать SQL-запросом? Опять же "исключение" членов измерений немного муторно через SQL-запросы осуществлять, а уж выброс их в графу "прочие"...

В этом плане у Microstrategy всё в порядке - 45 встроенных статистических функции. А уж с вычисляемыми показателями тем более (конечный пользователь имеет возможность создавать свои показатели на основе уже существующих и тут же использовать их в отчётах без необходимости перегенерации кубов). Что касается генерации SQL-запросов для этого, то он генерирует многопроходный SQL, оптимизированный под СУБД, на которой хранятся данные.
Исключение членов из измерения делается просто и выброс в графу "прочие" - тоже с помощью механизма пользовательских группировок. Более того, можно создать "виртуальное" измерение, основанное на вычисляемых показателях. Более того, оно может состоятьЭто уже обсуждалось в топике "BO: хитрое ранжирование".

Так, что здесь у ROLAP позиции довльно сильные.

Про data mining рекомендую почитать на www.megaputer.ru
И прдукты у них есть соответствующие (не только деревья решений как у Cognos).

У Microstrategy data mining отсутствует, хотя они и пишут, что он есть.
Из всех производителей OLAP, мне кажется, только у Microsoft есть что-то более-менее достойное. Но если намерения серьёзные, то лучше рассматривать решения третьих компаний (Megaputer, SPSS, SAS, Angoss etc.)

Успехов.

С уважением,
Константин Лисянский

...

Рейтинг:

0 / 0

26.11.2003, 19:10:57

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32335987

Birkhoff

Участник

Откуда: Москва

Сообщения: 2 987

Рейтинг: 0 / 0

Самая мощная поддержка статистики у SAS, но там своих проблем много.
А OLAP и Data Mining в одном флаконе есть и у Oracle.

...

Рейтинг:

0 / 0

26.11.2003, 19:27:39

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32336359

Jurii

Участник

Откуда: Moscow http://cognos.narod.ru

Сообщения: 2 966

Рейтинг: 0 / 0

To Константин:

Мне кажется, что удобство перемещения по иерархиям зависит от того, как устроен клиентская часть, а не серверная.
В чём, по вашему, может быть неудобство перемещения по иерархиям?

В продуктах класса ROLAP, насколько я знаю, не все в порядке с поддержкой несбалансированных иерархий. Например, если по одной ветви иерархии есть 3 уровня, а по другой - 6 уровней, то в серверной части PowerPlay это решается с помощью схлопывания пустых уровней иерархии. Также не уверен, что в ROLAP можно решать такие задачи как вывод в отчет всех листьев произвольного узла иерархии.

Продвинутые OLAP-клиенты позволяют скрыть ненужные измерения, чтобы не нависали :)
Я думаю, что это умеют любые клиенты, а не только продвинутые.

Если я не ошибаюсь, Вы больше знакомы с OLAP-клиентом PowerPlay. Это продвинутый клиент. А во многих других клиентах нет многого из того, что есть в PowerPlay...

В этом плане у Microstrategy всё в порядке - 45 встроенных статистических функции.

Это так, но я думаю, что г-н Volj имел в виду следующее: когда куб готов, пользователь в своем интерфейсе помечает нужные статистические показатели, они выводятся на экран, и в зависимости от изменения данных в отчете в ходе многомерного анализа - мгновенно пересчитываются.

Исключение членов из измерения делается просто и выброс в графу "прочие" - тоже с помощью механизма пользовательских группировок.

ROLAP-продукты это позволяют, но они на это не заточены! То есть сделать это не так удобно, как например создать вычисляемую строку прочие в OLAP-клиенте и скрыть остальные ненужные строки. Я уж не говорю про Парэто-фильтр "80 на 20" в OLAP-клиенте, когда пользователю не надо думать, кого запихивать в группу прочие...

У Microstrategy data mining отсутствует, хотя они и пишут, что он есть.
Из всех производителей OLAP, мне кажется, только у Microsoft есть что-то более-менее достойное

В том то и проблема, что мало у кого есть Query & Reporting, OLAP и data mining в ИНТЕГРИРОВАННОМ виде. Видимо поэтому Cognos, как аналитический продукт, во всех известных рейтингах стоит либо на первом месте, либо в тройке лидеров.
Конкуренцию Cognos теоретически могли бы составить Microsoft и Oracle, но у этих компаний другая стратегия - ориентироваться на разработчиков - чтобы в мире было много приложений на их платформах со средненьким качеством, а не одно - с высоким качеством (многочисленные разрозненные разработчики не могут инвестировать в разработку столько, сколько инвестирует крупный производитель BI-продуктов).

...

Рейтинг:

0 / 0

27.11.2003, 10:39:21

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32336539

Константин Лисянский

Участник

Откуда: Москва

Сообщения: 884

Рейтинг: 0 / 0

2 Jurii

В чём, по вашему, может быть неудобство перемещения по иерархиям?

В продуктах класса ROLAP, насколько я знаю, не все в порядке с поддержкой несбалансированных иерархий.

Попали в точку. Действительно, существуют с этим сложности.
Есть, конечно, пути решения, но, наверное, в целом, у MOLAP здесь преимущество. В особенности, у MS AS, где существует явная поддержка несбалансированных иерархий. Да, и у Cognos в этом, вроде бы, всё в порядке.

Например, если по одной ветви иерархии есть 3 уровня, а по другой - 6 уровней, то в серверной части PowerPlay это решается с помощью схлопывания пустых уровней иерархии.

А если сервер не использовать? Если куб только на клиенте, тогда как? Я уже подзабыл как это там будет.

Также не уверен, что в ROLAP можно решать такие задачи как вывод в отчет всех листьев произвольного узла иерархии.

Элементарное знание SQL даёт ответ на этот вопрос - ставим фильтр на ужел иерархии, а в отчёт выбираем любой (не только листовой) уровень иерархии.
В этом плане Cognos проигрывает, поскольку позволяет выбрать в клиенте только либо ближайших потомков, либо листовые уровни.

Если я не ошибаюсь, Вы больше знакомы с OLAP-клиентом PowerPlay. Это продвинутый клиент. А во многих других клиентах нет многого из того, что есть в PowerPlay...

Ошибаетесь, не только с PowerPlay.
PowerPlay, действительно удобен, не спорю. Только функциональности очень не хватает.

В этом плане у Microstrategy всё в порядке - 45 встроенных статистических функции.

Это так, но я думаю, что г-н Volj имел в виду следующее: когда куб готов, пользователь в своем интерфейсе помечает нужные статистические показатели, они выводятся на экран, и в зависимости от изменения данных в отчете в ходе многомерного анализа - мгновенно пересчитываются.

Возможно, он и имел это в виду - не знаю.

2 Volj - А что Вы имели в виду?

Исключение членов из измерения делается просто и выброс в графу "прочие" - тоже с помощью механизма пользовательских группировок.

ROLAP-продукты это позволяют, но они на это не заточены! То есть сделать это не так удобно, как например создать вычисляемую строку прочие в OLAP-клиенте и скрыть остальные ненужные строки. Я уж не говорю про Парэто-фильтр "80 на 20" в OLAP-клиенте, когда пользователю не надо думать, кого запихивать в группу прочие...

Всё это делается довольно легко. Не надо строить неправильных предположений. Очевидно, Вам стоит познакомиться с Microstrategy. Тогда, Ваши аргументы, что он неудобен будут звучать убедительно.
Как у Cognos с правилом 70 на 30 дела обстоят? Или с 65 на 35?
Можно это так же легко сделать?

У Microstrategy data mining отсутствует, хотя они и пишут, что он есть.
Из всех производителей OLAP, мне кажется, только у Microsoft есть что-то более-менее достойное

В том то и проблема, что мало у кого есть Query & Reporting, OLAP и data mining в ИНТЕГРИРОВАННОМ виде.

Это вполне нормально. Интегрировать всё могут себе позволить только очень крупные компании.
Интегрированные решения имеют компании IBM, Oracle, NCR, то есть крупнейшие игроки на рынке хранилищ данных.

К вопросу о data mining - а какие у Cognos продукты класса data mining?
(подсказка: 4Thought не называть - нейронные сети, как ни странно, не относятся к data mining).

Видимо поэтому Cognos, как аналитический продукт, во всех известных рейтингах стоит либо на первом месте, либо в тройке лидеров.

Насчёт интегрированности решения Cognos - я бы всё-таки постеснялся. Разрозненные несовместимые метаданные в нескольких продуктах и никакой возможности ими нормально управлять. У них только в последнее время наметились тенденции на интеграцию. Но, не знаю, как они смогут этот зоопарк интегрировать.
Практический пример - Вы можете точно сказать в каких отчётах Impromptu и кубах PowerPlay участвуют данные из определённой таблицы базы данных?
Сколько Вам понадобится времени для ответа на этот вопрос?

Конкуренцию Cognos теоретически могли бы составить Microsoft и Oracle, но у этих компаний другая стратегия - ориентироваться на разработчиков - чтобы в мире было много приложений на их платформах со средненьким качеством, а не одно - с высоким качеством (многочисленные разрозненные разработчики не могут инвестировать в разработку столько, сколько инвестирует крупный производитель BI-продуктов).

Как показывает практика, конкуренции с Microsoft не выдерживает ни одна маленькая компания (каковой является Cognos, да и Microstrategy и BusinessObjects). С Microsoft надо дружить, а не конкурировать, но всё равно сожрут :)

С уважением,
Константин Лисянский
http://lissianski.narod.ru

...

Рейтинг:

0 / 0

27.11.2003, 12:16:28

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32336597

Volj

Участник

Сообщения: 150

Рейтинг: 0 / 0

Я на 99% уверен, что потребуются, скажем, среднеквадратичные отклонения по вычисляемым показателям, которые строятся на основе нескольких уже существующих.
... пользователь в своем интерфейсе помечает нужные статистические показатели, они выводятся на экран, и в зависимости от изменения данных в отчете в ходе многомерного анализа - мгновенно пересчитываются

Я име в виду две задачки, одну попроще, другую посложнее... Как известно, среднеквадратичное отклонение есть функция от одномерного массива чисел (будем брать OLAP-толкование). В OLAP в качестве этого массива используются данные, саггрегированные в одну ячейку куба, отображаемого в клиенте. Так вот:
нужно, как минимум, уметь строить новые вычисляемые показатели на основе вычисленных значений среднеквадратичных отклонений существующих в таблице фактов показателей.

как максимум, нужно уметь строить собственные вычисляемые показатели на основе существующих в таблице фактов, а в OLAP-клиенте показывать уже ИХ среднеквадратичное отклонение.
Ну и, разумеется, делать все вышеописанное достаточно быстро (до 10 секунд). В принципе, 250 000 - это действительно небольшой объем для такого рода вычислений, мгновенности я не требую :)

Всем:
Мне, пока я писал это, пришел в голову интересный вопрос:
Допустим, в таблице фактов есть несколько записей, попадающих в одну и ту же ячейку куба. Как считается в этом случае среднеквадратичное отклоенение? Как функция от нескольких значений (реально лежащих в табл фактов) или как функция от аггрегированного значения?

...

Рейтинг:

0 / 0

27.11.2003, 12:49:13

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32336699

Birkhoff

Участник

Откуда: Москва

Сообщения: 2 987

Рейтинг: 0 / 0

2 Константин

Почему нейросети не относятся к Data Mining?

2 Volj

В MOLAP не бывает, чтобы в одну ячейку несколько записей попадали. Данные должн ылибо агрегироваться по какому то принципу, либо будет храниться одно из значений. Либо нужно заводить еще одно измерение.
А в ROLAP такое часто бывает, но тоже в итоге на эти несколько записей применяется какая агрегация.

...

Рейтинг:

0 / 0

27.11.2003, 13:53:57

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32336708

Birkhoff

Участник

Откуда: Москва

Сообщения: 2 987

Рейтинг: 0 / 0

2 Volj

Кстати функция вычисления среднеквадратичного отклонения насколько я помню зашита в Oracle SQL и значить ее можно использовать в любом SQL выражении и следовательно в любом ROLAP клиенте.

...

Рейтинг:

0 / 0

27.11.2003, 13:58:13

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32336721

Volj

Участник

Сообщения: 150

Рейтинг: 0 / 0

2 Birkhoff:

В MOLAP не бывает, чтобы в одну ячейку несколько записей попадали.
Но в реальности-то сплошь и рядом :(( А среднеквадратичное отклонение (и медиана, да и многе другие статфункции, наверное), как нетрудно убедиться, при этом совсем другие получаются... И, грубо выражаясь, толку от этих функций, если они считают аггрегированное значение, просто никакого. Фикция, а не функция. Могу примеры привести, если интересует... Извините, это не наезд, просто это плохо очень тогда.

2 Константин: Еще раз спасибо за ценную инф и ссылки. Здорово!

...

Рейтинг:

0 / 0

27.11.2003, 14:09:08

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32336762

Jurii

Участник

Откуда: Moscow http://cognos.narod.ru

Сообщения: 2 966

Рейтинг: 0 / 0

To Константин:

В особенности, у MS AS, где существует явная поддержка несбалансированных иерархий.

Этот вопрос в свое время детально обсуждался. У MS AS есть поддержка в явном виде структуры ID, Name, Parent_ID, но работает она реально на не очень ветвистых измерениях (до 5 тысяч листьев все OK, до 50 тысяч - еще можно, но более 50 тысяч - тормозит). Схлопывания пустых уровней иерархии у MS AS не было обнаружено. Таким образом, у Cognos работа с несбалансированными иерархиями иногда менее удобна, чем в MS AS, но зато - более универсальна (в случаях когда иерархия хранится не в трех полях, а по-другому, или на больших объемах данных).

А если сервер не использовать? Если куб только на клиенте, тогда как? Я уже подзабыл как это там будет.

Вы наверное спрашиваете про минимальную конфигурацию PowerPlay User? Если да - то ее функциональность и мощность мало отличается от более серьезных серверных конфигураций PowerPlay. Схлопывание уровней в PPU имеется.

PowerPlay, действительно удобен, не спорю. Только функциональности очень не хватает.

Как-то г-н GoodLeo перечислил свои требования к OLAP-клиентам, и PowerPlay наиболее полно соответствует этим требованиям. Если Вы не находите в OLAP-продукте PowerPlay той функциональности, которая есть в знакомых Вам продуктах класса Query & Reporting, то такая функциональность есть в продукте Cognos Impromptu, который обычно используется в связке с PowerPlay.

Очевидно, Вам стоит познакомиться с Microstrategy

С удовольствием это сделаю, как только подвернется такая возможность :)

Как у Cognos с правилом 70 на 30 дела обстоят? Или с 65 на 35?
Можно это так же легко сделать?

Это можно делать либо в Impromptu (по аналогии с BusinessObjects или Microstrategy), либо в PowerPlay, используя функцию "Кумулятивный Процент от базы".

Интегрировать всё могут себе позволить только очень крупные компании.
Интегрированные решения имеют компании IBM, Oracle, NCR, то есть крупнейшие игроки на рынке хранилищ данных.

Я думаю у нас разные понятия о термине интегрированность. Вы хотите сказать, что SQL-запросы, подготовленные в Oracle Discoverer можно использовать как таблицы фактов для Oracle Express? В том то и весь кайф, что результаты работы Cognos Impromptu могут быть сохранены в виде виртуальной вьюшки, и эта вьюшка служит таблицей фактов для проектирования кубов PowerPlay и источником данных для data mining в Scenario. А из куба PowerPlay ожно настроить drill through через эту вьюшку, причем визуальными средствами.

К вопросу о data mining - а какие у Cognos продукты класса data mining?
(подсказка: 4Thought не называть - нейронные сети, как ни странно, не относятся к data mining).

Сами по себе нейронные сети может и не относятся к Data Mining, но 4Thought - это продукт, позволяющий анализировать влияние факторов на целевые функции - на мой взгляд это чистый data mining. Ну и еще к data mining относится вышеупомянутый продукт Scenario.

Насчёт интегрированности решения Cognos - я бы всё-таки постеснялся.
Практический пример - Вы можете точно сказать в каких отчётах Impromptu и кубах PowerPlay участвуют данные из определённой таблицы базы данных?
Сколько Вам понадобится времени для ответа на этот вопрос?

На практике интеграция Cognos работает через виртуальные вьюшки. И поскольку продукты Cognos умеют работать напрямую с OLTP, структура которой меняется редко - отвечать на Ваш вопрос тоже приходится редко. А те продукты, которые требуют единое ХД (MS AS и все продукты ROLAP/Query & Reporting) - действительно нуждаются в быстрых ответах на Ваш вопрос, поскольку ХД изменяется/дорабатывается часто.

Как показывает практика, конкуренции с Microsoft не выдерживает ни одна маленькая компания (каковой является Cognos, да и Microstrategy и BusinessObjects). С Microsoft надо дружить, а не конкурировать, но всё равно сожрут :)

Теоретически Вы правы, но на практике наблюдается обратное, причем благодаря человеческому фактору, против которого ничего не сделаешь :)
Например выход MS AS - несколько лет назад я думал, что это серьезный конкурент для Cognos. И вот, MS AS вошел на массовый рынок, среднее качество внедрений его - невысокое, поскольку продукт сложный и не очень дружественный, а экспертов по нему - мало. Аналогичный случай с системой Аксапта - маркетинговая раскрутка - очень хорошая, а вот на практике при внедрениях бывают громкие провалы... Я бы на месте Microsoft попытался бы скупить всех конкурентов, но видимо это тоже не так просто (либо будет возражать Антимонопольный комитет, либо сами конкуренты не продадутся :)

А что касается дружбы с Microsoft, то у Cognos это имеется (прямые драйверы к MS SQL, работа напрямую с Excel, Access, PowerPlay User - это в том числе OLAP-клиент для MS AS, Cognos поддерживает настройки безопасности Active Directory Server, использует MS Internet Explorer как Web-клиента и т.п.).

...

Рейтинг:

0 / 0

27.11.2003, 14:29:47

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32336849

Birkhoff

Участник

Откуда: Москва

Сообщения: 2 987

Рейтинг: 0 / 0

2 Jurii

Кстати в Discoverer можно во первых нажать одну кнопку и по сгенеренной в данный момент странице построится база данных экспресс с кубом.
А во вторых никто не мешает использовать сгенеренный в Dsicoverer SQL для загрузки кубов. Или я не понял, что ты имел в виду?

2 Volj
Давайте вы приведете какой нибудь очень простой пример и обсудим какими технологиями с ним стоит работать а какими нет?

...

Рейтинг:

0 / 0

27.11.2003, 15:12:20

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32337102

Volj

Участник

Сообщения: 150

Рейтинг: 0 / 0

2 Birkhoff:

Давайте вы приведете какой нибудь очень простой пример и обсудим какими технологиями с ним стоит работать а какими нет?
Пример не мой (чтобы объяснить, что нужно делать мне, требуется слишком много спецтеримнов использовать :) ) но, по моему, актуальный:

Поиск любых отклонений от среднестатистических величин и выявление закономерностей, присущих этому отклонению (в этих методиках используются как раз медианы и среднеквадратичные отклонения).
Из жизни: поиск испорченных транков в телефонии и выявление закономерностей "падения" разговора, поиск ошибок операторов при вводе и выявление закономерностей появления ошибок (может, какой-то оператор постоянно ошибки лепит, и его пора увольнять) и т.д...
Куб организован так, что есть несколько "значащих" измерений, и временная координата. Временная координата, естественно, образует еще какие-то измерения, допустим, день недели недели и час (в качестве примера). Большая детализация просто не нужна. А записи добавляются, допустим, каждые несколько секунд. Разумеется, получается, что одной ячейке куба может, теоретически, соответствовать произвольное к-во записей.
А в качестве меры для статистических функций мне важны не усредненные данные в этой ячейке и не суммированные, а именно те, которые лежат в таблице фактов, иначе я не смогу отследить резкие всплески ошибок на уровне общего "фона", который является более-менее постоянным.
Достаточно?

...

Рейтинг:

0 / 0

27.11.2003, 18:03:30

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32337116

Volj

Участник

Сообщения: 150

Рейтинг: 0 / 0

2 Birkhoff:

Добавление: вообще, возьмите любую задачу, где идет работа со статистическими функциями и где они действительно необходимы, и их использование не является придурью аналитика (что бывает ;-) ).
Вот и будет вам пример :)

Ведь вы не будете отрицать, надеюсь, что в случае работы с аггрегированными значениями (саггрегированными любой функцией), статфункции выдадут вам неверный результат?

...

Рейтинг:

0 / 0

27.11.2003, 18:14:01

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32337125

Birkhoff

Участник

Откуда: Москва

Сообщения: 2 987

Рейтинг: 0 / 0

2 Volj
Нет, я понимаю что такое реальные задачи.
Просто интересно взять конкретную задачку чтобы все ее представляли и рассмотреть какие ограничения есть на нее при разных подходах.
Например берем тесовую табличку из 10 записей с такими то колонками и пытаемся разными средствами решить задачу по подсчету отклонения, причем эталонный результат известен.

Если можно написать запрос который правильно считает отклонение, то это значит что задача в принципе решаема, проблема может быть в том что вы хотите чтобы она решалась именно при тех ограничениях, которые на нее накладываются. Думаю что несколько записей в одну ячейку появляются только тогда, когда недодумана структура куба. Наверняка есть еще что то что отличает одну запись от другой. Может быть время? Чем они отличаются в самой базе?

...

Рейтинг:

0 / 0

27.11.2003, 18:22:46

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32337129

Volj

Участник

Сообщения: 150

Рейтинг: 0 / 0

2 Birkhoff: Мне кажется, настало время новую тему открыть :) Киньте туда свои ответы, plz

...

Рейтинг:

0 / 0

27.11.2003, 18:29:08

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32337140

Birkhoff

Участник

Откуда: Москва

Сообщения: 2 987

Рейтинг: 0 / 0

2 Volj

Мне кажется что это вы можете нам подкинуть интересный пример :)
Вам виднее, раз вы вообще эту тему открыли.

...

Рейтинг:

0 / 0

27.11.2003, 18:33:13

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32337392

Дядя Федор

Гость

Jurii писал:Схлопывания пустых уровней иерархии у MS AS не было обнаружено.

Наверное, плохо искали. Можно прятать уровни с пустым именем, с именем родителя, или только "единственных детей" с пустым именем или именем родителя. Разве это не оно?

...

Рейтинг:

0 / 0

28.11.2003, 08:52:47

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32337629

Tsaryov S

Участник

Сообщения: 135

Рейтинг: 0 / 0

2 Volj
автор писал:А записи добавляются, допустим, каждые несколько секунд
В вашей задаче не ясно, нужно ли мониторить данные в реальном времени, или достаточно иметь для анализа несколько устаревшие (за последний час или день) данные. Этот вопрос серьезно может повлиять на выбор ПО. И потом, при такой скорости добавления предпосылка о 250000 записей в таблице фактов скоро станет неверной.
автор писал:Поиск любых отклонений от среднестатистических величин и выявление закономерностей
Все-таки, известно, на какие вопросы вы хотите найти ответ или нет? Такое ощущение, что задача плохо поставлена, поэтому вы хотите использовать OLAP как средство быстрого построения нерегламентированных запросов. Если есть модель, как решать задачу, некий алгоритм, то достаточно посчитать программно некую функцию (коэфф. ошибочной работы телефониста, грубо говоря) и найти самых тупых телефонистов и их уволить, а в следующий раз посчитать снова через месяц. При этом никакие кубы не нужны.
автор писал:Ведь вы не будете отрицать, надеюсь, что в случае работы с аггрегированными значениями (саггрегированными любой функцией), статфункции выдадут вам неверный результат?
Я буду. Сгласен с теми, кто говорит, что в каждая ячейка определяется уникальными значениями измерений. Любая статфункция выполняется на множестве, а следовательно, является функцией агрегации. И если уж использовать OLAP в вашем случае, то именно с такими функциями агрегации.
Успехов.

...

Рейтинг:

0 / 0

28.11.2003, 12:23:59

| Ответить | Цитировать | Написать

30 измерений в таблице фактов

#32337739

Volj

Участник

Сообщения: 150

Рейтинг: 0 / 0

2 Tsaryov S:

В первых двух вопросах Вы немного спутали мухи с котлетами - прочитайте мое сообщение от 18:03 повнимательнее, и тогда Вам станет понятно, что пример, который я привожу для г-на Birkhoff, не имеет ничего общего с моей реальной задачей. Посему комментировать два первых Ваши вопроса, я думаю, не нужно.

По третьему вопросу см. тему "расчет статфункций в перенасыщенных кубах", я отвечу Вам там.

...

Рейтинг:

0 / 0

28.11.2003, 13:29:34

| Ответить | Цитировать | Написать

23 сообщений из 48, страница 2 из 2

все

Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / 30 измерений в таблице фактов

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=49&msg=32336762&tid=1872978]:	0ms
get settings:	11ms
get forum list:	21ms
check forum access:	3ms
check topic access:	3ms
track hit:	163ms
get topic data:	10ms
get forum data:	2ms
get page messages:	82ms
get tp. blocked users:	1ms
others:	248ms

total:	544ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы