Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Во-первых для нашей задачи достаточно простого Count, а не DC, раз мы ходим по Абонентам. Во-вторых, MS AS едиственный MOLAP, который умеет физически агрегировать DC и довычислять его on fly. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2004, 01:39 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Владимир, Я вот чего не понимаю насчет Distinct Count: Как говорит г-н Моша: В этой ситуации MS AS не возврашает неверный результат, а возвращает ошибку "Aggregations are not supported for the DISTINCT COUNT measure". В то же время Константин спрашивает (видимо не понимая ответ Моши): но я не понимаю, как можно Distinct Count по произвольному периоду в агрегатах держать И ты отвечаешь: Во-вторых, MS AS едиственный MOLAP, который умеет физически агрегировать DC и довычислять его on fly. Ты согласен с ответом Моши? Или ты имеешь в виду только вычисление DC для фиксированных узлов/листьев измерений, которые заложены в иерархию куба? И вопрос к твоим знакомым из отдела маркетинга Microsoft: знают ли они алгоритмы работы с DC, заложенные в другие OLAP-сервера, например в Cognos PowerPlay, когда говорят о "единственности MS AS"? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2004, 09:34 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Во-первых для нашей задачи достаточно простого Count, а не DC, раз мы ходим по Абонентам. Вот этого я тоже не понимаю. Если, конечно мы зафиксируем задачу на уровне хождения только по агрегатам, привязанным к измерению Абонентов, то да, согласен, для каждого абонента храним сколько он звонков сделал за предопределённый период времени (в соответствии со структурой последнего). Если же требуется информация по произвольным периодам, то я не знаю, как для решения этой задачи могут помочь агрегаты - DC суть неагрегируемая величина. Ну, а по поводу уникальности MS AS ссылка на достоверный источник о его единственности в плане этой замечательной возможности не помешала бы. Если мне не изменяет склероз, то Distinct Count - это стандартная фича в Cognos PowerPlay (естественно, по заранее определённым уровням иерархии, правильно, Юра?) С уважением, Константин Лисянский http://lissianski.narod.ru ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2004, 11:49 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Константин, Если мне не изменяет склероз, то Distinct Count - это стандартная фича в Cognos PowerPlay Да, DC - это стандартная функциональность PowerPlay, показатель DC делается несколькими кликами мышки (нужно просто указать координаты уровня иерархии, элементы которого будут подсчитываться - измерение, в котором он находится, и его уровень). В кубе PowerPlay может быть более одного (несколько или много) показателей типа DC. естественно, по заранее определённым уровням иерархии, правильно, Юра? А вот тут Вы либо не правы, либо нечетко сформулировали. Что значит "по заранее определённым уровням иерархии"? Например, у меня есть показатель DC - Количество клиентов, и ось времени Год-Месяц-День. Я легко могу с помощью операции СВЕРТКА в интерфейсе конечного пользователя вычислить Количество клиентов за произвольный период времени (с любой даты по любую). Это одно из сильнейших конкурентных преимуществ Cognos над MS AS. Пользователям MS AS нужно ждать выхода Юкона, в нем должна появиться возможность свертки, но Юкон как известно выйдет в лучшем случае через год... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2004, 12:24 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Константин, я советую вам на досуге поиграться с MDX. Там есть много продуктивных идей. В Юконе он станет серверным и скорее всего станет "де-факто" стандартным языком для MOLAP. В формуле обсуждавшейся выше прописано, что обходить по Абонентам. Конечно в отчете измерение Абоненты ракрыто редко, если выбраны другие измерения формула все равно сканирует Абонентов, но учитывает выбранные значения в других измерениях. Если говорить о DC в Cognos и MS AS, то ограничения MS AS связанны с наличием того что в MS AS мы имеем настоящий ФИЗИЧЕСКИЙ DC, а в Cognos он on fly - т.е. эмуляция реальной агрегации. Понятное дело что при кубе с большим количеством фактов и измерений MS AS делает на DC всех, т.к. ФИЗИЧЕСКИ агрегирует DC. Такая агрегация довольно сложна, т.к. не аддитивна, я сомневаюсь, что кроме MS в ближайшее время кто-то будет иметь такой же DC. Наличие ограничения на DC по произвольному периоду несущественно, если у вас хорошо проработанное измерение Времени и оно содержит в себе стандратные периоды (месяцы, декады, недели, дни). Пользователю в 95% случаев нужен отчет не за произвольный период, а за отчетный период или его стандартный квант. Поэтому я даже в обычных отчетах не рекомендую использовать произвольные периоды, т.к. стандартные быстрее работают и их удобнее выбирать. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2004, 16:15 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Владимир, Понятное дело что при кубе с большим количеством фактов и измерений MS AS делает на DC всех, т.к. ФИЗИЧЕСКИ агрегирует DC. Не согласен. количество фактов и измерений практически не влияет на скорость расчета DC. Самый важный фактор - это количество листьев, которые обсчитываются. К счастью много листьев (больше миллиона) бывает в кубах не так часто, и еще реже по ним считают DC. Наличие ограничения на DC по произвольному периоду несущественно Пользователю в 95% случаев нужен отчет не за произвольный период, а за отчетный период или его стандартный квант Это конечно так, но бывает 5% случаев, когда требуется произвольный период :) Напомню кстати, что DC в Cognos агрегируется ФИЗИЧЕСКИ с помощью External Rollup, и при этом пропадает возможность делать отчеты с этим показателем за произвольный период. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2004, 17:13 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Количество фактов не влияет только MS AS, точнее влияет только на процессирование. В других системах для подсчета DC нужно все время доставать до фактов, т.к. DC не аддитивен. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2004, 17:34 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Пользователю в 95% случаев нужен отчет не за произвольный период, а за отчетный период или его стандартный квант. Поэтому я даже в обычных отчетах не рекомендую использовать произвольные периоды, т.к. стандартные быстрее работают и их удобнее выбирать. Кому как. Очень часто необходимы расчеты скользящего среднего и прочие развитые аналитики. Не согласен. количество фактов и измерений практически не влияет на скорость расчета DC. Самый важный фактор - это количество листьев, которые обсчитываются. К счастью много листьев (больше миллиона) бывает в кубах не так часто, и еще реже по ним считают DC. Размер таблицы фактов еще как влияет. Из практики - DC как раз и считается по большим измерениям, где лимон листьев - обычное дело. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2004, 17:47 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
To Владимир & backfire: В других системах для подсчета DC нужно все время доставать до фактов, т.к. DC не аддитивен. Размер таблицы фактов еще как влияет. Не знаю как во всех системах, но в Cognos PowerPlay вряд ли нужно доставать до фактов - думаю существует более хотрый алгоритм. У меня есть кубик с демо-данными для розницы (140 миллионов записей, по 100 тысячам товаров, по 10 тысячам владельцам дисконтных карт, за 3 года, есть еще кассы и кассиры). Когда я работаю с DC для касс и кассиров - все летает, поскольку их немного, когда подсчитываются более ветвислые товары и клиенты - там DC притормаживает на неразогретом кэше)... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2004, 18:45 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
2Юра. Если это так, то Cognos умеет делать физ. агрегацию DC. Однако ты ранее это сам отрицал. 2backfire. У нас клиенты довольно часто используют скользящие показатели. В нашем типовой методичке по внедрению по ним страниц 20. Скользящий показатель не обязательно должен работать на группе выбранных периодов по дням как произвольный период. Если вы об этом. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2004, 20:14 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Я хотел еще добавить, что в AS, Distinct Count может быть определен не только по измерению (dimension) а по любой колонке в fact table. Т.е. если надо посчитать сколько было distinct Web page visitors скажем на microsoft.com, то не обязательно создавать измерение Visitor (которое будет много миллионов элементов). Моша ---------------------------------------------------- This posting is provided "AS IS" with no warranties, and confers no rights ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2004, 21:52 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Иванову. Объясните тогда пожалуйста, какой прок от предаггрегаций DC если нам надо иметь данные за май, апрель и март? Эти месяцы не относятся к одному кварталу, поэтому наличие аггрегаций DC ни для уровня дня ни для уровня месяца ни квартала не помогут при определении и MS AS как миленький должен будет спуститься до голых фактов и шерстить их. Если я в свох рассуждениях щаблуждаюсь, то проясните пожалуйста, ы чем я не прав. Второй часто встречаемый Use Case - количество клиентов покупавших товары или А, или Б, или С в рассматривемом периоде. При этом не существует группы товаров, которая образована А, Б и С ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2004, 21:56 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
backfireОбъясните тогда пожалуйста, какой прок от предаггрегаций DC если нам надо иметь данные за май, апрель и март? Эти месяцы не относятся к одному кварталу, поэтому наличие аггрегаций DC ни для уровня дня ни для уровня месяца ни квартала не помогут при определении и MS AS как миленький должен будет спуститься до голых фактов и шерстить их Согласно этой логике, даже если надо получить DC за квартал а аггрегация на уровне месяц, то надо "шерстить факты". Однако это не так. MS AS все равно может воспользоваться такой аггрегацией (хотя по другому чем в случае с аддитивными мерами). Ну а Юкон может пользоваться аггрегациями и для того чтобы ответить на вышеперечисленные вопросы. Моша ---------------------------------------------------- This posting is provided "AS IS" with no warranties, and confers no rights ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2004, 22:03 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Моше Сможет или уже может? /topic/75245&pg=-1#556357 Где можно пообщаться, чтобы не повлечь нарушения НДА. На английском писать влом :-) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2004, 22:10 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Согласно этой логике, даже если надо получить DC за квартал а аггрегация на уровне месяц, то надо "шерстить факты". NonEmptyCrossJoin - достаточно мощная штука и умеет хорошо "шерстить факты" без создания меры типа DC. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 21.05.2004, 22:14 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Владимир, Когда я работаю с DC для касс и кассиров - все летает, поскольку их немного, когда подсчитываются более ветвислые товары и клиенты - там DC притормаживает на неразогретом кэше)... Если это так, то Cognos умеет делать физ. агрегацию DC. Однако ты ранее это сам отрицал. Я и сейчас отрицаю, что Cognos делает полную физ. агрегацию DC - если бы это было так, то размер кубов был бы не такой компактный. Возможно он делает частичную агрегацию. Но скорее всего Cognos использует хитрый алгоритм, например налету смотрит, какие клиенты покупали что-то в один период времени, в другой период, сравнивает эти списки клиентов и вычисляет DC - при этом не нужно опускаться до работы с таблицей фактов... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.05.2004, 10:28 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Mosha Ну а Юкон может пользоваться аггрегациями и для того чтобы ответить на вышеперечисленные вопросы. backfireСможет или уже может? Уже может. backfireГде можно пообщаться, чтобы не повлечь нарушения НДА. Скоро выйдет Beta 2 без NDA. Моша ---------------------------------------------------- This posting is provided "AS IS" with no warranties, and confers no rights ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2004, 09:41 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Моше Ну хотя бы намекните, когда? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2004, 10:13 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Цитирую оффициальные источники: "We are still on track to deliver Beta 2 during the first half of 2004 (in the coming months)." Моша ---------------------------------------------------- This posting is provided "AS IS" with no warranties, and confers no rights ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2004, 10:16 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
To Mosha "first half of 2004 " Т.е. в ближайшие 35 дней? Ну что же посморим... и порадуемся, если до наступления 01.07.2004 мы сможем в этом форуме открыто обсуждать Yukon. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 25.05.2004, 11:23 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Обсуждать Юкон можно уже давно. Для этого есть закрытые форумы для участников тестирования. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.05.2004, 02:55 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Иванову. Только вот вы там почему-то не пишете, я то же. Тоже на английском влом писать? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.05.2004, 10:22 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Почему пишу. Есть и русскоязычный, ближе чем вы думате. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.05.2004, 23:20 |
|
||
|
Задача на Distinct Count для GSM-логов
|
|||
|---|---|---|---|
|
#18+
Поделитесь пожалуйста ссылочкой ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.05.2004, 20:17 |
|
||
|
|

start [/forum/topic.php?fid=49&msg=32529052&tid=1872432]: |
0ms |
get settings: |
10ms |
get forum list: |
19ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
59ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
86ms |
get tp. blocked users: |
1ms |
| others: | 276ms |
| total: | 472ms |

| 0 / 0 |
