Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
Возникла проблема с Distinct Count в MSAS. Речь идёт о продажах, необходимо посчитать, скольким покупателям продан товар за день с разделением по группам и маркам. Вроде бы понятно как решать. Но проблема в том, что данные за разные дни должны складываться. Т.е. если один покупатель сделал несколько покупок в 1 день, то это одна продажа, но при этом за месяц должны быть просуммированы дневные рез-ты, а не посчитан distinct за месяц. Есть идеи? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.04.2003, 16:36 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
Функцию Sum гляньте... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.04.2003, 16:59 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
Глянул. Суммирует. И куда её применить? Измерение "время" типа "звезда", а custom rollup есть только в parent-child. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.04.2003, 17:05 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
Прошу прощения, не туда посмотрел. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.04.2003, 17:51 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
И, тем не менее, вот цитата из Books Online: Код: plaintext Возвращаясь к первоначальному вопросу, как всё-таки сделать так, чтобы за день считался distinct count, а за более продолжительные отрезки сумма дневных показателей? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.04.2003, 19:47 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
Я думаю Distinct Count должен отработать до конца, выдать результаты на каждый день месяца и ненужный Вам итоговый результат за месяц. Далее, в OLAP-клиенте Вам нужно спрятать итоговое значение, и вычислить нужный вам итог, сложив все дни. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.04.2003, 20:00 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
Код: plaintext При этом ТипаДистинктКаунт и ТипаСумма могут быть как заранее прописанными и спрятанными от пользователя показателями, так и формулами. Сходу напрашивается показатель ТипаДистинктКаунт, тогда Код: plaintext Но это я так, что первое в голову пришло... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.04.2003, 08:46 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
ТипаСумма - этого calculated member'a достаточно буде:-) Ежли, конечно, День - это лист. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.04.2003, 16:50 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
Люди, объясните пожалуйста чайнику, какие процессы происходят при этом, а то сильно тормозит (простыня в Crystal Analysis открывалась 1,5 часа на P4 1,7 МГц, сервер и клиент на одной машине). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.04.2003, 11:57 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
Не должно.:-( Увас же не миллион дней в измерении А происходит следующее: берётся дистинкт каунт (быстро) по каждому дню и суммируется всё (медленнее). Аггрегаций много посчитано? Куб МОЛАПовский? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.04.2003, 12:54 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
Дни за 5 лет, куб MOLAP. Выч. метрика типа distinct такая: Код: plaintext [Outlet] -- это измерение торговых точек, по которым нужно сосчитать distinct. В таблице фактов -- кол-во проданного товара. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.04.2003, 13:20 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
А сколько у Вас торговых точек, и сколько детальных записей в таблице фактов? (как известно, при больших объемах данных Distinct Count работает не так быстро, особенно если использовать не встроенные фичи OLAP-сервера, а не гарантированно оптимальные MDX-выражения). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.04.2003, 13:44 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
Хех... Медленноработает не Каунт(Дистинкт...). Ему и Фильтра по большому измерению достаточно... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.04.2003, 14:53 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
2 Jurii Торговых точек 29 тыс, фактов в таблице 740 тыс. Но это ведь в целом, а если за день, то торговых точек у одного агента 25, а продаж 9. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.04.2003, 15:07 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
To Rex & DmitryS: 740 тыс. записей - это конечно копейки, но вот 29 тыс. торговых точек - это не так мало. В OLAP-кубах Distinct Count работает совсем не так, как в обычном SQL (намного медленнее, вычисление происходит всегда налету), и из моей практики, торможение происходит всегда, когда категорий/members в кубе несколько десятков тысяч или больше. Другое дело - насколько серьезно это торможение. 1.5 часа - это перебор, я лично сталкивался с ситуациями, когда торможение составляло от 1 до 10 минут для кубов, созданных на основе как минимум 10 миллионов записей и содержащих как минимум 20-30 тыс. категорий (это делалось на компьютере средней мощности Pentium-3 256 Mb RAM, и при увеличении оперативной памяти ситуация улучшалась). Правда кубы я строил не с помощью MS AS, а на OLAP-сервере Cognos PowerPlay. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.04.2003, 16:05 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
В OLAP-кубах Distinct Count работает совсем не так, как в обычном SQL Не уверен что это так, по карйней мере в MS AS. Достаточно посмотреть как увеличивается время процессинга куба и объем готового куба если просто изменить SUM на Disctinct Count. Я подозреваю что MS AS преднасчитывает Distinct Count-ы ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.04.2003, 16:10 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
Я подозреваю что MS AS преднасчитывает Distinct Count-ы Это относится только к обычным measures. А в данном случае distinct считается в Calculated member-е... и значит на лету. На таком мееедленном лету, судя по тому, что сказано. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.04.2003, 16:21 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
Достаточно посмотреть как увеличивается время процессинга куба и объем готового куба если просто изменить SUM на Disctinct Count. Я подозреваю что MS AS преднасчитывает Distinct Count-ы Как то я обсуждал этот вопрос с г-ном Ивановым на форуме www.olap.ru Сначала он говорил, что если делать Distinct Count - размер куба увеличивается всего на 2%, и агрегаты создаются компактные. Далее, в ходе дискуссии оказалось, что он делал эксперимент для совсем маленького кубика, и мы пришли к тому, что вроде как невозможно сделать агрегаты для Distinct count (иначе бы по законам комбинаторики кубы стали бы огромными). К сожалению, комментариев от экспертов по MS AS (уровня Ирины) мы не получили. Так что интересно было бы посмотреть на Вашу статистику (насколько куб дольше процессится, насколько возрастает его объем, при каких начальных условиях проводился эксперимент и т.п.). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.04.2003, 16:25 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
1) СМ не процессятся, а вычисляются на клиенте. 2) Тормозит не дистинкт каунт (т.е. и он тоже), а ещё, Фильтр. Если вместо Дистинкт каунта написать Sum, работать всё равно будет весьма долго. Уверяю Вас. На подобных СМ съедены собаки всех пород и возрастов:-) Точнее, не только Фильтр, а выражение Ф-ция(Фильтр) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.04.2003, 16:59 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
Написал и сам засомневался:-) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.04.2003, 17:00 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
2 Jurii Ну например, я пробовал загружать куб из 42 миллионов записей, одно из измерений содержало 1 миллион листьев, разбитых по группам по 64000. Нужно было получать Distinct Count по этим листьям. Когда применялась Sum - куб процессился несколько минут (большее время тратилось именно на закачку) и размер его был порядка 200 мегабайт. Когда поставил Distinct Count - процессинг куба занял примерно полтора часа, во время процессинга было сожрано 1 гигабайт памяти (меньше начинало страшно тормозить и свопиться) и 9 гигабайт диска на темповые таблицы, по окончании процессинга они были убиты сервером и результирующий куб оказался 4 гигабайта. Так что, это точно не 2 процента :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.04.2003, 17:23 |
|
||
|
Distinct Count
|
|||
|---|---|---|---|
|
#18+
А как сделать так, чтобы Filter не фильтровал все 29 тыс точек, а только те, которые относятся к нужному срезу? Ведь если зафиксировать торгового агента и день, то получается совсем небольшая 2-мерная таблица -- 25 точек на пару десятков товаров. Возвращаясь к предыдущему вопросу, хотелось бы понять также всю физику процесса и как работает это CurrentMember и Descendants в контексте выражения вычисляемой метрики. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 22.04.2003, 17:24 |
|
||
|
|

start [/forum/topic.php?fid=49&msg=32145897&tid=1873427]: |
0ms |
get settings: |
9ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
172ms |
get topic data: |
13ms |
get forum data: |
3ms |
get page messages: |
59ms |
get tp. blocked users: |
1ms |
| others: | 15ms |
| total: | 293ms |

| 0 / 0 |
