|
>64000 dimension members
|
|||
---|---|---|---|
#18+
Спасите-помогите? Ситуация такая: есть куб, анализирующий статистику использования инета. Там мера - трафик, измерения - пользователь, отдел, Дата, и УРЛ. И вот с ним-то, с последним, и вылезла сегодня проблема. А конкретно - именно сегодня количество members для этого измерения превысило 64000. Когда-то на olap.ru был похожий вопрос, но единственное, что там посоветовали - сделать группировку. В данном случае это вряд ли подойдет, по крайней мере, я с трудом представляю, как можно группировать кучу ссылок типа "http://195.54.209.148" и "http://www.yandex.ru/click/dtype=web/*http://www.vostok-lada.ru:82" Итак, что было испробовано: 1) Разбивание на partitions по периодам. 2) Incremental process по периодам 3) Вынос этого измерения из куба в shared 4) Создание составного измерения Пользователь->Ссылка (прошло удачно), и на основе второго уровня - создание виртуального измерения (опять та же ошибка - превышение 64000). Просто оставить измерение Пользователь->Ссылка - не катит, т.к. нужна статистика отдельно по ссылкам. Ну, как же это обойти? Можно, конечно, сделать подуровень типа "Первые 10 символов", и по ним группировать.... Но в скором времени один Яндекс надает 64000 членов, и что тогда? В общем, какие идеи? Может, все-таки перестроить как-нибудь измерение? И кстати, почему не прошел номер с разбиванием на partitions? Я так думала, что он будет их по частям процессить: за первые полгода, за вторые полгода. Но когда ошибку при процесс выдает, и я смотрю sql-запрос, там никаких условий не стоит, он целиком все измерение процессит.... ... |
|||
:
Нравится:
Не нравится:
|
|||
20.12.2002, 06:43 |
|
>64000 dimension members
|
|||
---|---|---|---|
#18+
Если Вам нужно анализировать ссылки, то они Вам нужны в измерениях, не вижу как от них избавится. Поэтому, группировать наверно прийдется все-равно, может создать груп. левел как "порядковый номер ссылки в реляционной таблице от 0 до 63999"? Но можно сделать еще проще, существует такое feature как groupingAutomatic, т.е в Analysis Manager просто отмечаете что хотите groupingAutomatic и будет создан не видимый левел, который обеспечит группинг. Об этом можно почитать в BOL в статье: Grouping (Level Interface) И кстати, почему не прошел номер с разбиванием на partitions? Я так думала, что он будет их по частям процессить: за первые полгода, за вторые полгода. Но когда ошибку при процесс выдает, и я смотрю sql-запрос, там никаких условий не стоит, он целиком все измерение процессит.... Разбивание на partitions относится к данным в таблице фактов, а не к измерениям. Т.е. они нужны для распределения непосредственных данных в мерах, а не members в измерениях(звучит как-то странно, надеюсь Вы меня поняли:)) Если Вы посмотрите на запрос при процессе куба, то увидете условие. Ирина ---------------------------------------------------- This posting is provided "AS IS" with no warranties, and confers no rights ... |
|||
:
Нравится:
Не нравится:
|
|||
20.12.2002, 10:01 |
|
>64000 dimension members
|
|||
---|---|---|---|
#18+
Зачем анализировать весь URL ? По-моему достаточно до первого слэша с отбрасыванием "http://". К тому же размер базы уменьшается в разы и с группировкой проблем никаких. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.12.2002, 10:24 |
|
>64000 dimension members
|
|||
---|---|---|---|
#18+
Это не поможет, к сожалению, т.к. на одном яндексе или другом большом сайте, наверно больше страниц. Ирина ---------------------------------------------------- This posting is provided "AS IS" with no warranties, and confers no rights ... |
|||
:
Нравится:
Не нравится:
|
|||
26.12.2002, 11:10 |
|
>64000 dimension members
|
|||
---|---|---|---|
#18+
Да, об этом и была речь. Да и брать первую часть - тот же яндекс - не совсем корректно. Интересно же, куда с этого яндекса пошли.. Дело в том, что измерение, собственно, было двухуровневое. Ссылка (обычно основной сайт, например, www.olap.ru, и детали - "/contacts/forum..." ну и т.п. При автоматическом групинге требуется, чтобы у всех нижних уровней соблюдалось свойство уникальности ключей. А это как раз нарушается в уровне деталей. Вынести в отдельное измерение - опять делать группировку на детали, т.к. их количество еще в 2-3 раза больше, чем количество ссылок. Не очень хорошее решение... В общем, кому интересно, мы сделали так: решили статистику по ссылкам оставлять только за год, а за более ранние периоды - только статистику трафика по пользователям. В измерение Ссылка поставили условие: если дата меньше текущей-365 дней, ссылка = null. Все прошло хорошо, кубик процессится, но решение, сами понимаете - слишком конкретное. А если бы у нас было в 10 раз больше пользователей, и ссылки превышали 64000 за месяц? Или, скажем, куб по зарплате за несколько лет? Причем не с общей суммой зарплат по сотрудникам, а с разложением на пачки, виды расчетов? В общем-то, большинство ссылок, на которые заходили раз-два - действительно не интересуют. Интересна статистика по самым посещаемым сайтам. Подскажите какую-нибудь возможность (может быть, не в кубе, а на уровне таблицы какие-то преобразования сначала сделать), чтобы брать, например, первые 25% ссылок по размеру трафика. А остальные ссылки - не учитывать, так же, например, считать их за null... ... |
|||
:
Нравится:
Не нравится:
|
|||
27.12.2002, 05:50 |
|
>64000 dimension members
|
|||
---|---|---|---|
#18+
А можно вопрос? Предел 64000 это предел самого сервера, который вылазит при процессинге куба? Или эта ошибка возникает при просмотре куба в Экселе? ... |
|||
:
Нравится:
Не нравится:
|
|||
27.12.2002, 07:17 |
|
>64000 dimension members
|
|||
---|---|---|---|
#18+
При процессе куба, на процессе этого дименшена.... ... |
|||
:
Нравится:
Не нравится:
|
|||
27.12.2002, 08:12 |
|
>64000 dimension members
|
|||
---|---|---|---|
#18+
Fem, а если на уровне реляционной таблицы сгенерить уникальные ключи? Это я все об оригинальной проблеме. Ирина ---------------------------------------------------- This posting is provided "AS IS" with no warranties, and confers no rights ... |
|||
:
Нравится:
Не нравится:
|
|||
27.12.2002, 10:01 |
|
>64000 dimension members
|
|||
---|---|---|---|
#18+
На что сгенерить уникальные ключи? Я не очень поняла... На ссылки? ------------- ICQ 47730054 ... |
|||
:
Нравится:
Не нравится:
|
|||
27.12.2002, 10:15 |
|
>64000 dimension members
|
|||
---|---|---|---|
#18+
На детали, учитывая ссылки, т.е. "/contacts/forum..." будет иметь уникальный ключ, если он от "www.olap.ru". Ирина ---------------------------------------------------- This posting is provided "AS IS" with no warranties, and confers no rights ... |
|||
:
Нравится:
Не нравится:
|
|||
27.12.2002, 10:17 |
|
>64000 dimension members
|
|||
---|---|---|---|
#18+
Думаю над вариантом... В смысле соотношения затрат/результата... После праздников посмотрим. Кстати, всех с праздниками - Новым Годом и Рождеством! :-) -------------- ICQ 47730054 ... |
|||
:
Нравится:
Не нравится:
|
|||
28.12.2002, 05:34 |
|
>64000 dimension members
|
|||
---|---|---|---|
#18+
Добрый день! Кажется, Вы упёрлись в ограничение продукта. Может быть, имеет смысл посмотреть на технологию ROLAP? Там таких проблем с ограничением количества членов измерения нет, да и кубы никакие генерить не надо. Смотреть можно, например, в сторону Oracle Discoverer или (с бОльшим вниманием ) в сторону MicroStrategy. Да простят меня приверженцы продуктов известной компании. С уважением, Константин Лисянский http://lissianski.narod.ru ... |
|||
:
Нравится:
Не нравится:
|
|||
05.01.2003, 13:35 |
|
|
start [/forum/topic.php?fid=49&fpage=416&tid=1873616]: |
0ms |
get settings: |
9ms |
get forum list: |
16ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
27ms |
get topic data: |
12ms |
get forum data: |
4ms |
get page messages: |
50ms |
get tp. blocked users: |
2ms |
others: | 243ms |
total: | 371ms |
0 / 0 |