powered by simpleCommunicator - 2.0.44     © 2025 Programmizd 02
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / >64000 dimension members
12 сообщений из 12, страница 1 из 1
>64000 dimension members
    #32082196
Фотография fem
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Спасите-помогите? Ситуация такая: есть куб, анализирующий статистику использования инета. Там мера - трафик, измерения - пользователь, отдел, Дата, и УРЛ. И вот с ним-то, с последним, и вылезла сегодня проблема. А конкретно - именно сегодня количество members для этого измерения превысило 64000. Когда-то на olap.ru был похожий вопрос, но единственное, что там посоветовали - сделать группировку. В данном случае это вряд ли подойдет, по крайней мере, я с трудом представляю, как можно группировать кучу ссылок типа "http://195.54.209.148" и "http://www.yandex.ru/click/dtype=web/*http://www.vostok-lada.ru:82"

Итак, что было испробовано:
1) Разбивание на partitions по периодам.
2) Incremental process по периодам
3) Вынос этого измерения из куба в shared
4) Создание составного измерения Пользователь->Ссылка (прошло удачно), и на основе второго уровня - создание виртуального измерения (опять та же ошибка - превышение 64000). Просто оставить измерение Пользователь->Ссылка - не катит, т.к. нужна статистика отдельно по ссылкам.

Ну, как же это обойти? Можно, конечно, сделать подуровень типа "Первые 10 символов", и по ним группировать.... Но в скором времени один Яндекс надает 64000 членов, и что тогда?

В общем, какие идеи? Может, все-таки перестроить как-нибудь измерение?

И кстати, почему не прошел номер с разбиванием на partitions? Я так думала, что он будет их по частям процессить: за первые полгода, за вторые полгода. Но когда ошибку при процесс выдает, и я смотрю sql-запрос, там никаких условий не стоит, он целиком все измерение процессит....
...
Рейтинг: 0 / 0
>64000 dimension members
    #32082239
Ирина
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Если Вам нужно анализировать ссылки, то они Вам нужны в измерениях, не вижу как от них избавится. Поэтому, группировать наверно прийдется все-равно, может создать груп. левел как "порядковый номер ссылки в реляционной таблице от 0 до 63999"? Но можно сделать еще проще, существует такое feature как groupingAutomatic, т.е в Analysis Manager просто отмечаете что хотите groupingAutomatic и будет создан не видимый левел, который обеспечит группинг. Об этом можно почитать в BOL в статье: Grouping (Level Interface)

И кстати, почему не прошел номер с разбиванием на partitions? Я так думала, что он будет их по частям процессить: за первые полгода, за вторые полгода. Но когда ошибку при процесс выдает, и я смотрю sql-запрос, там никаких условий не стоит, он целиком все измерение процессит....

Разбивание на partitions относится к данным в таблице фактов, а не к измерениям. Т.е. они нужны для распределения непосредственных данных в мерах, а не members в измерениях(звучит как-то странно, надеюсь Вы меня поняли:)) Если Вы посмотрите на запрос при процессе куба, то увидете условие.

Ирина

----------------------------------------------------
This posting is provided "AS IS" with no warranties, and confers no rights
...
Рейтинг: 0 / 0
>64000 dimension members
    #32084535
Dimsoft
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Зачем анализировать весь URL ?
По-моему достаточно до первого слэша с отбрасыванием "http://". К тому же размер базы уменьшается в разы и с группировкой проблем никаких.
...
Рейтинг: 0 / 0
>64000 dimension members
    #32084582
IrinaG
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Это не поможет, к сожалению, т.к. на одном яндексе или другом большом сайте, наверно больше страниц.

Ирина

----------------------------------------------------
This posting is provided "AS IS" with no warranties, and confers no rights
...
Рейтинг: 0 / 0
>64000 dimension members
    #32085012
Фотография fem
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Да, об этом и была речь. Да и брать первую часть - тот же яндекс - не совсем корректно. Интересно же, куда с этого яндекса пошли..
Дело в том, что измерение, собственно, было двухуровневое. Ссылка (обычно основной сайт, например, www.olap.ru, и детали - "/contacts/forum..." ну и т.п. При автоматическом групинге требуется, чтобы у всех нижних уровней соблюдалось свойство уникальности ключей. А это как раз нарушается в уровне деталей. Вынести в отдельное измерение - опять делать группировку на детали, т.к. их количество еще в 2-3 раза больше, чем количество ссылок. Не очень хорошее решение...
В общем, кому интересно, мы сделали так: решили статистику по ссылкам оставлять только за год, а за более ранние периоды - только статистику трафика по пользователям. В измерение Ссылка поставили условие: если дата меньше текущей-365 дней, ссылка = null. Все прошло хорошо, кубик процессится, но решение, сами понимаете - слишком конкретное. А если бы у нас было в 10 раз больше пользователей, и ссылки превышали 64000 за месяц? Или, скажем, куб по зарплате за несколько лет? Причем не с общей суммой зарплат по сотрудникам, а с разложением на пачки, виды расчетов?

В общем-то, большинство ссылок, на которые заходили раз-два - действительно не интересуют. Интересна статистика по самым посещаемым сайтам. Подскажите какую-нибудь возможность (может быть, не в кубе, а на уровне таблицы какие-то преобразования сначала сделать), чтобы брать, например, первые 25% ссылок по размеру трафика. А остальные ссылки - не учитывать, так же, например, считать их за null...
...
Рейтинг: 0 / 0
>64000 dimension members
    #32085018
GoodLeo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
А можно вопрос? Предел 64000 это предел самого сервера, который вылазит при процессинге куба? Или эта ошибка возникает при просмотре куба в Экселе?
...
Рейтинг: 0 / 0
>64000 dimension members
    #32085028
Фотография fem
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
При процессе куба, на процессе этого дименшена....
...
Рейтинг: 0 / 0
>64000 dimension members
    #32085071
Ирина
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Fem, а если на уровне реляционной таблицы сгенерить уникальные ключи? Это я все об оригинальной проблеме.

Ирина

----------------------------------------------------
This posting is provided "AS IS" with no warranties, and confers no rights
...
Рейтинг: 0 / 0
>64000 dimension members
    #32085084
Фотография fem
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
На что сгенерить уникальные ключи? Я не очень поняла... На ссылки?



-------------
ICQ 47730054
...
Рейтинг: 0 / 0
>64000 dimension members
    #32085087
Ирина
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
На детали, учитывая ссылки, т.е. "/contacts/forum..." будет иметь уникальный ключ, если он от "www.olap.ru".

Ирина

----------------------------------------------------
This posting is provided "AS IS" with no warranties, and confers no rights
...
Рейтинг: 0 / 0
>64000 dimension members
    #32085430
Фотография fem
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Думаю над вариантом... В смысле соотношения затрат/результата... После праздников посмотрим. Кстати, всех с праздниками - Новым Годом и Рождеством! :-)


--------------
ICQ 47730054
...
Рейтинг: 0 / 0
>64000 dimension members
    #32086715
Константин Лисянский
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Добрый день!

Кажется, Вы упёрлись в ограничение продукта. Может быть, имеет смысл посмотреть на технологию ROLAP? Там таких проблем с ограничением количества членов измерения нет, да и кубы никакие генерить не надо.
Смотреть можно, например, в сторону Oracle Discoverer или (с бОльшим вниманием ) в сторону MicroStrategy. Да простят меня приверженцы продуктов известной компании.

С уважением,
Константин Лисянский
http://lissianski.narod.ru
...
Рейтинг: 0 / 0
12 сообщений из 12, страница 1 из 1
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / >64000 dimension members
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]