|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
Привет! У меня следующая задача: моя система собирает в день ~300M хитов с разных сайтов. Каждый клик задается: временем, id пользователя, типом хита (рекламный или обычный), адресом страницы, id сайта. Так же есть массив пользователей ~200M, про которых известно пол, возрастная группа, страна. Требуется спроектировать систему, которая на основании данных по хитам могла бы реал-тайм выдавать отчеты о хитах различных групп пользователей. Например: построить график по хитам для девушек 15-20 и 35-40 из России с октября по сентябрь. Какую БД, решение вы советуете для этого выбрать? Сам я изучаю возможность применения HBase. ... |
|||
:
Нравится:
Не нравится:
|
|||
04.08.2011, 21:31 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
Такие графики не строят по "сырым данным" а делают кубики (сегментирование) с использованием какого-нибудь OLAP сервера. автормоя система собирает в день ~300M хитов с разных сайтов ... Так же есть массив пользователей ~200M И на чем все это крутится? ЗЫ. Omniture-2 хотите написать?! ... |
|||
:
Нравится:
Не нравится:
|
|||
04.08.2011, 21:42 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
Окей, что можете посоветовать под OLAP? Лучше всего opensource решение. Кстати используется ли OLAP в хадуп решениях? Речь идет о внутреннем сервисе, просто очень критично время выдачи данных - это должен быть realtime, без часового ожидания отчетов :-) ... |
|||
:
Нравится:
Не нравится:
|
|||
04.08.2011, 21:52 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
авторОкей, что можете посоветовать под OLAP? Лучше всего opensource решение. opensource решение (в Вашем понимании) == бесплатность? ... |
|||
:
Нравится:
Не нравится:
|
|||
04.08.2011, 21:57 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
авторхадуп решениях А это то Вам зачем?! Кубик у Вас будет небольшой, учитывая количество возможных срезов аналитики. ... |
|||
:
Нравится:
Не нравится:
|
|||
04.08.2011, 22:00 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
Oachkatzlschwoafмоя система собирает в день ~300M хитов с разных сайтов. Так же есть массив пользователей ~200M Т.е. каждый пользователь делает полтора клика в день. Эта система действительно работает или это очередной прожект с высованными из пальцы цифрами? Posted via ActualForum NNTP Server 1.4 ... |
|||
:
Нравится:
Не нравится:
|
|||
04.08.2011, 22:07 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
Dimitry Sibiryakov, Если бы у него была "такая система" - не было бы у него таких вопросов. ... |
|||
:
Нравится:
Не нравится:
|
|||
04.08.2011, 22:11 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
Да, это система для одного из действующих веб-ресурсов. 200M пользователей это месячные уники MAU. 300M хитов - это дневные данные, в среднем в день ресурс имеет 2M уников DAU. Да, в первую очередь, меня интересуют бесплатные решения, под свободными лицензиями. В сторону хадупа я начал думать, т.к. его использует Facebook в том числе для анализа статистики посредством Hive. Но Hive работает достаточно медленно для получения данных, а для меня важен реалтайм. Если вы посоветуете статьи по построению и аналитике с помощью OLAP буду очень благодарен. И конечно, жду помощи для выбора базы данных под такую задачу :-) ... |
|||
:
Нравится:
Не нравится:
|
|||
04.08.2011, 23:02 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
Что можете сказать о Mondrian? Какую в данном случае лучше выбрать БД для хранения данных? ... |
|||
:
Нравится:
Не нравится:
|
|||
05.08.2011, 17:07 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
OachkatzlschwoafКакую в данном случае лучше выбрать БД для хранения данных? http://en.wikipedia.org/wiki/Column-oriented_DBMS ... |
|||
:
Нравится:
Не нравится:
|
|||
07.08.2011, 22:41 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
open source - вряд ли, я бы попробовал MOLAP - SQL Server, Essbase, Cognos ... |
|||
:
Нравится:
Не нравится:
|
|||
07.08.2011, 23:06 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
pkarklinТакие графики не строят по "сырым данным" а делают кубики (сегментирование) с использованием какого-нибудь OLAP сервера. Что значит "сырые данные", что мешает по данным, которые привел автор построить эти графики? Почему в качестве пояснения для слова "кубики" в скобочках стоит "сегментирование"? ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2011, 01:11 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
Apex, Потому что "для девушек 15-20 и 35-40 из России" в WEB-аналитике называется сегментированием. И, судя по стартовому посту автора таких сегментов вырисовывается немного, кубик, действиетльно будет небольшим и желаемый отчет по такому кубику может быть получен молниеносно, чем долго и упорно нехилым железом молотить данные за несколько месяцев. А кубик обновлять раз в день, инкрементально. Тоже не сильно адская задача. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2011, 12:47 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
AAronя бы попробовал MOLAP - SQL Server, Essbase, Cognos А я юзау Оракл с Йекселем. Но это наверное не для инета, так заказчика захотел. Но есть типа JDeveloper, там Бины для Олапа есть. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2011, 15:00 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
pkarklinПотому что "для девушек 15-20 и 35-40 из России" в WEB-аналитике называется сегментированием. И, судя по стартовому посту автора таких сегментов вырисовывается немного, кубик, действиетльно будет небольшим и желаемый отчет по такому кубику может быть получен молниеносно, чем долго и упорно нехилым железом молотить данные за несколько месяцев. Тогда уже не сегментирование, а сегментация и не в вэб-аналитике, а в маркетинге вообще. И к кубикам (читай к реализации) все это имеет косвенное отношение. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2011, 15:26 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
Apex, Сегментация-сегментирование, аннуляция-аннулирование... Не находите? А отношение кубика (в части получения быстрого ответа на аналитический запрос) имеет самое прямое отношение. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2011, 15:34 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
pkarklinApex, Сегментация-сегментирование, аннуляция-аннулирование... Не находите? А отношение кубика (в части получения быстрого ответа на аналитический запрос) имеет самое прямое отношение. Под кубиком имеется ввиду выгрузка и хранение в MOLAP или так же H/ROLAP с материализованными представлениями? ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2011, 17:01 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
MOLAPПод кубиком имеется ввиду выгрузка и хранение в MOLAP или так же H/ROLAP с материализованными представлениями ? Я не увидел в требованиях ТС необходимости в выделенном. Ежедневного процессинга MOLAP куба будет, IMHO, предостаточно. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2011, 17:58 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
vadiminfoAAronя бы попробовал MOLAP - SQL Server, Essbase, Cognos А я юзау Оракл с Йекселем. Но это наверное не для инета, так заказчика захотел. Но есть типа JDeveloper, там Бины для Олапа есть. возможно и Oracle (речь только о СУБД?) с Экселем хватит. А может и нет. Но JDeveloper, имхо, надо забыть. Есть более подходящие для такой задачи вещи типа Oracle BI. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2011, 23:24 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
AAronвозможно и Oracle (речь только о СУБД?) с Экселем хватит. А может и нет. Но JDeveloper, имхо, надо забыть. Есть более подходящие для такой задачи вещи типа Oracle BI. Ну почти только о СУБД. Ну там объекты то в СУБД, но для их создания все же используются клиентская тулса Analytic Workspace Manager (AWM). Ну Экселя то пока хватит: типа заказчик сам про Йксель пожелания высказал, а у Оракла есть приблуда юзать его как клиента для егойных кубов. Ну в широком смысле, если под Oracle BI скрывается совокупность всех средств у Оракла для, то входят и Джававские бины для работы с кубами (которые упоминал), которые моно юзать в JDeveloper. А так конечно у него есть тулы и более продвинутые. По-моему, что-то купленное. На семинарах слышал, но сам не юзал. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.08.2011, 10:16 |
|
Выбор БД для веб-аналитики
|
|||
---|---|---|---|
#18+
vadiminfo, я говорил о СУБД в смысле РСУБД. OLAP Option все-таки несколько отдельно стоит, хотя и встроен. OBI позволяет работать в том числе и с кубами OO, но все как-то через... в общем, пока мы пытаемся запустить такой вариант. ... |
|||
:
Нравится:
Не нравится:
|
|||
13.08.2011, 18:50 |
|
|
start [/forum/topic.php?fid=35&msg=37381418&tid=1552651]: |
0ms |
get settings: |
7ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
33ms |
get topic data: |
10ms |
get forum data: |
3ms |
get page messages: |
54ms |
get tp. blocked users: |
1ms |
others: | 251ms |
total: | 381ms |
0 / 0 |