Гость
Map
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Подскажите оптимальный сторадж для хранения статистики. / 3 сообщений из 3, страница 1 из 1
13.12.2011, 00:52
    #37571997
z1xel
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Подскажите оптимальный сторадж для хранения статистики.
Есть задача — хранить статистику с веб-ресурсов(логи) и генерить по ней отчеты. Объемы данных предполагаются очень приличные, даже после агрегации 50-100млн записей в сутки. Выборки не сложные( диапазон, точное совпадение, group by), но достаточно многообразные.

В конечном итоге надо получать выборки для построения графиков и текстовых отчетов(например: клики за вчера с 12 до 17 часов, с географическим таргетингом Москва, от рекламодателя такого-то, стоимостью в диапазоне таком-то).
...
Рейтинг: 0 / 0
14.06.2012, 10:37
    #37837444
krvsa
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Подскажите оптимальный сторадж для хранения статистики.
z1xelВ конечном итоге надо получать выборки для построения графиков и текстовых отчетов(например: клики за вчера с 12 до 17 часов, с географическим таргетингом Москва, от рекламодателя такого-то, стоимостью в диапазоне таком-то).
Тогда такой вариант...

Код: vbnet
1.
s name=$na(^data(<дата>,<время>,<географический_таргетинг>,<рекламодатель>,<стоимость>))
...
Рейтинг: 0 / 0
14.06.2012, 12:58
    #37837731
servit
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Подскажите оптимальный сторадж для хранения статистики.
z1xel ,

Небольшое уточнение: ответ krvsa относился к СУБД Caché: $NA

Если выборки планируются многообразные, то можно будет задействовать SQL, MDX или в ряде случаев прямой доступ, а также bitmap -индексы для ускорения поиска.
Для построения отчётов можно задействовать встроенную бизнес-аналитику DeepSee (есть визуализация с геопривязкой) или использовать внешнюю BI через ODBC/JDBC.

Для быстрой записи веб-логов в базу можно написать внешнюю программу на Java, .NET или С/С++, используя соответствующие "прямые" интерфейсы: Java eXTreme, .NET eXTreme, CallIn/CallOut
Или можно сделать загрузку прямо из СУБД, используя богатый набор классов для работы с файлами: %File, %FileBinaryStream, %FileCharacterStream, %Stream.FileBinary и т.д.

PS: скоро будет мероприятие " Школа Инноваций InterSystems 2012 ", на котором Вы сможете задать вопросы непосредственно инженерам.

PPS: ещё несколько полезных ссылок:

NoSQL: назад в будущее

http://iscmp.ru/docs/oleg/Olenin_NoSQL_Simposium2011.pdf

Универсальное NoSQL - введение в теорию (здесь можете подобрать/посмотреть примеры возможных структур для хранения Ваших данных из логов).
...
Рейтинг: 0 / 0
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Подскажите оптимальный сторадж для хранения статистики. / 3 сообщений из 3, страница 1 из 1
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]