powered by simpleCommunicator - 2.0.60     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / программная загрузка данных в кубы Oracle 10g
25 сообщений из 50, страница 1 из 2
программная загрузка данных в кубы Oracle 10g
    #32646333
Denis_TST
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Здравствуйте !

для нашей задачи планируется создать аналитический центральный сервер
куда будут собираться данных с нижних уровней. Данные будут собираться
где-то раз в 15 минут (у нас свой механизм репликации на XML) по 2000 строк с 10 серверов (приблизительно).

Возникла идея использовать OLAP на центральном сервере (число измерений будет довольно большое > 10), но есть ряд вопросов:

1) можно ли вставлять данные програмно из JAVA. Я так понимаю для этого нужно использовать OLAP API.

2) не будет ли тормозить вставка данных в кубы, и сколько она приблизительно займет.

3) есть ли какието подводные камни, может вообще не связываться :-)
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32646667
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Смущает большое число измерений. Для таких OLAP-серверов как Cognos PowerPlay или MS AS это копейки, но для Oracle 10g (реально это Oracle Express) зто многовато. Так что надо тестировать...
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32646794
Denis_TST
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
JuriiСмущает большое число измерений.
хорошо , а если мы например разобьем куб на несколько ?
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32646826
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
хорошо , а если мы например разобьем куб на несколько ?

Разбивать кубы хорошо, и надо стремиться, чтобы в кубе было не более 1 измерения и 1 показателя :) Только вот качество анализа от этого пострадает, и неудобно будет создавать сложные отчеты...
В любом случае надо использовать OLAP не ради использования OLAP, а для решения реальных задач.
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32646910
Фотография Гликоген
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Как все мы уже знаем, Oracle OLAP внедряется именно ради самого факта. Потому что Oracle - Это Круто, Unbeatable и проч! :D
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32646965
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2Денис

Лучше именно так не делать.
А зачем раз в 15 минут обновлять OLAP кубы?
Нужно ведь будет и раз в 15 минут пересчитывать агрегаты, а при больших объемах это может тормозить само по себе.
Из каких соображений возникла именно такая архитектура?
Что вообще нужно сделать?

По вопросам.
1. Можно, из явы можно запустить процедуру, написанную на DML, которая загрузит данные.
2. Будет тормозить :) Насколько будет зависит от многих факторов.
3. Есть. Их много :)
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32647064
Denis_TST
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ГликогенКак все мы уже знаем, Oracle OLAP внедряется именно ради самого факта. Потому что Oracle - Это Круто, Unbeatable и проч! :D

Ага а еще потому что унас база Oracle 9i в связке с Oracle Internet Application Server а в кластере мы используем Oracel Fail Safe . И пользуемся этой связкой уже лет 7 (начинали с Oracle 7).

А в остальном , да ,конечно из-за крутизны. Партнер Oracle это же так круто звучит!
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32647148
Denis_TST
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Birkhoff
А зачем раз в 15 минут обновлять OLAP кубы?
Нужно ведь будет и раз в 15 минут пересчитывать агрегаты, а при больших объемах
это может тормозить само по себе.
Из каких соображений возникла именно такая архитектура?
Что вообще нужно сделать?



ну просто нужны отчеты с точностью до 15 минут. Наша предметная обл - работа сортировочных станций (ЖД). те всякие там вагоны , грузоперевозки итд. Плюс нужно объединять данные с разных станций и давать анализ уже по ним.
У нас есть уже некоторые аналитические программы (на оперативной базе), работающие по материализованным View, но время выполнения неприемлимо -
(10-15 мин). Ну вот и появилась идея выделить отдельный сервер на верху ,и собирать там данные а для хранения использовать OLAP. правда теперь появляются опасения что будет тормозить вставка...;-)


читая этот форум сложилось впечатление что OLAP использовать не стоит, но
с другой стороны его почему-то используют ;-)


По вопросам.
1. Можно, из явы можно запустить процедуру, написанную на DML, которая загрузит данные.

Сорри за мой безграмотный вопрос :
1)а при загрузке нужно ли как-то перобразовывать данные, или можно написать
что то типа

insert into (<изменение 1>,<изменение 2>)
values (10,'12.05.04 11:00:00') ;


и OLAP сам определит куда вставлять ? или нужно преобразовавыть и определять место куда вставлять данные ?
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32647187
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Denis_TST ну просто нужны отчеты с точностью до 15 минут. Наша предметная обл - работа сортировочных станций (ЖД). те всякие там вагоны , грузоперевозки итд. Плюс нужно объединять данные с разных станций и давать анализ уже по ним.
У нас есть уже некоторые аналитические программы (на оперативной базе), работающие по материализованным View, но время выполнения неприемлимо -
(10-15 мин). Ну вот и появилась идея выделить отдельный сервер на верху ,и собирать там данные а для хранения использовать OLAP. правда теперь появляются опасения что будет тормозить вставка...;-)

Думаю, OLAP будет еще больше тормозить, так как OLAP системы строятся в основном для "отложенного во времени" анализа.
А время выполнения чего неприемлимо, время рефреша мат.вью или время выполнения запроса по мат.вью?
Конечно сервер выделить можно и даже наверное нужно. Возможно вам попробовать сделать решение по апдейту на основе Advanced Queing функциональности в Oracle? Когда в случае изменеие послыаются сообщения...

Denis_TSTчитая этот форум сложилось впечатление что OLAP использовать не стоит, но
с другой стороны его почему-то используют ;-)

Все используют с разными целями и вразных условиях

Denis_TSTСорри за мой безграмотный вопрос :
1)а при загрузке нужно ли как-то перобразовывать данные, или можно написать
что то типа

insert into (<изменение 1>,<изменение 2>)
values (10,'12.05.04 11:00:00') ;


и OLAP сам определит куда вставлять ? или нужно преобразовавыть и определять место куда вставлять данные ?
Там достаточно развитый язык, можно сделать и так и так.
Но мне кажется, что для такого Real-Time анализа OLAP это не то, что вам нужно. Может быть оптимизировать структуру мат.вью? Или еще как-то.
Это сложный вопрос, навскидку не решить.
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32647261
Denis_TST
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Думаю, OLAP будет еще больше тормозить, так как OLAP системы строятся в основном для "отложенного во времени" анализа.
А время выполнения чего неприемлимо, время рефреша мат.вью или время выполнения запроса по мат.вью?

время выполнения запроса .


Конечно сервер выделить можно и даже наверное нужно. Возможно вам попробовать сделать решение по апдейту на основе Advanced Queing функциональности в Oracle? Когда в случае изменеие послыаются сообщения...

Это мы смотрели , есть такая штука как Oracle Stream которая читает изменеия из логов Oracle и умеет передавать их через очереди. Так можно построить свою репликацию итд. Но эта технология пока сырая, собственно поэтому мы написали свою репликацию на JAVA. поэтому проблем с передачей данных на центральный сервер нет.


Но мне кажется, что для такого Real-Time анализа OLAP это не то, что вам нужно. Может быть оптимизировать структуру мат.вью? Или еще как-то.
Это сложный вопрос, навскидку не решить.

спасибо , похоже что то проясняется...
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32647280
Denis_TST
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Думаю, OLAP будет еще больше тормозить, так как OLAP системы строятся в основном для "отложенного во времени" анализа.


хорошо , 15 минут это часто, а какие тогда используются обычно времнные интревалы для обновления данных?
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32647369
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2Денис

А пример запроса можете показать, того что тормозит?
Может быть можно мат.вью разбить на несколько, например?
Если чтение по матвью долгое?

Сложно сказать какой период оптимальный - у всех свой опыт.
Но обычно, это хотя бы несколько часов или даже дней.
Либо вообще апдейт по требованию.
Хотя если использовать ROLAP, то ему в общем все равно как часто обновляются таблицы, но это практически то, что вы сейчас имеете.
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32647444
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
To Denis_TST:

Ага а еще потому что унас база Oracle 9i в связке с Oracle Internet Application Server а в кластере мы используем Oracel Fail Safe . И пользуемся этой связкой уже лет 7 (начинали с Oracle 7).
Думаю, OLAP будет еще больше тормозить, так как OLAP системы строятся в основном для "отложенного во времени" анализа
читая этот форум сложилось впечатление что OLAP использовать не стоит, но
с другой стороны его почему-то используют ;-)


Я бы Вам посоветовал не зацикливаться на брэнде Oracle. Например, хорошая ли идея не только построить коттедж из кирпича, но и мебель сделать из кирпича, и сантехнику иметь кирпичную, и посуду, и клавиатуру для компьютера из маленьких кирпичиков? :) Я например считаю, что лучшая операционная система - MS Windows, лучшие электронные таблицы - MS Excel, лучшая СУБД - Oracle, лучший OLAP - Cognos PowerPlay. Очень многие компании, у которых хранилище или учетная система многие годы работает на Оракле, используют OLAP-решение от Cognos.
Поскольку Cognos имеет прямой драйвер к СУБД Oracle, подкачивать каждые 15 минут новые данные - вполне реально. Если есть желание - можно провести тест на Ваших реальных данных.
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32647468
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2Jurii

Что-то мне подсказывает, что все у них не так просто... :)
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32647477
JuriiОчень многие компании, у которых хранилище или учетная система многие годы работает на Оракле, используют OLAP-решение от Cognos.


Многие это сколько?
А списочек можно увидеть хотя бы десяточек?
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32647505
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
To Birkhoff:

Что-то мне подсказывает, что все у них не так просто... :)

Если почитать этот постинг, то становится обидно за OLAP. Объемы данных то совсем маленькие. Получается что мы судим обо всех OLAP-серверах исходя из функциональности далеко не самого мощного OLAP-сервера Oracle 10g... Это как если посмотреть, как школьники бегают 100-метровую дистанцию и сделать вывод, что чемпионы России тоже медленно бегают.

Многие это сколько?
А списочек можно увидеть хотя бы десяточек?


Списочек увидеть можно, но не в открытом доступе. Если интересно - пишите мне на мыло.
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32647522
Осирис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
JuriiСмущает большое число измерений. Для таких OLAP-серверов как Cognos PowerPlay или MS AS это копейки, но для Oracle 10g (реально это Oracle Express) зто многовато. Так что надо тестировать...

А у Oracle с этим проблемы ? С чем это связано ?
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32647532
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
JuriiЕсли почитать этот постинг, то становится обидно за OLAP. Объемы данных то совсем маленькие. Получается что мы судим обо всех OLAP-серверах исходя из функциональности далеко не самого мощного OLAP-сервера Oracle 10g... Это как если посмотреть, как школьники бегают 100-метровую дистанцию и сделать вывод, что чемпионы России тоже медленно бегают.


Если почитать этот постинг, становится ничего не ясно.
Судя по постингу у них прирост 2000х10х96=1920000 записей в сутки, что не так уж и мало.
С другой стороны непонятно, какие именно запросы тормозят и может ли им помочь в этом OLAP вообще и 10g в частности.
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32647603
to Jurii

Вы в каждом топике утверждаете, что Cognos PowerPlay - лучший продукт, а все остальные продукты это дворовый уровень (уровень школьников по сравнению с чемпионом).

Объяните мне пожайлуста, тогда почему у вас сайт http://cognos.narod.ru а не www.cognos.ru? А понял - Бесплатный хостинг - более сотвествует мировому уровню Вашего продукта.

На мой взгляд Вы оказываете своему продукту медвежию услугу ...

Так как хороший товар в рекламе не нуждается.
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32648028
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
To Осирис:

А у Oracle с этим проблемы ? С чем это связано ?

Думаю это связано с тем, что OLAP-движок Oracle (Oracle Express) был разработан очень давно, и многое в нем принципиально не изменилось. Поэтому по мощности он отстал от более современных Cognos PowerPlay и MS AS.
Другая причина - в том что Oracle Express позволяет создавать с помощью программирования модели со сложной внутренней логикой, а за это надо платить - количество ячеек куба не должно быть слишком большим (отсюда и ограничение по числу измерений). Так же точно ситуация обстоит и с OLAP-сервером Cognos Planning (аналог Oracle Express).

To Birkhoff:

Если почитать этот постинг, становится ничего не ясно.
Судя по постингу у них прирост 2000х10х96=1920000 записей в сутки, что не так уж и мало.

раз в 15 минут по 2000 строк с 10 серверов

Думаю надо это уточнить у автора дискуссии - 2000 строк за 15 минут, или 2000 строк с каждого сервера. Ну даже если 20 тысяч строк каждые 15 минут - то инкрементальная подкачка должна делаться за секунды (по крайней мере в PowerPlay это можно сделать, в MS AS тоже наверняка можно).

С другой стороны непонятно, какие именно запросы тормозят и может ли им помочь в этом OLAP вообще

Это тоже интересный вопрос. Но думаю если у автора дискуссии такой большой опыт с РСУБД, и ему не удается оптимизировать SQL-запросы, то OLAP - это его последняя надежда :)

To НЕТ РЕКЛАМЕ!!!:

Вы в каждом топике утверждаете, что Cognos PowerPlay - лучший продукт, а все остальные продукты это дворовый уровень

Не приведете ссылочки на эти топики, что-то не припомню за собой такого... Что касается очевидного превосходства PowerPlay над некоторыми другими продуктами для решения некоторых задач - это да, есть такие реальные факты. По интегрированному показателю эксперты ставят PowerPlay на первое место. Но есть и области, где PowerPlay не самый сильный.

Объяните мне пожайлуста, тогда почему у вас сайт http://cognos.narod.ru а не www.cognos.ru? А понял - Бесплатный хостинг

Мой сайт не является корпоративным, я создал его как независимый профессионал, чтобы сделать Cognos ближе к народу. Любой человек может туда зайти, задать любой вопрос. А что касается сайта www.cognos.ru - то этот сайт принадлежал одному из нескольких российских партнеров корпорации Cognos, этот партнер недавно объявил о прекращении своей деятельности, так что сейчас вопрос насчет этого сайта пока не решен.

На мой взгляд Вы оказываете своему продукту медвежию услугу ...
Так как хороший товар в рекламе не нуждается.


Я согласен, Cognos в рекламе не нуждается, поэтому его почти не рекламируют (я только 1 раз в жизни видел рекламу Cognos в одном из журналов). На этом форуме Cognos не рекламируется, я просто упоминаю этот OLAP-продукт чтобы обсудить его плюсы и минусы, иногда мои постинги немного провокационны :)
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32648035
guestt
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2НЕТ РЕКЛАМЕ
Да, от постингов Юрия уже тошнит...
Пусть даже Когнос - неплохой продукт, но благодаря Юрию, у меня лично он вызывает стойкое отвращение.
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32648055
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
To Guestt & НЕТ РЕКЛАМЕ:

Господа, если уж хотите сохранить анонимность, берите пример с г-на Гликогена - он хоть не скрывает, в какой компании работает :)
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32648236
WTF?
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Как же так?
JuriiНо есть и области, где PowerPlay не самый сильный.
Юрий, если не секрет, какие?
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32648293
Birkhoff
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
2Jurii
А у Oracle с этим проблемы ? С чем это связано ?

Думаю это связано с тем, что OLAP-движок Oracle (Oracle Express) был разработан очень давно, и многое в нем принципиально не изменилось. Поэтому по мощности он отстал от более современных Cognos PowerPlay и MS AS.
Другая причина - в том что Oracle Express позволяет создавать с помощью программирования модели со сложной внутренней логикой, а за это надо платить - количество ячеек куба не должно быть слишком большим (отсюда и ограничение по числу измерений). Так же точно ситуация обстоит и с OLAP-сервером Cognos Planning (аналог Oracle Express).


Ну с первой причиной еще можно согласиться. И то далеко не вовсех случаях, а только там где много измерений (больше 10) и одновременно большое количество агрегатов.
А вторая причина - ерунда, так как если куб в Экспрессе обсчитан и работает, то обсчет любых моделей или формул по нему тормозить не будет.
Плюс добавлю, что в 10g появилось партиционирование кубов (я правда не проверял пока как оно работает), но в по идее, если разбить на партиции по дням, то обновляться будет только микроскопический кубик за один день.

Инкрментальная загрузка в Express проходит тоже быстро, тем более что в Express возможно обновить конкретную точечную ячейку куба, а не обновлять весь куб. Поэтому если у вас нет после обновления пересчетов агрегатов, то работать будет все очень быстро. А если пересчет есть - то все зависит от дизайна.

В общем надо смотреть на то, что за проблемы и что тормозит.
...
Рейтинг: 0 / 0
программная загрузка данных в кубы Oracle 10g
    #32648355
Jurii
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
To Birkhoff:

а только там где много измерений (больше 10) и одновременно большое количество агрегатов

При большом количестве измерений, да еще если учитывать специфику железнодорожников, агрегатов не может быть мало...

но в по идее, если разбить на партиции по дням, то обновляться будет только микроскопический кубик за один день.

Думаю не все так просто - данные будут писаться в маленький кубик, но агрегаты будут пересчитываться с учетом всех партиций.

Поэтому если у вас нет после обновления пересчетов агрегатов, то работать будет все очень быстро. А если пересчет есть - то все зависит от дизайна.

После обновления куба агрегаты должны пересчитываться, иначе это будет не куб, а таблица РСУБД, в которую заинсертили новые записи.

To WTF:

Но есть и области, где PowerPlay не самый сильный.
Юрий, если не секрет, какие?


Ну например PowerPlay не позволяет вводить данные в ячейку куба, чтобы динамически все распределялось и пересчитывались производные кубы. К счастью, для этих задач у Cognos есть второй OLAP-сервер - Cognos Planning...
...
Рейтинг: 0 / 0
25 сообщений из 50, страница 1 из 2
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / программная загрузка данных в кубы Oracle 10g
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]