Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Discoverer=OLAP ?
|
|||
|---|---|---|---|
|
#18+
Можно ли считать, что Discoverer - это как бы OLAP ? Чем первое отличается от второго? Что лучше? Что сложнее в работе? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.07.2003, 18:10 |
|
||
|
Discoverer=OLAP ?
|
|||
|---|---|---|---|
|
#18+
Discoverer - это продукт для создания отчетов на основе SQL-запросов. Соответственно - это не OLAP, так как он не удовлетворяет одному из принципов FASMI - не может гарантировать 5-секундный отклик на запрос пользователя. Расскажите, каковы Ваши источники данных, какие у Вас задачи (анализировать данные или создавать статичные отчеты) и т.п. Тогда можно будет ответить на вопрос - нужен ли вам генератор отчетов или OLAP-продукт, или может Вам понадобится и то, и другое в интегрированном виде. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.07.2003, 18:19 |
|
||
|
Discoverer=OLAP ?
|
|||
|---|---|---|---|
|
#18+
Советую почитать этот форум, для того чтобы сложилось общее представление о том, что используется в этой области. Discoverer это действительно построитель запросов - генератор отчетов, который может выдавать как обычные реляционные результаты запросов в виде таблицы (Table) так и в виде псевдо-OLAP срезов (Cross Table) с интерфейсными возможностями нормальных OLAP систем. Так что на уровне пользователя сложно сказать OLAP это или еще что-то. Некоторые вещи в нем делаются удобнее чем в многомерном OLAP, например куб не лимитирован конкретным числом измерений, так как сам куб существует только виртуально. Но есть ограничения, например на объем обрабатываемых данных, но при использовании мезанизма Summary (materialized views) часто можно добиться очень хорошей производительности. В целом он относится к той же категории продуктов, что и Business Objects, Brio. Отдельные плюсы-минусы нужно сравнивать исходя из конкретной задачи. Так как в последние годы архитектуры аналитических систем смешиваются, то есть уже нет четкого разделения как раньше на многомерный олап, реляционный и гибридный, то и тест FASMI это скорее идеализация того, какую систему точно можно назвать OLAP. В жизни же все не так просто. Вот MS AS - многомерный OLAP сервер (хотя можно устроить и реляционное хранение кубов), однако при использовании Calculated Members, систему, построенную на его базе можно подвесить дольше чем на 5 секунд, даже на небольшой базе (за счет того что вычисления производятся на клиенте). Что уже тут неоднократно обсуждалось. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.07.2003, 18:56 |
|
||
|
Discoverer=OLAP ?
|
|||
|---|---|---|---|
|
#18+
Разница вообще то в том, что Discoverer - это конкретный программный продукт конкретного производителя, а OLAP- это целый класс различных продуктов, пытающихся соответствовать определенным принципам, так что сравнивать эти вещи невозможно. Discoverer появился как полупрофессиональный (и так его позиционирует Oracle) для быстрого создания отчетов на базе реляционных таблиц. Безусловно, для небольших баз он позволяет создавать отчеты, отвечающие всем принципам OLAPа (равно как существует размер базы, для которого таких средств вообще не существует). Что касается сравнения многомерных и реляционных баз, начнем с того что первых на самом деле не существует, поскольку это противоречит способам хранения информации на физических носителях. Этим термином называют базы, организующие доступ к данным такими способами, чтобы с достаточной производительностью обеспечить доступ к ним через многомерный словарь метаданных. Что касается ROLAP, то в Oracle9EE таковой на самом деле не является реляционным, поскольку каноническая теория реляционных баз не предусматривает наличия идентификатора строки и, следовательно, возможности использования bitmap индексов. Именно использование bitmap join индексов приближает скорость получения данных в такой базе к "многомерным" , в которых индексы обычно строятся на основе бинарных деревьев. По всей видимости именно это направление Oracle в последнее время развивает в первую очередь и вероятно скоро появится соответствующий инструмент разработки, подобный Discoverer'у. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.07.2003, 20:03 |
|
||
|
Discoverer=OLAP ?
|
|||
|---|---|---|---|
|
#18+
2 Bill Несколько замечаний. Был задан типичный вопрос человека, который не разбирается в тонкостях того, что есть OLAP. На этот вопрос можно ответить полностью только если объяснить сначала человеку что такое этот самый OLAP. А это практически нереально в рамках одного или даже нескольких постов форума. Можно только поглубже вчитаться/встретиться со знающими людьми. Так что тут я с вами в общем-то не спорю. Насчет того, что данные хранятся физически на плоском диске, а тот в свое время разбит на дорожки - тогда многомерных баз нет, это верно. Но никто и не думает что они на физическом уровне многомерны. Иначе было бы противопоставление многомерных и плоских или линейных или как-то еще баз данных, а не реляционных. Что касается нереляционности Oracle. Я не помню точно, существует ли в реляционной модели идентификатор строки, возможно и нет, но на то она и МОДЕЛЬ. Если следовать этой логике, реляционных баз вообще не существует в природе. Почему именно bitmap индексы выигрывают от наличия идентификаторов строк в Oracle, я тоже не понял. Это я к тому, что идентификатор строк используют все кому не лень, почему такое внимание bitmap индексам? Более того, bitmap индекс - это всего лишь один из типов индексов, который при ОПРЕДЕЛЕННЫХ и очень ограниченных условиях дает значительный прирост производительности. Повсеместно их применять нельзя, да и бессымсленно. Дальше я не понял какое именно направление, по вашему мнению, развивает Oracle и опять при чем тут bitmap индексы? И что например Discoverer-у сейчас мешает использовать bitmap индексы? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.07.2003, 21:05 |
|
||
|
Discoverer=OLAP ?
|
|||
|---|---|---|---|
|
#18+
Дальше я не понял какое именно направление, по вашему мнению, развивает Oracle и опять при чем тут bitmap индексы? И что например Discoverer-у сейчас мешает использовать bitmap индексы? Я не знаю как насчет bitmap индексов, это нужно учитывать наверное при проектировани DWH, но Discover может генерировать запросы используя аналитические функции Oracle, и на не очень больших объемах работать очень шустро и удобно. И называеться это, помоему, ROLAP, у которого, тоже есть свои достоинства. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.07.2003, 11:00 |
|
||
|
Discoverer=OLAP ?
|
|||
|---|---|---|---|
|
#18+
В соем несколько неловком сообщении я именно и хотел предостеречь человека от противопоставлений, навязываемых устоявшейся терминологией. Различия в возможностях организации данных в "реляционных" и "многомерных" OLAP-базах непрерывно стираются (в некоторых, например Cache', их никогда и не было). Реляционные базы именно плоские и линейные. В самом деле, у большинства реализаций реляционных баз идентификатор строки есть, однако использовать его рекомендуется исключительно в административных целях (поскольку это не предусмотрено стандартом SQL). Идентификатор строки входит в bitmap index и является его неотъемлемой частью. Внимание к нему уделено соответствующее потому что это важнейший инструмент, позволяющий быстро получать данные из реляционных хранилищ. Согласен, именно при ОПРЕДЕЛЕННЫХ и ограниченных условиях, как раз характерных для хранилищ данных. Обычные индексы плохо работают с сильно неуникальными данными (Oracle рекомендует использование обычного индекса если таковые составляют менее 10% базы), отсюда и представление о медленности реляционного олапа, где таковых большинство. На текущем этапе Oracle развивает только ROLAP, словарь метаданных (и функции для работы с ним) меняется в каждой версии, в отличие от многомерного, пришедшего из Експресса и не изменявшегося уже лет 8. И множество упомянутых аналитических функций для него разрабатываются не случайно. И что например Discoverer-у сейчас мешает использовать bitmap индексы? Да может и ничего не мешает- во всяком случае всегда можно сделать такие вручную. Не стоит только делать bitmap индексы на "живых" (OLTP) таблицах- они тормозят при insert(update)'ах ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.07.2003, 14:22 |
|
||
|
Discoverer=OLAP ?
|
|||
|---|---|---|---|
|
#18+
Более того, bitmap индекс - это всего лишь один из типов индексов, который при ОПРЕДЕЛЕННЫХ и очень ограниченных условиях дает значительный прирост производительности. Повсеместно их применять нельзя, да и бессымсленно. Скорее всего Bill_ намекал нам на способ представления данных типа "Звезда"/"Снежинка" (одна большая таблица фактов, много измерений индексирующих эту таблицу). В Oracle запросы к такой структуре выполняются достаточно быстро. Битовые индексы в "звезде" вешаются на поля таблицы фактов индексируемые измерениями. Наличие битовых индексов позволяет быстрее обрабатывать запросы к "звезде". В любом проекте использующем структуру данных "звезда" обязаны присутствовать битовые индексы. Теперь о самой структуре "звезда". По своей сути - это многомерное представление данных, реализованное в рамках реляционной базы данных (типа, наш ответ Чемберлену :) ). Oracle, насколько я знаю, действительно продвигает эту структуру, ввиду того, что она резко ускоряет скорость выполнения запосов. Если представить все данные в виде нескольких "звезд", то любой запрос к базе (то бишь ad-hoc) будет выполняться достаточно быстро. Особенно радует отсутствие ограничений на количество измерений индексирующих таблицу фактов (читай куб) и на размер самой таблицы фактов (куба). Кстати, специально для создания хранилищ данных такой структуры Oracle создал продукт Warehouse Builder. Так вот, если Discoverer будет работать с хранилищем данных, которое иcпользует структуру "звезда", тогда это и будет OLAP. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.07.2003, 14:44 |
|
||
|
Discoverer=OLAP ?
|
|||
|---|---|---|---|
|
#18+
2 Bill Уточнение Bitmap индексы используют в хранилищах, но не всегда, а только если есть подходящий признак. Например если у нас есть поле Пол (М/Ж), то bitmap индекс имеет смысл ипользовать, а если вы хотите переиндексировать bitmap индексом номенклатуру товаров - то bitmap тут не поможет. Что из себя по сути представляет bitmap индекс? Если мы возьмем всю таблицу со списком работников, вырежем из нее колонку Пол, и скажем что М будет обозначено битовым 0, а Ж - 1. И перепишем всю колонку таблицы - упрощенно говоря в одном байте мы сможем хранить данные о 8 записях исходной таблицы, если в исходной таблице они типа Char. Если мы хотим построить индекс не только по по полю Пол, но например Семейное положение - все происходит точно также, только все значения поля могут кодироваться не 1 битом, а двумя, например. То есть на выходе bitmap индекс представляет собой "сжатую" копию части исходной таблицы. А поиск по такому индексу производится сплошным сканированием этих записей. Нужно нам выбрать все холостых мужчин из базы - просканировали индекс и выпал нам список тех записей где есть и Пол М и статус Холост. Поэтому использоваться то оно может в хранилищах, но не всегда бывают такие удобные поля. 2 drive А Discoverer всегда работал с таблицами в схеме звезда, и даже снежинка, он работает со связями (foreign keys, или заданными вручную) между таблицами. Сама по себе организация таблиц в схему звезда дает прирост производительности только засчет того, что для работы foreign key строится дополнительный индекс, который и ускоряет работу. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.07.2003, 12:33 |
|
||
|
|

start [/forum/topic.php?fid=49&fpage=407&tid=1873285]: |
0ms |
get settings: |
10ms |
get forum list: |
13ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
62ms |
get topic data: |
11ms |
get forum data: |
2ms |
get page messages: |
93ms |
get tp. blocked users: |
2ms |
| others: | 15ms |
| total: | 214ms |

| 0 / 0 |
