|
|
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
Добрый день! Есть проблема с проектированием хранилища данных, очень прошу направить на путь истинный! Итак, в OLTP-базе есть 2 таблицы: одна таблица складских транзакций (InventTrans) вторая - таблица с агрегированными данными из первой (InventSum). InventSum для упрощения содержит набор FK колонок, набор колонок с агрегированными данными по разным условиям (могу быть и сложные) из InventTrans и галочку Closed, которая показывает, что по данной комбинации FK запасов больше нет. Пользователь хочет анализировать InventSum. Но при этом со временем там может появиться тьма записей с комбинациями FK, где наличие отсутствует. Я так понимаю здесь подходит только вариант транзакционного факта, при этом перед каждой загрузкой данных требуется очищать эту таблицу от имеющихся записей, дабы не накапливать мусор с галкой Closed Какой бы способ реализации применили Вы? Заранее благодарю! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.10.2014, 16:06 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
Cardagant, а работать только с "одна таблица складских транзакций" и агрегировать самому нельзя? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.10.2014, 16:11 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
кириллk, Спасибо за ответ. Там целая плеяда полей, которые собираются OLTP-системой на основе полей первой таблицы. Предложение реализовать на СКЛ всё, что делает OLTP-система? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.10.2014, 16:24 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
Cardagantкириллk, Спасибо за ответ. Там целая плеяда полей, которые собираются OLTP-системой на основе полей первой таблицы. Предложение реализовать на СКЛ всё, что делает OLTP-система? Вам надо свести данные к схеме звезда или снежинка, то всё хорошо пойдёт в OLAP ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.10.2014, 16:32 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
a_voronin, Это я понимаю. То есть в данном случае всю логику, которую применяет OLTP для сбора агрегированной таблицы следует переложить таблицу фактов 1 (исходную InventTrans)? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.10.2014, 16:35 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
Cardagant, ага, Axapta Отпиши georgend @ mail.ru С Уважением, Георгий ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.10.2014, 16:57 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
George Nordic, ага, Аксапта) сейчас напишу, спасибо! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.10.2014, 17:01 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
CardagantДобрый день! Есть проблема с проектированием хранилища данных, очень прошу направить на путь истинный! Итак, в OLTP-базе есть 2 таблицы: одна таблица складских транзакций (InventTrans) вторая - таблица с агрегированными данными из первой (InventSum). InventSum для упрощения содержит набор FK колонок, набор колонок с агрегированными данными по разным условиям (могу быть и сложные) из InventTrans и галочку Closed, которая показывает, что по данной комбинации FK запасов больше нет. Пользователь хочет анализировать InventSum. Но при этом со временем там может появиться тьма записей с комбинациями FK, где наличие отсутствует. Я так понимаю здесь подходит только вариант транзакционного факта, при этом перед каждой загрузкой данных требуется очищать эту таблицу от имеющихся записей, дабы не накапливать мусор с галкой Closed Какой бы способ реализации применили Вы? Заранее благодарю! 1.1. Реляционная база данных может быть хранилищем данных, но только в денормализованном виде Ненормализованные пространственные бд строятся чаще всего из схемы - "Звезда" или "Снежинка" 1.2. Хранилище планируете развернуть на отдельной машине ? Тогда необходимо будет решать задачи : Извлечения данных из разнородных источников; Преобразования и очистки данных; Загрузки данных в ХД; Вы готовы к этому ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.10.2014, 14:25 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
Станислав Клевцов1.1. Реляционная база данных может быть хранилищем данных, но только в денормализованном виде Ненормализованные пространственные бд строятся чаще всего из схемы - "Звезда" или "Снежинка" Это кто ж тебя такой чуши научил... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.10.2014, 20:08 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
ApexСтанислав Клевцов1.1. Реляционная база данных может быть хранилищем данных, но только в денормализованном виде Ненормализованные пространственные бд строятся чаще всего из схемы - "Звезда" или "Снежинка" Это кто ж тебя такой чуши научил... читал где-то ... это для бюджетного ХД пойдет. Для ХД можно использовать : https://ru.wikipedia.org/wiki/Greenplum - https://ru.wikipedia.org/wiki/Teradata - только вот цены кусаются из того что известно мне...но есть же и другие... Для построения хранилищ популярны несколько методологий: http://habrahabr.ru/post/227111/ ... Во-первых это Кимбэл, и построение хранилища в виде комбинации «звезд». Одна из самых популярных методологий, т.к. ей учат во всех наших институтах, где читают про хранилища. Во-вторых, это Инмон.… Точнее не просто Инмон, а скорее инерция. Его подход к проектированию хранилищ содержит ряд красивых тезисов, вроде нормализации, но не содержит однозначного алгоритма, как именно преобразовать бизнес-модель в модель данных (в таблицы СУБД). Но всегда есть короткая дорога — можно взять таблицы исходной системы, из которой заполняется хранилище, перенести их AS IS, немного доработать и будет хранилище. Почти по Инмону. В третьих, это Data Vault. Относительно новая методология, но в России уже более-менее известная, даже статья в википедии на русском есть. Неплохая штука, есть и идеология, и алгоритм построения моделей. В четвертых, это Anchor Modeling. Совсем новая методология, местами шокирующая, т.к. предполагает хранение данных с соблюдением 6-й нормальной формы. ... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.10.2014, 21:06 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
Станислав КлевцовApexпропущено... Это кто ж тебя такой чуши научил... читал где-то ... это для бюджетного ХД пойдет. Давай попробуем еще раз, я на этот раз выделю Станислав Клевцов 1.1. Реляционная база данных может быть хранилищем данных, но только в денормализованном виде Ненормализованные пространственные бд строятся чаще всего из схемы - "Звезда" или "Снежинка" ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.10.2014, 07:04 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
Станислав Клевцов http://habrahabr.ru/post/227111/ ... Во-первых это Кимбэл, и построение хранилища в виде комбинации «звезд». Одна из самых популярных методологий, т.к. ей учат во всех наших институтах, где читают про хранилища. Во-вторых, это Инмон.… Точнее не просто Инмон, а скорее инерция. Его подход к проектированию хранилищ содержит ряд красивых тезисов, вроде нормализации, но не содержит однозначного алгоритма, как именно преобразовать бизнес-модель в модель данных (в таблицы СУБД). Но всегда есть короткая дорога — можно взять таблицы исходной системы, из которой заполняется хранилище, перенести их AS IS, немного доработать и будет хранилище. Почти по Инмону. В третьих, это Data Vault. Относительно новая методология, но в России уже более-менее известная, даже статья в википедии на русском есть. Неплохая штука, есть и идеология, и алгоритм построения моделей. В четвертых, это Anchor Modeling. Совсем новая методология, местами шокирующая, т.к. предполагает хранение данных с соблюдением 6-й нормальной формы. ... Это, кстати, тоже каша какая-то. Data Vault - это не методология, это техника моделирования, нет там методологии. Методология как раз у Инмона и Кимбалла. А у Дэна грубо говоря способ замоделировать что-то для чего-то. Хороший способ, кстати, мне нравится, но на методологию все же не тянет. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.10.2014, 07:15 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
Станислав Клевцов, автор1.1. Реляционная база данных может быть хранилищем данных, но только в денормализованном виде Ненормализованные пространственные бд строятся чаще всего из схемы - "Звезда" или "Снежинка" ДА, спасибо, теорию знаю :) автор1.2. Хранилище планируете развернуть на отдельной машине ? Тогда необходимо будет решать задачи : Извлечения данных из разнородных источников; Преобразования и очистки данных; Загрузки данных в ХД; Вы готовы к этому ? Подразумевается наличие хранилища СКЛ, которое будет наполняться посредством ССИС пакета. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.10.2014, 11:38 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
ApexСтанислав Клевцовпропущено... читал где-то ... это для бюджетного ХД пойдет. Давай попробуем еще раз, я на этот раз выделю Станислав Клевцов 1.1. Реляционная база данных может быть хранилищем данных, но только в денормализованном виде Ненормализованные пространственные бд строятся чаще всего из схемы - "Звезда" или "Снежинка" ' ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 31.10.2014, 19:46 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
Станислав КлевцовApexпропущено... Давай попробуем еще раз, я на этот раз выделю пропущено... ' ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.11.2014, 02:29 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.11.2014, 05:49 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
ApexApexпропущено... ОК, вечером гляну. Ну, короче, там сильно поверхностное изложение, пример, приведенный на 43-й минуте - это всего лишь пример, т.е. один из возможных вариантов реалиазции, причем довольно простой, по понятным причинам, т.к. лекция явно расчитана на людей, которые вообще первый раз слушают о хранилищах. Делать вывод на основании этой лекции, что реализация должна быть именно такая и никакая иначе - как минимум неправильно, ибо хранилища данных не ограничиваются витринами. Спасибо, что посмотрели пример. Apex...лекция явно рассчитана на людей... ... хранилища данных не ограничиваются витринами... Согласен с вами. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.11.2014, 14:45 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
Apex Клевцов СтаниславДопустим мы проектируем ХД, с помощью техники моделирования Data Vault для 2 сущностей нам необходимо будет наличие двух хабов, двух хаб-сателлитов и связь этих сущностей (линк и линк-сателлит). А как будет в Anchor Modeling ? На каждый атрибут хаба будет отдельная таблица ... и поверх всех таблиц с атрибутами хаба будет витрина, собирающая все в одну кучу ? А в остальном все так же или есть какие - нибудь отличия? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.11.2014, 14:56 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
ApexСтанислав Клевцовпропущено... ... На каждый атрибут хаба будет отдельная таблица. В принципе здесь по шагам все описывается: http://www.anchormodeling.com/?page_id=186 Приступимссс... :-) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.11.2014, 22:58 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
Станислав Клевцов 1.1. Реляционная база данных может быть хранилищем данных, но только в денормализованном виде Ненормализованные пространственные бд строятся чаще всего из схемы - "Звезда" или "Снежинка" ну вот почему бедную звезду или там снежинку упорно называют денормализованной... Денормализация (англ. denormalization) — намеренное приведение структуры базы данных в состояние, не соответствующее критериям нормализации, обычно проводимое с целью ускорения операций чтения из базы за счет добавления избыточных данных. https://ru.wikipedia.org/wiki/Денормализация Идеал денормализованного представления есть одна таблица содержащая буквально все в себе и не требующая джойнов вовсе. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.11.2014, 22:36 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
vmarch, Потому что одним из последних шагов при проектировании модели ХД по звезде является денормализация. Вы об этом не знали? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.11.2014, 23:04 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
CardagantДобрый день! ... в OLTP-базе есть 2 таблицы: одна таблица складских транзакций (InventTrans) вторая - таблица с агрегированными данными из первой (InventSum). InventSum для упрощения содержит набор FK колонок, набор колонок с агрегированными данными по разным условиям (могу быть и сложные) из InventTrans и галочку Closed, которая показывает, что по данной комбинации FK запасов больше нет. Пользователь хочет анализировать InventSum. Но при этом со временем там может появиться тьма записей с комбинациями FK, где наличие отсутствует. pardon, у Вас хранилище проектируется или витрина данных по состоянию на данный момент? подход немного разнится. В хранилище скорее всего надо предусмотреть возможность воспроизвести ситуацию "А что у нас, мнэээ, месяц назад было?" А месяц назад эта вот запись в InventSum не была Closed. Судя по всему, пользователя интересует только "здесь и сейчас". Тогда смело Cardagantочищать эту таблицу от имеющихся записей, дабы не накапливать мусор ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.11.2014, 23:14 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
Полковник.vmarch, Потому что одним из последних шагов при проектировании модели ХД по звезде является денормализация. Вы об этом не знали? извините, частичная денормализация - что еще в свою очередь не означает денормализованности звезды как таковой ;). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.11.2014, 23:21 |
|
||
|
Прошу совета по проектированию хранилища данных
|
|||
|---|---|---|---|
|
#18+
vmarch, Как раз-таки хранилище проектирую. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.11.2014, 15:34 |
|
||
|
|

start [/forum/topic.php?fid=49&fpage=26&tid=1858025]: |
0ms |
get settings: |
9ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
50ms |
get topic data: |
11ms |
get forum data: |
2ms |
get page messages: |
58ms |
get tp. blocked users: |
1ms |
| others: | 249ms |
| total: | 401ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...