Затраты на создание DWH / Разработка информационных систем

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Разработка информационных систем [игнор отключен] [закрыт для гостей] / Затраты на создание DWH

25 сообщений из 206, страница 6 из 9

все

Затраты на создание DWH

#39820653

Megabyte

Участник

Откуда: ближайшее заМКАДье

Сообщения: 4 239

Рейтинг: 0 / 0

s_ustinovПодобных запросов понадобится сделать пару - тройку десятков за несколько дней, причем заранее никто список, какие запросы будут нужны, сказать не сможет. Смотрятся данные, и по результатам осмысления формируются требования к следующему запросу.
Оптимизировать такие запросы смысла нет - они одноразовые. Готовыми агрегированными данными не воспользуешься - данные в таких разрезах никому раньше не были интересны.
И при этом некоторые из подобных запросов могут очень сильно нагрузить базу. И информации о том, будут тормоза или нет, и если будут, то какие - тоже нет - именно таких запросов к базе никто раньше не делал.

Так dwh - это некая система или просто отдельный сервер? Потому как для таких одноразовых не оптимизированных запросов можно просто копию/реплику бд сделать. Если так, то тогда у нас тоже есть dwh. :) правда именуется резервным сервером и используется только разрабами.

...

Рейтинг:

0 / 0

31.05.2019, 11:39

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39820725

alex55555

Участник

Сообщения: 1 471

Рейтинг: 0 / 0

MegabyteТак dwh - это некая система или просто отдельный сервер?
Это сложная хрень с кучей запчастей для кучи задач. И к этой хрени нужны админы и всякие разработчики-аналитики. В общем стоит дорого. И всё ради того, что бы начальник иногда мог получить некий отчёт побыстрее. Ну да с этой сторону уже Устинов всё расписал.

...

Рейтинг:

0 / 0

31.05.2019, 13:12

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39820788

H5N1

Участник

Откуда: Yo.! из "Сравнения субд"

Сообщения: 685

Рейтинг: 0 / 0

МодальноеОкнодиагноз - это инфоцыгане продающие кашу из топора

кривой отчет по кривой архитектуре кладет на бок всю базу. по этому давайте рядом сделаем свалку из разного мусора с гордым именем - хранилище

а по мне инфоцыган тот кто херачит код не понимая что в репортинге многоблочное чтение фулсканом денормализованных данных в аналитике стандарт именно потому, что в сотни и тысячи раз быстрее джоинов.

...

Рейтинг:

0 / 0

31.05.2019, 14:33

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39820799

mad_nazgul

Участник

Сообщения: 3 848

Рейтинг: 0 / 0

H5N1а по мне инфоцыган тот кто херачит код не понимая что в репортинге многоблочное чтение фулсканом денормализованных данных в аналитике стандарт именно потому, что в сотни и тысячи раз быстрее джоинов.

grep наше всио?!
<:o)

...

Рейтинг:

0 / 0

31.05.2019, 14:54

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39820802

H5N1

Участник

Откуда: Yo.! из "Сравнения субд"

Сообщения: 685

Рейтинг: 0 / 0

mad_nazgul
grep наше всио?!
<:o)
да. век бигдаты на дворе.

...

Рейтинг:

0 / 0

31.05.2019, 14:58

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39820807

МодальноеОкно

Участник

Сообщения: 2 533

Рейтинг: 0 / 0

H5N1mad_nazgulgrep наше всио?!
<:o)
да. век бигдаты на дворе.

скорее век проходимцев

...

Рейтинг:

0 / 0

31.05.2019, 15:07

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39820879

s_ustinov

Участник

Откуда: Munchen, DE

Сообщения: 1 922

Рейтинг: 0 / 0

alex55555s_ustinovЯ надеюсь, "грамотные специалисты" умеют читать?
Они ещё и понимать умеют. Они отлично понимают, что ты тупо передёргиваешь. Либо от непонимания, либо намеренно - с пониманием. Последний случай безнадёжен. Ну а в первом случае ты получаешься идиотом.

Поэтому все твои "сложности с отчётами" либо бот первого (идиотизма), либо от желания нагадить. Оба случая - клинические.

Может, "грамотные специалисты" к своим измышлениям еще и цитаты умеют приводить, которые подкрепляют их утверждения?

alex55555ЗЫ. Для случая "идиот" всё же попробую на пальцах показать - речь шла о времени выполнения запроса (перечитай ветку), и в контексте времени выполнения роль играет именно количество данных, а если к этому количеству прикладывается десяток джойнов, которые уменьшают количество данных раз так в 100 , то такой финт ушами даже ускоряет работу отчёта.

Извините, а вы точно умеете на SQL запросы писать?

Я вам немного расскажу про джойны. На пальцах, чтобы даже “грамотному специалисту” было понятно.
В OLTP системах джойны действительно часто (но не всегда!) приводят к уменьшению количества данных. (Кстати, если умеете читать - рекомендую начать с прочтения статей в википедии, для вашего уровня будет очень полезно. Например, прочтите вот эту статью: https://ru.wikipedia.org/wiki/OLTP)
Но в аналитических запросах джойны обычно приводят к совсем другим результатам.

Рассмотрим очень простой пример, который будет понятен даже “грамотному специалисту”.
Предположим, у нас есть:
- Отгрузки (30000 строк)
- Инвойсы (20000 строк)
- Платежи (10000 строк)
И две вспомогательных таблицы для связей многие ко многим между отгрузками и инвойсами и между инвойсами и платежами.

У каждой отгрузки есть как минимум один инвойс, но бывает и два и три. В среднем - два инвойса на отгрузку.
У каждого инвойса как минимум один платеж, но бывает и 2 оплаты. В среднем - 1,2 оплаты на инвойс.
Каждая оплата относится как минимум к одному инвойсу, но чаще одна оплата относится к 2-3 инвойсам. В среднем - одна оплата на 2 инвойса.

И вот предположим нам надо узнать, какими платежами оплачены каждая из отгрузок.
Делаем четыре (всего четыре, не десять!!!) джойна - соединяем отгрузки с инвойсами, которые выставлены по этим отгрузкам, а инвойсы в свою очередь соединяем с платежами, которые закрывают инвойсы.
И у нас, в результате, будет примерно 30000 * 2 * 1,2 = 72000 строк. Не меньше, а БОЛЬШЕ , чем в каждой из "исходных" таблиц - отгрузок и платежей.

...

Рейтинг:

0 / 0

31.05.2019, 16:41

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39820917

Ares_ekb

Участник

Откуда: Екатеринбург

Сообщения: 645

Рейтинг: 0 / 0

s_ustinov,

не понятно к чему этот пример. Если все данные будут лежать в одной таблице, то строк будет меньше?

Смысл в высокой степени нормализации данных в хранилищах такой:

1) Устойчивость схемы данных. При изменении схемы данных OLTP в DWH только добавляются таблицы, но не изменяются и не удаляются - старые данные никак не затрагиваются.

2) Возможность гармонизировать между собой очень разнородные схемы данных OLTP. Те же сведения об организациях, товарах и т.п. могут иметь разную структуру в разных системах. А в DWH можно всё это свести, если использовать 6НФ.

3) Производительность. Важно не только сколько строк, но и сколько столбцов. Если для запроса не нужны абсолютно все столбцы, то объём данных меньше. А если ещё используются колоночное хранение, то совсем зашибись.

...

Рейтинг:

0 / 0

31.05.2019, 17:32

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39820935

s_ustinov

Участник

Откуда: Munchen, DE

Сообщения: 1 922

Рейтинг: 0 / 0

Megabytes_ustinovВсе так, но вы забываете еще об одном минусе, когда OLTP и сложные отчеты "в одном флаконе".

Предположим, у нас есть:
пропущено...

и в какой то не очень счастливый момент запускается 2-3 тяжелых отчета каждый на полчаса - час.
Я подозреваю, что пользователям станет не просто тяжело, а очень тяжело ...
А вы запросы не пробовали оптимизировать или архитектуру?
У нас в олтп системе вполне себе уживаются аналитика и обычная текущая работа. Конечно у разного бизнеса отчётность может отличаться. Может в вашем случае по-другому. У нас просто отчёт, который выполняется больше минуты, это уже медленный. Нагрузку на систему он не дает, так чтобы всем было тяжело. И в целом такие отчёты - это редкость и в 95% случаев они либо не оптимизированы, либо кривая изначальная архитектура данных.
Кривая архитектура данных у подавляющего большинства систем.
И очень часто архитектуру данных править нет и смысла, и возможностей. Ну вот написали так разработчики тиражной системы лет 20 назад.

Сложные отчеты могут считаться долго. И даже "выправление" структуры данных не особо поможет - банально большой объем вычислений.
Да, можно делать отдельные таблички для промежуточных результатов, ночами пересчитывать данные и записывать в эти таблички, попутно чистить данные от косяков и т.д. - но зачем это делать на том же сервере СУБД, что и OLTP система? Чтобы они конфликтовали между собой за ресурсы?
А если вынести на отдельный сервер - это и будет DWH.

...

Рейтинг:

0 / 0

31.05.2019, 17:48

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39820938

s_ustinov

Участник

Откуда: Munchen, DE

Сообщения: 1 922

Рейтинг: 0 / 0

Megabytes_ustinovПодобных запросов понадобится сделать пару - тройку десятков за несколько дней, причем заранее никто список, какие запросы будут нужны, сказать не сможет. Смотрятся данные, и по результатам осмысления формируются требования к следующему запросу.
Оптимизировать такие запросы смысла нет - они одноразовые. Готовыми агрегированными данными не воспользуешься - данные в таких разрезах никому раньше не были интересны.
И при этом некоторые из подобных запросов могут очень сильно нагрузить базу. И информации о том, будут тормоза или нет, и если будут, то какие - тоже нет - именно таких запросов к базе никто раньше не делал.

Так dwh - это некая система или просто отдельный сервер? Потому как для таких одноразовых не оптимизированных запросов можно просто копию/реплику бд сделать. Если так, то тогда у нас тоже есть dwh. :) правда именуется резервным сервером и используется только разрабами.
Мое мнение - во многих случаях такого DWH вполне достаточно. Просто отдельный сервер с репликой базы, где выполняются сложные отчеты.
Правда, потом может понадобиться хранить данные в очищенном виде, в более правильной структуре, с расчетом некоторых промежуточных результатов - и постепенно появится "настоящий" DWH.

...

Рейтинг:

0 / 0

31.05.2019, 17:52

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39821013

s_ustinov

Участник

Откуда: Munchen, DE

Сообщения: 1 922

Рейтинг: 0 / 0

Ares_ekbs_ustinov,

не понятно к чему этот пример. Если все данные будут лежать в одной таблице, то строк будет меньше?

Смысл в высокой степени нормализации данных в хранилищах такой:

1) Устойчивость схемы данных. При изменении схемы данных OLTP в DWH только добавляются таблицы, но не изменяются и не удаляются - старые данные никак не затрагиваются.

2) Возможность гармонизировать между собой очень разнородные схемы данных OLTP. Те же сведения об организациях, товарах и т.п. могут иметь разную структуру в разных системах. А в DWH можно всё это свести, если использовать 6НФ.

3) Производительность. Важно не только сколько строк, но и сколько столбцов. Если для запроса не нужны абсолютно все столбцы, то объём данных меньше. А если ещё используются колоночное хранение, то совсем зашибись.
Нет, пример не к тому, чтобы хранить все в одной таблице.
Мне самому больше нравится работать с данными в высоких формах нормализации.

Пример к тому, что объемы вычислений в аналитических запросах могут быть очень большими . И такие запросы могут очень негативно сказаться на работе OLTP приложения.

Если в том примере посчитать использование оборотных средств по заказам покупки / продажи, то при примерно похожих количествах поступлений, инвойсов закупки и платежей поставщикам количество строк для обработки в результате джойнов легко вырастает до нескольких миллионов. А ведь самих операций в этом условном примере мало - десятки тысяч строк.

А если данных побольше - там количество строк после соединений легко превысит несколько миллиардов. И нагрузка на сервер БД будет очень существенной.

...

Рейтинг:

0 / 0

31.05.2019, 20:54

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39821098

Megabyte

Участник

Откуда: ближайшее заМКАДье

Сообщения: 4 239

Рейтинг: 0 / 0

s_ustinovКривая архитектура данных у подавляющего большинства систем.
И очень часто архитектуру данных править нет и смысла, и возможностей. Ну вот написали так разработчики тиражной системы лет 20 назад.

Да, Кривая архитектура - это частое явление. Но это же не значит, что её не надо исправлять... Потихоньку, кусочками. Другое дело, если нет возможности исправить.
Я вижу необходимость отдельного сервера под хранилище, если надо действительно оперировать большими объёмами данных за одну выгрузку, притом чтобы не мешать текущей работе. И то тут тоже есть варианты оптимизации вроде промежуточных расчетов и агрегаций.

...

Рейтинг:

0 / 0

01.06.2019, 10:22

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39821118

s_ustinov

Участник

Откуда: Munchen, DE

Сообщения: 1 922

Рейтинг: 0 / 0

MegabyteЯ вижу необходимость отдельного сервера под хранилище, если надо действительно оперировать большими объёмами данных за одну выгрузку, притом чтобы не мешать текущей работе. И то тут тоже есть варианты оптимизации вроде промежуточных расчетов и агрегаций.
Из моей практики, когда пишешь отчеты для целей анализа - регулярно сталкиваешься с большими объемами. То есть 10-20 отчетов быстрые и легкие, а потом бац - и очередной отчет на пол часа грузит систему...

Варианты оптимизации, разумеется, есть. Но главный вопрос - зачем?
Отдельный сервер для отчетов может быть не особо мощным (и не очень дорогим). Настроить асинхронную реплику базы - пара дней. И после этого можно вообще не беспокоиться о возможном влиянии отчетов на рабочую систему. Отчет в худшем случае положит сервер отчетов, но никак не затронет рабочую систему. С моей точки зрения - овчинка стоит выделки.

...

Рейтинг:

0 / 0

01.06.2019, 13:09

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39821142

alex55555

Участник

Сообщения: 1 471

Рейтинг: 0 / 0

...

Рейтинг:

0 / 0

01.06.2019, 15:58

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39821143

alex55555

Участник

Сообщения: 1 471

Рейтинг: 0 / 0

s_ustinovИ у нас, в результате, будет примерно 30000 * 2 * 1,2 = 72000 строк. Не меньше, а БОЛЬШЕ , чем в каждой из "исходных" таблиц - отгрузок и платежей.
Для начала скажи мне - ты хоть раз слышал фразу "план выполнения запроса"? Если нет, тогда можешь и дальше бегать и прыгать от радости полного непонимания проблемы.

...

Рейтинг:

0 / 0

01.06.2019, 16:00

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39821147

alex55555

Участник

Сообщения: 1 471

Рейтинг: 0 / 0

s_ustinovПример к тому, что объемы вычислений в аналитических запросах могут быть очень большими . И такие запросы могут очень негативно сказаться на работе OLTP приложения.
Это один момент.
s_ustinovА если данных побольше - там количество строк после соединений легко превысит несколько миллиардов. И нагрузка на сервер БД будет очень существенной.
А это уже принципиально другой момент. И ты, очевидно, разницы между ними не понимаешь. Вот поэтому тебе и кажется, что улучшить ничего нельзя. Но я тебе по секрету скажу - улучшить можно. То есть в переводе на русский язык "попроще" - ты реально не стоишь тех денег, которые тебе зачем-то платит твой работодатель. Ты тупо не даёшь ему улучшить его систему, заявляя про невозможность улучшения и приводя в качестве аргумента идиотские рассуждения про миллиарды строк.

Миллиарды получаются только тогда, когда пейсатель запросов не понимает, как работает БД. И вот твой пример как раз нам это дело ярко демонстрирует. Ты высосал из пальца эти миллиарды только лишь потому, что не понимаешь, как от них избавиться. Ну и начальству пропихиваешь эти теории, сервера дополнительные, софт дорогой, репликации, обслугу к этому всему, себя в качестве аналитика... В общем куча лишних затрат из-за непонимания того, что реально можно сделать.

...

Рейтинг:

0 / 0

01.06.2019, 16:05

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39821204

s_ustinov

Участник

Откуда: Munchen, DE

Сообщения: 1 922

Рейтинг: 0 / 0

alex55555s_ustinovПример к тому, что объемы вычислений в аналитических запросах могут быть очень большими . И такие запросы могут очень негативно сказаться на работе OLTP приложения.
Это один момент.
s_ustinovА если данных побольше - там количество строк после соединений легко превысит несколько миллиардов. И нагрузка на сервер БД будет очень существенной.
А это уже принципиально другой момент. И ты, очевидно, разницы между ними не понимаешь. Вот поэтому тебе и кажется, что улучшить ничего нельзя. Но я тебе по секрету скажу - улучшить можно. То есть в переводе на русский язык "попроще" - ты реально не стоишь тех денег, которые тебе зачем-то платит твой работодатель. Ты тупо не даёшь ему улучшить его систему, заявляя про невозможность улучшения и приводя в качестве аргумента идиотские рассуждения про миллиарды строк.

Миллиарды получаются только тогда, когда пейсатель запросов не понимает, как работает БД. И вот твой пример как раз нам это дело ярко демонстрирует. Ты высосал из пальца эти миллиарды только лишь потому, что не понимаешь, как от них избавиться. Ну и начальству пропихиваешь эти теории, сервера дополнительные, софт дорогой, репликации, обслугу к этому всему, себя в качестве аналитика... В общем куча лишних затрат из-за непонимания того, что реально можно сделать.
Ооооо...
"Грамотный специалист" почитал википедию...

А вот про соединения таблиц, видать, "ниасилил"...

Ты не стесняйся, детально расскажи, как избавиться от миллиардов строк. Я так понимаю, речь идет о секретной технологии "к этому количеству прикладывается десяток джойнов, которые уменьшают количество данных раз так в 100"?

Можешь для примера взять описанную мной задачу - для торговой фирмы посчитать фактическую потребность в оборотных средствах для каждого заказа (покупки или продажи) за несколько лет. Это тот самый пример, который по моим расчетам для компании со средним количеством операций покупок / продаж (сотни тысяч в год) может потребовать обработки миллиардов строк.
Продемонстрируй нам свои глубокие знания "как работает БД". ))

...

Рейтинг:

0 / 0

01.06.2019, 22:29

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39821282

s_ustinov

Участник

Откуда: Munchen, DE

Сообщения: 1 922

Рейтинг: 0 / 0

s_ustinovТы не стесняйся, детально расскажи, как избавиться от миллиардов строк. Я так понимаю, речь идет о секретной технологии "к этому количеству прикладывается десяток джойнов, которые уменьшают количество данных раз так в 100"?

Можешь для примера взять описанную мной задачу - для торговой фирмы посчитать фактическую потребность в оборотных средствах для каждого заказа (покупки или продажи) за несколько лет. Это тот самый пример, который по моим расчетам для компании со средним количеством операций покупок / продаж (сотни тысяч в год) может потребовать обработки миллиардов строк.
Продемонстрируй нам свои глубокие знания "как работает БД". ))
Давай я тебе даже чуть подробнее опишу ситуацию, а то есть у меня ощущение, что такой "грамотный специалист" в лучшем случае с парой ларьков работал. )))

Потребность в оборотном капитале - это когда ты заплатил 5 числа поставщику 10000, а 23 числа получил от покупателя 11000. И вот на эти 18 дней (23-5) тебе нужно где то взять 10000. И, разумеется, скорее всего платить за каждый день использования. То есть на эту сделку тебе надо 18 * 10000 = 180000 деньго*дней. Надеюсь, не сильно сложно для "грамотного специалиста" объясняю?
В реальной жизни обычно делают не один платеж поставщику, а много - поставщику, аренда контейнера, перевозка, хранение, растаможка и т.д.

Предположим, ситуация:
Стоит задача найти за пять лет 200 самых лучших отгрузок по показателю:
Маржа / Использованный оборотный капитал
Маржа у нас выручка минус себестоимость. Использованный оборотный капитал - деньго*дни.
Это я специально для "грамотного специалиста" повторяю. )))
2000 отгрузок в день. Считаем, что рабочих дней 300 в год.
Каждая отгрузка - 15 позиций, примерно треть из них из разных партий - 20 партий в отгрузке.
Итого за год - 2000 * 20 * 300 = 12'000'000 (двенадцать миллионов отгрузок разных партий).
За пять лет - 60 миллионов.
20% отгрузок - две оплаты (аванс + оплата).
По каждой партии товара 15 платежей поставщикам (тоже часть с авансовыми платежами).
Итого 60'000'000 * 1,2 * 15 = 1'080'000'000 строк (чуть больше миллиарда).

Расскажи нам всем, "что реально можно сделать", как избавиться от обработки этого миллиарда строк. Продемонстрируй знание "как работает БД".

...

Рейтинг:

0 / 0

02.06.2019, 12:18

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39821289

s_ustinov

Участник

Откуда: Munchen, DE

Сообщения: 1 922

Рейтинг: 0 / 0

Хотя нет, с заказами там действительно легко уменьшить количество строк именно для этой задачи.
Я по привычке для таких вещей считаю строчки фактов для куба.
Например, другой запрос - вывести покупателя, поставщика, товарную группу, маржу по покупателю в целом (будет дублироваться в нескольких строках) и использованный оборотный капитал.

...

Рейтинг:

0 / 0

02.06.2019, 12:54

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39821375

alex55555

Участник

Сообщения: 1 471

Рейтинг: 0 / 0

s_ustinovТы не стесняйся, детально расскажи, как избавиться от миллиардов строк. Я так понимаю, речь идет о секретной технологии "к этому количеству прикладывается десяток джойнов, которые уменьшают количество данных раз так в 100"?
Твой узбекский метод вытягивания знаний (которых ты, понятно, не имеешь) меня ни разу не удивляет. А потому совсем спокойно тебе, глупышке, объясняю - если хочешь повысить скилл, то в первую очередь учись искать информацию. А во вторую очередь - учись вежливости при общении с грамотными специалистами. Первое они тоже будут проверять, так что одно без другого не работает.

И вот когда научишься, вот тогда с тобой будут разговаривать о деле, а не о глупостях.

ЗЫ. Начни хотя бы с тривиальной фильтрации, может хоть как-то начнёшь понимать азы.

...

Рейтинг:

0 / 0

02.06.2019, 19:49

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39821376

alex55555

Участник

Сообщения: 1 471

Рейтинг: 0 / 0

s_ustinovНапример, другой запрос - вывести покупателя, поставщика, товарную группу, маржу по покупателю в целом (будет дублироваться в нескольких строках) и использованный оборотный капитал.
Вот это, возможно, если схема данных убогая и ты в не не создал нужных вещей, может потребовать fullscan, но для начала я бы хотел, что бы ты продемонстрировал понимание - почему этот случай отличается от случай, когда я говорил про 100-кратное сокращение.

...

Рейтинг:

0 / 0

02.06.2019, 19:51

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39821665

s_ustinov

Участник

Откуда: Munchen, DE

Сообщения: 1 922

Рейтинг: 0 / 0

alex55555s_ustinovНапример, другой запрос - вывести покупателя, поставщика, товарную группу, маржу по покупателю в целом (будет дублироваться в нескольких строках) и использованный оборотный капитал.
Вот это, возможно, если схема данных убогая и ты в не не создал нужных вещей, может потребовать fullscan, но для начала я бы хотел, что бы ты продемонстрировал понимание - почему этот случай отличается от случай, когда я говорил про 100-кратное сокращение.
О, уже нашлась причина - "схема данных убогая".
Ну так расскажи нам про хорошую схему данных применительно к этой задаче.
Но внутренний голос мне подсказывает, что и тут что то тебе помешает.
А если бы в танцоры пошел?

YouTube Video

...

Рейтинг:

0 / 0

03.06.2019, 13:56

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39821701

Leonid Kudryavtsev

Участник

Сообщения: 9 300

Рейтинг: 0 / 0

alex55555..Вот это, возможно, если схема данных убогая....
Давайте подойдем филосовски: "а бывают ли НЕ убогие схемы данных?"

На мой взгляд, ответ будет "нет" ))). Т.к. любая схема проектируется под задачу и чем схема оптимальнее для одних задачь, тем будет менее оптимальна для других. Что на мой взгляд аксиома (вещь ясная и не требующая доказательств).

А задачи бывают разные и все время появляются новые. Таким образом, при возникновении новой задачи, любая супер-пупер-оптимальная схема, тут же становится супер-пупер убогой. Просто по определению ))).

Схемы оптимально "заточенные" под удобный интерфейс (OLTP, а OLTP все таки на 90% это интерфейс и только на 10% какая-то относительно банальная бизнес логика), будут не удобны для отчетов. Схемы удобные для поиска и отчетов, будут неудобны для OLTP.

Т.ч. на мой взгляд, спор бесмысленный.

Если у кого-то схема более-менее оптимальна - честь и хвала
Если кому-то приходится работать с "убогой" - думаю в 70% случаев это осталось по наследству, в 20% вызвано какими-то достаточно значимыми фактами о которых мы не знаем и лишь в 5-10% случаев вызванно природной склонностью к мазохизму )))
Ares_ekbв высокой степени нормализации данных в хранилищах
????

Я всегда думал, что в хранилищах как раз обычно данные часто ДЕнормализируют. Банальная звезда (снежинка), когда все джоны сведены к минимому уровней вложенности.

В OLTP сильно денормализовать не получается, т.к. если пойдет противоречие данных (например разойдется сумма оплаты на счете с суммами на платежах) - придет меховой зверек.

s_ustinovпро хорошую схему данных применительно к этой задаче
Элементарно! Одно табличка, колонки которой точно совпадают с колонками в результирующем отчете.

А вот откуда там появятся данные в таком формате... "моя специализация — стратегический консалтинг" ( С )

...

Рейтинг:

0 / 0

03.06.2019, 14:34

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39821724

Ares_ekb

Участник

Откуда: Екатеринбург

Сообщения: 645

Рейтинг: 0 / 0

Leonid Kudryavtsev,

это всякие дурацкие витрины данных по Кимбаллу денормализуют. По Инмону, Data Vault'ам и т.п. всё должно быть нормализовано, причём, даже сильнее, чем OLTP.

...

Рейтинг:

0 / 0

03.06.2019, 14:56

| Ответить | Цитировать | Написать

Затраты на создание DWH

#39821798

Ivan Durak

Участник

Откуда: Minsk!!!

Сообщения: 2 602

Рейтинг: 0 / 0

Ares_ekbLeonid Kudryavtsev,

это всякие дурацкие витрины данных по Кимбаллу денормализуют. По Инмону, Data Vault'ам и т.п. всё должно быть нормализовано, причём, даже сильнее, чем OLTP.
дата волт предполагает поверх самих вольтов те же самые денормализованные витрины.

...

Рейтинг:

0 / 0

03.06.2019, 16:11

| Ответить | Цитировать | Написать

25 сообщений из 206, страница 6 из 9

все

Форумы / Разработка информационных систем [игнор отключен] [закрыт для гостей] / Затраты на создание DWH

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=33&msg=39821376&tid=1547152]:	0ms
get settings:	9ms
get forum list:	13ms
check forum access:	3ms
check topic access:	3ms
track hit:	58ms
get topic data:	11ms
get forum data:	3ms
get page messages:	58ms
get tp. blocked users:	1ms
others:	14ms

total:	173ms