Выбор СУБД / Проектирование БД

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Выбор СУБД

25 сообщений из 36, страница 1 из 2

все

Выбор СУБД

#39780846

trual

Гость

Всем привет!!!

Прошу помочь в выборе СУБД для реализации следующей задачи
1) Справочники: на входе в программу поступает изначально неизвестное количество справочников с неизвестным количеством реквизитов в виде XML файла. Единственный реквизит который будет у всех - это id. Структура XML как-раз и определяет структуру наших будущих справочников (Название справочника, Название реквизитов, и соответственно количество реквизитов)
Например <object class="nomenklatura">
<void property="guid"><string>90fb867c-1669-11e8-bf56-6c71d9a36bc0</string></void>
<void property="kod"><string>00-00000001</string></void>
<void property="naimenovanie"><string>шкаф-купе</string></void>
</object>
<object class="kontragenti">
<void property="guid"><string>0e016a1f-be1f-11e7-a20e-00155d33f636</string></void>
<void property="naimenovanie"><string>сковороднева анна викторовна</string></void>
<void property="inn"><string>778945656</string></void>
<void property="kpp"><string>566246778</string></void>
</object>

2) Аналитические данные: так же на входе в виде XML поступает набор <дата>, <сумма>, <id показателя>, <id элемента справочника 1>, <id элемента справочника 2>, <id элемента справочника 3>,... <id элемента справочника N>
где дата - время когда был произведена операция, сумма - численное значение (количество чего-то), id показателя - это элемент справочника показателей, <id элемента справочника а> - элемент какого-то справочника а (либо номенклатура, либо контрагент, либо еще какой-то). Показатель же в этом случае выступает в качестве идентификатора произведенной операции и набора справочников.
Пример справочника показателей:
id=1 , наименование=Выручка, Справочники=[kontragenti, nomenklaturi, podrazdelenie]
id=2 , наименование=Маржинальный доход , Справочники = [kontragenti, nomenklaturi , podrazdelenie , sklad ]
id=3 , наименование=Запасы готовой продукции , Справочники = [podrazdelenie, sklad, nomenklaturi]

В итоге в таблице аналитических данных должно сконцентрироваться описание произведенных операций в разрезе аналитических данных, количество которых у всех операций разное в зависимости от показателя.
Количество показателей может достигать 15 - 20, и соответственно учитывая количество номенклатур, контрагентов, складов, подразделений и т.д. количество строк аналитической информации может накапливаться 1 - 100 млн. в год.

3) Необходимо будет составлять отчеты в разрезе показателя, в разрезе одного или нескольких справочников и самое главное быстро.

Вопрос: какую СУБД посоветуете для реализации данной задачи и не менее важное условие - бесплатная СУБД.

...

Рейтинг:

0 / 0

01.03.2019, 11:31:17

| Ответить | Цитировать | Написать

Выбор СУБД

#39780978

L_argo

Участник

Сообщения: 1 497

Рейтинг: 0 / 0

MySQL или PostGre бери.

...

Рейтинг:

0 / 0

01.03.2019, 13:31:24

| Ответить | Цитировать | Написать

Выбор СУБД

#39780996

Dimitry Sibiryakov

Участник

Сообщения: 54 521

Рейтинг: 0 / 0

trualкакую СУБД посоветуете для реализации данной задачи

Ту, которую знает тот, кто будет эту задачу решать. Ибо СУБД как таковая тут сугубо
перпендикулярна и всё зависит от рук программиста.
Posted via ActualForum NNTP Server 1.5

...

Рейтинг:

0 / 0

01.03.2019, 13:49:02

| Ответить | Цитировать | Написать

Выбор СУБД

#39781045

mad_nazgul

Участник

Сообщения: 3 848

Рейтинг: 0 / 0

trual,

Не структурированные данные плохо ложатся на РМД.
Тут вам либо EAV делать, тогда ни о какой скорости говорить нельзя.
Либо таки углубятся в предметную область и строить РМД.

Можно попробовать взять PostgreSQL и работать с JSON-ами, но опять же ни о какой скорости нельзя говорить.

...

Рейтинг:

0 / 0

01.03.2019, 14:46:52

| Ответить | Цитировать | Написать

Выбор СУБД

#39781081

trual

Гость

mad_nazgul,
Как раз скорость очень важна. Но идея имеет место быть потому что по реквизитам не будет фильтрации. Фильтрация по id элементов справочников-аналитик и по id показателей.

...

Рейтинг:

0 / 0

01.03.2019, 15:48:05

| Ответить | Цитировать | Написать

Выбор СУБД

#39781085

trual

Гость

С колоночными СУБД никто не сталкивался? ClickHouse например

...

Рейтинг:

0 / 0

01.03.2019, 15:50:33

| Ответить | Цитировать | Написать

Выбор СУБД

#39781103

Dimitry Sibiryakov

Участник

Сообщения: 54 521

Рейтинг: 0 / 0

mad_nazgulТут вам либо EAV делать, тогда ни о какой скорости говорить нельзя.

Можно. Но, как я и сказал, нужны правильно заточенные под неё мозги разработчика.
Posted via ActualForum NNTP Server 1.5

...

Рейтинг:

0 / 0

01.03.2019, 16:12:20

| Ответить | Цитировать | Написать

Выбор СУБД

#39782335

Ivan Durak

Участник

Откуда: Minsk!!!

Сообщения: 2 602

Рейтинг: 0 / 0

...

Рейтинг:

0 / 0

05.03.2019, 09:00:15

| Ответить | Цитировать | Написать

Выбор СУБД

#39782336

Дмитрий Мух

Участник

Откуда: Зеленоград

Сообщения: 2 722

Рейтинг: 0 / 0

trualmad_nazgul,
Как раз скорость очень важна. Но идея имеет место быть потому что по реквизитам не будет фильтрации. Фильтрация по id элементов справочников-аналитик и по id показателей.
MongoDB

умеет хранить неизвестное количество реквизитов и очень быстро доставть по id
также поддерживает различные индексы, представления, агрегацию, свой язык запросов, которые также быстрые, если используются индексы, а не полное сканирование
в 4-й версии появились транзакции

...

Рейтинг:

0 / 0

05.03.2019, 09:06:32

| Ответить | Цитировать | Написать

Выбор СУБД

#39782337

Дмитрий Мух

Участник

Откуда: Зеленоград

Сообщения: 2 722

Рейтинг: 0 / 0

Также из коробки Replica Set для надёжности и Sharding для масштабирования

...

Рейтинг:

0 / 0

05.03.2019, 09:08:32

| Ответить | Цитировать | Написать

Выбор СУБД

#39785291

Glebanski

Участник

Откуда: Msk ->NL

Сообщения: 238

Рейтинг: 0 / 0

На хабре деятель все-таки скрестил ежа с ужом в MySQL
https://habr.com/ru/company/oleg-bunin/blog/443422/
До того, как появился MySQL 5.7, люди тоже хранили JSON, но как поле text. Поле JSON в MySQL позволяет хранить сам JSON наиболее эффективно. Кроме того, на основе JSON можно создать виртуальные колонки и на их основе индексы.

Его там поругивают, но не очень активно. Ибо прогеры в основном за JSON в любой бочке

...

Рейтинг:

0 / 0

13.03.2019, 12:20:54

| Ответить | Цитировать | Написать

Выбор СУБД

#39785368

Озверин

Участник

Откуда: Ростов-на-Дону

Сообщения: 3 646

Рейтинг: 0 / 0

недавно у яндекса смотрел видео, как они собирают метрики,хранят их и выводят аналитику. Поищите -там ваш случай. Причем там как было и как стало. Возможно вам как было будет интереснее.

...

Рейтинг:

0 / 0

13.03.2019, 13:36:48

| Ответить | Цитировать | Написать

Выбор СУБД

#39785603

Дмитрий Мух

Участник

Откуда: Зеленоград

Сообщения: 2 722

Рейтинг: 0 / 0

Озверин,

искать-то как? По "Озверин недавно у яндекса смотрел видео"? :)

...

Рейтинг:

0 / 0

13.03.2019, 21:04:01

| Ответить | Цитировать | Написать

Выбор СУБД

#39785609

miksoft

Участник

Сообщения: 36 746

Рейтинг: 0 / 0

Дмитрий Мух,

ClickHouse это

...

Рейтинг:

0 / 0

13.03.2019, 21:44:02

| Ответить | Цитировать | Написать

Выбор СУБД

#39785688

Озверин

Участник

Откуда: Ростов-на-Дону

Сообщения: 3 646

Рейтинг: 0 / 0

Дмитрий МухОзверин,

искать-то как? По "Озверин недавно у яндекса смотрел видео"? :)

https://google.gik-team.com/?q=яндекс доклад метрики высокая нагрузка

...

Рейтинг:

0 / 0

14.03.2019, 09:41:04

| Ответить | Цитировать | Написать

Выбор СУБД

#39785711

skyANA

Участник

Откуда: Зеленоград

Сообщения: 22 795

Рейтинг: 0 / 0

ОзверинДмитрий МухОзверин,

искать-то как? По "Озверин недавно у яндекса смотрел видео"? :)

https://google.gik-team.com/?q=яндекс доклад метрики высокая нагрузка
Не могли бы вы теперь дать прямую ссылку на видео, о котором писали выше?

...

Рейтинг:

0 / 0

14.03.2019, 10:11:00

| Ответить | Цитировать | Написать

Выбор СУБД

#39785747

Озверин

Участник

Откуда: Ростов-на-Дону

Сообщения: 3 646

Рейтинг: 0 / 0

skyANAОзверинпропущено...

https://google.gik-team.com/?q=яндекс доклад метрики высокая нагрузка
Не могли бы вы теперь дать прямую ссылку на видео, о котором писали выше?

нет, конечно.

...

Рейтинг:

0 / 0

14.03.2019, 10:38:13

| Ответить | Цитировать | Написать

Выбор СУБД

#39786109

s_ustinov

Участник

Откуда: Munchen, DE

Сообщения: 1 922

Рейтинг: 1 / 0

trualВсем привет!!!

Прошу помочь в выборе СУБД для реализации следующей задачи
1) Справочники:
...
2) Аналитические данные:
...
Пример справочника показателей:
id=1 , наименование=Выручка, Справочники=[kontragenti, nomenklaturi, podrazdelenie]
id=2 , наименование=Маржинальный доход , Справочники = [kontragenti, nomenklaturi , podrazdelenie , sklad ]
id=3 , наименование=Запасы готовой продукции , Справочники = [podrazdelenie, sklad, nomenklaturi]

В итоге в таблице аналитических данных должно сконцентрироваться описание произведенных операций в разрезе аналитических данных, количество которых у всех операций разное в зависимости от показателя.
Количество показателей может достигать 15 - 20, и соответственно учитывая количество номенклатур, контрагентов, складов, подразделений и т.д. количество строк аналитической информации может накапливаться 1 - 100 млн. в год.

3) Необходимо будет составлять отчеты в разрезе показателя, в разрезе одного или нескольких справочников и самое главное быстро.

Вопрос: какую СУБД посоветуете для реализации данной задачи и не менее важное условие - бесплатная СУБД.
Вообще описание задачи (а в особенности примеры))) очень похоже на OLAP.
Измерения, факты...
Вы, кстати, вероятно забыли упомянуть, что ваши справочники имеют иерархию, и надо будет строить отчеты по разным уровням иерархии. Та же номенклатура.

Посмотрите на Pentaho. Может, то что надо.

...

Рейтинг:

0 / 0

14.03.2019, 15:52:28

| Ответить | Цитировать | Написать

Выбор СУБД

#39786290

Serguei

Участник

Откуда: Papua New Guinea

Сообщения: 682

Рейтинг: 0 / 0

s_ustinovtrualВсем привет!!!

Прошу помочь в выборе СУБД для реализации следующей задачи
1) Справочники:
...
2) Аналитические данные:
...
Пример справочника показателей:
id=1 , наименование=Выручка, Справочники=[kontragenti, nomenklaturi, podrazdelenie]
id=2 , наименование=Маржинальный доход , Справочники = [kontragenti, nomenklaturi , podrazdelenie , sklad ]
id=3 , наименование=Запасы готовой продукции , Справочники = [podrazdelenie, sklad, nomenklaturi]

В итоге в таблице аналитических данных должно сконцентрироваться описание произведенных операций в разрезе аналитических данных, количество которых у всех операций разное в зависимости от показателя.
Количество показателей может достигать 15 - 20, и соответственно учитывая количество номенклатур, контрагентов, складов, подразделений и т.д. количество строк аналитической информации может накапливаться 1 - 100 млн. в год.

3) Необходимо будет составлять отчеты в разрезе показателя, в разрезе одного или нескольких справочников и самое главное быстро.

Вопрос: какую СУБД посоветуете для реализации данной задачи и не менее важное условие - бесплатная СУБД.
Вообще описание задачи (а в особенности примеры))) очень похоже на OLAP.
Измерения, факты...
Вы, кстати, вероятно забыли упомянуть, что ваши справочники имеют иерархию, и надо будет строить отчеты по разным уровням иерархии. Та же номенклатура.

Посмотрите на Pentaho. Может, то что надо.

Pentaho и иже с ними работает по готовым таблицам- а тут эти таблицы "сваливаются на голову" и нужно как то динамически под них таблицы создавать по структуру пришедшую в xml. Если поток данных большой- EAV не вариант, чего бы не говорили его апологеты.
Вообще вопрос имеет мало отношение к выбору СУБД,поскольку обработка приходящего потока данных будет за пределами СУБД. Ну а СУБД нужно использовать ту, которую хорошо знаете. 100 млн. в год. это ни о чем объем.

...

Рейтинг:

0 / 0

14.03.2019, 23:35:05

| Ответить | Цитировать | Написать

Выбор СУБД

#39786302

s_ustinov

Участник

Откуда: Munchen, DE

Сообщения: 1 922

Рейтинг: 1 / 0

Sergueis_ustinovпропущено...

Вообще описание задачи (а в особенности примеры))) очень похоже на OLAP.
Измерения, факты...
Вы, кстати, вероятно забыли упомянуть, что ваши справочники имеют иерархию, и надо будет строить отчеты по разным уровням иерархии. Та же номенклатура.

Посмотрите на Pentaho. Может, то что надо.

Pentaho и иже с ними работает по готовым таблицам- а тут эти таблицы "сваливаются на голову" и нужно как то динамически под них таблицы создавать по структуру пришедшую в xml. Если поток данных большой- EAV не вариант, чего бы не говорили его апологеты.
Вообще вопрос имеет мало отношение к выбору СУБД,поскольку обработка приходящего потока данных будет за пределами СУБД. Ну а СУБД нужно использовать ту, которую хорошо знаете. 100 млн. в год. это ни о чем объем.
Данные о продажах никогда не "самозарождаются" в виде xml файлов.

То, что ТС написал - это описание OLAP. И изобретать велосипед - не лучшее решение. Самый правильный вариант - перейти в соседний раздел форума и почитать там, что и как делать.

Впрочем, если надо решать задачу "копать от забора до обеда" - можно выбрать хоть "Стебелек".

...

Рейтинг:

0 / 0

15.03.2019, 00:19:07

| Ответить | Цитировать | Написать

Выбор СУБД

#39786394

H5N1

Участник

Откуда: Yo.! из "Сравнения субд"

Сообщения: 685

Рейтинг: 0 / 0

s_ustinovДанные о продажах никогда не "самозарождаются" в виде xml файлов.

То, что ТС написал - это описание OLAP. И изобретать велосипед - не лучшее решение. Самый правильный вариант - перейти в соседний раздел форума и почитать там, что и как делать.

Впрочем, если надо решать задачу "копать от забора до обеда" - можно выбрать хоть "Стебелек".
олап уже какое-то время отмирает, у майкрософта часть что класический олап лет 5 уже не развивается.
имхо проблема у задачки не куда писать, объемы крошечные, а то что по большому счету хранилище строить надо бы. данные явно валидировать и чистить, не понятно что делать если факт пришел а справочника к нему не пришел. как выглядит исправленный факт, что с этим делать ? история то наверно тоже ?
я бы apache spark вычитывал xml и импортировал валидированные данные в файлики колончатой структуры типа parquet или orc. структуры типа снежинка или звезда вроде уже не модно, наверно клал бы в какой-нить вариант Slowly Changing Dimension (SCD). и уже обработанные данные писал бы в рсубд для отчетной системы.

...

Рейтинг:

0 / 0

15.03.2019, 08:49:56

| Ответить | Цитировать | Написать

Выбор СУБД

#39786674

s_ustinov

Участник

Откуда: Munchen, DE

Сообщения: 1 922

Рейтинг: 1 / 0

H5N1s_ustinovДанные о продажах никогда не "самозарождаются" в виде xml файлов.

То, что ТС написал - это описание OLAP. И изобретать велосипед - не лучшее решение. Самый правильный вариант - перейти в соседний раздел форума и почитать там, что и как делать.

Впрочем, если надо решать задачу "копать от забора до обеда" - можно выбрать хоть "Стебелек".
олап уже какое-то время отмирает, у майкрософта часть что класический олап лет 5 уже не развивается.
имхо проблема у задачки не куда писать, объемы крошечные, а то что по большому счету хранилище строить надо бы. данные явно валидировать и чистить, не понятно что делать если факт пришел а справочника к нему не пришел. как выглядит исправленный факт, что с этим делать ? история то наверно тоже ?
я бы apache spark вычитывал xml и импортировал валидированные данные в файлики колончатой структуры типа parquet или orc. структуры типа снежинка или звезда вроде уже не модно , наверно клал бы в какой-нить вариант Slowly Changing Dimension (SCD). и уже обработанные данные писал бы в рсубд для отчетной системы.
Модно - не модно... :)
Если нужен результат - почему бы не воспользоваться чем то пусть не модным, но тем не менее работающим? И очень-очень похожим на то ТЗ, которое ТС описал?
В первом сообщении топика ведь как раз описание классической структуры "звезда". Если им надо именно такое - почему бы и не дать именно такое? Пытаться всегда использовать самое "модное" - не лучшая идея.

...

Рейтинг:

0 / 0

15.03.2019, 13:34:27

| Ответить | Цитировать | Написать

Выбор СУБД

#39786805

H5N1

Участник

Откуда: Yo.! из "Сравнения субд"

Сообщения: 685

Рейтинг: 0 / 0

s_ustinovМодно - не модно... :)
Если нужен результат - почему бы не воспользоваться чем то пусть не модным, но тем не менее работающим? И очень-очень похожим на то ТЗ, которое ТС описал?

хотя бы потому что олап это не бесплатно и уже собственно самими производителям не интересен как технология. зачем тратить на это время, даже если оно какое-то время еще будет работать?

s_ustinovВ первом сообщении топика ведь как раз описание классической структуры "звезда". Если им надо именно такое - почему бы и не дать именно такое? Пытаться всегда использовать самое "модное" - не лучшая идея.
потому что звезду не сунешь потом бизнес пользователю типа у нас тут self bi, давайте дальше сами. а вот витрины напоминающие таблички какие он у себя в системе видит много больше шансов подсунуть под соусом self bi и не погружаться в адъ репортиков

...

Рейтинг:

0 / 0

15.03.2019, 15:33:15

| Ответить | Цитировать | Написать

Выбор СУБД

#39786988

s_ustinov

Участник

Откуда: Munchen, DE

Сообщения: 1 922

Рейтинг: 1 / 0

H5N1s_ustinovМодно - не модно... :)
Если нужен результат - почему бы не воспользоваться чем то пусть не модным, но тем не менее работающим? И очень-очень похожим на то ТЗ, которое ТС описал?

хотя бы потому что олап это не бесплатно и уже собственно самими производителям не интересен как технология. зачем тратить на это время, даже если оно какое-то время еще будет работать?
Pentaho - бесплатная версия есть.
H5N1s_ustinovВ первом сообщении топика ведь как раз описание классической структуры "звезда". Если им надо именно такое - почему бы и не дать именно такое? Пытаться всегда использовать самое "модное" - не лучшая идея.
потому что звезду не сунешь потом бизнес пользователю типа у нас тут self bi, давайте дальше сами. а вот витрины напоминающие таблички какие он у себя в системе видит много больше шансов подсунуть под соусом self bi и не погружаться в адъ репортиков
Оооо...
А можно вот с этого места поподробнее?
Как звезду сунуть пользователям для самостоятельного ковыряния я представляю очень хорошо. Если одна группа мер + измерения в SSAS - подключаем через ексель и говорим пользователям - а это такой pivot table - и они работают и никого не трогают.

А вот как H5N1подсунуть под соусом self bi вот это: H5N1обработанные данные писал бы в рсубд для отчетной системы?

...

Рейтинг:

0 / 0

15.03.2019, 19:21:33

| Ответить | Цитировать | Написать

Выбор СУБД

#39787917

H5N1

Участник

Откуда: Yo.! из "Сравнения субд"

Сообщения: 685

Рейтинг: 0 / 0

s_ustinovPentaho - бесплатная версия есть.

третий эшелон увядающей технологии. я бы не стал тратить время.

s_ustinovОооо...
А можно вот с этого места поподробнее?
Как звезду сунуть пользователям для самостоятельного ковыряния я представляю очень хорошо. Если одна группа мер + измерения в SSAS - подключаем через ексель и говорим пользователям - а это такой pivot table - и они работают и никого не трогают.

ну вот тебе прилетают xml. выглядело что счета и платежи это факты. а потом выясняется что пользователю нужны платежи в разрезе, т.е. счет это измерение для платежа. и начинается ... т.е. с фактами и дименсиями нужно хорошо понимать бизнес и если что-то не продумал - попа.

s_ustinovА вот как H5N1подсунуть под соусом self bi вот это: H5N1обработанные данные писал бы в рсубд для отчетной системы?

в oracle bi и sap bo дефайнются связи между таблицами, пользователь просто накидывает колонки из таблиц в тот же пивот. зачастую не особо понимая как там таблички между собой связанны. подозреваю нечто подобное в любом bi инструменте.
имхо пирожки, графики kpi светофоры гораздо наглядней унылых экселевских таблиц, которые я зачастую прочесть не могу, т.к. без понятия о бизнесе и о чем эти цифры сигнализируют попросту не знаю.

...

Рейтинг:

0 / 0

18.03.2019, 16:42:47

| Ответить | Цитировать | Написать

25 сообщений из 36, страница 1 из 2

все

Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Выбор СУБД

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=32&msg=39786394&tid=1539951]:	0ms
get settings:	9ms
get forum list:	10ms
check forum access:	2ms
check topic access:	2ms
track hit:	151ms
get topic data:	8ms
get forum data:	2ms
get page messages:	47ms
get tp. blocked users:	1ms
others:	220ms

total:	452ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы