БД для объектов с разным количеством параметров / Проектирование БД

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / БД для объектов с разным количеством параметров

16 сообщений из 66, страница 3 из 3

все

БД для объектов с разным количеством параметров

#38547968

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

Vladimir A.K.SERG1257ЕЕ
Как расшифролвывается ЕЕ?

Никак. Это название песни. (10-ая) .

...

Рейтинг:

0 / 0

04.02.2014, 02:34:28

| Ответить | Цитировать | Написать

БД для объектов с разным количеством параметров

#38548576

Vladimir A.K.

Гость

SERG1257Опять же танцуйте от печки. Определитесь с запросами и подгоняйте структуру под удобство/скорость запросов.

Это понятно. Будем копать :)
SERG1257Если у вас популярный запрос - выведите мне состояние объекта ХХХ на время ЧЧ.ММ.СС, то собирание состояния объекта по параметрам может занимать слишком много времени. Дешевле собрать ее один раз во время загрузки.

Скорее будут вариации селекта: выбрать поля A, B, X, XY ... ZZZ в интервале времени при такх-то значенияз входов D, E ...
или просто в заданном интервале времени.
SERG1257Здесь 15489997 я приводил список моих претензий к EAV структуре.

И все-таки, правильно ли я понимаю, что EAV, это растащить мою задачу на таблицу, где каждая запись:
id_записи, время_измерения, id_параметра, измеренное_значение?
SERG1257По поводу загрузки. Как мне кажется загрузка должна быть в два этапа.
Делай раз - закидываем очередной файл в стейджинговую (временную) таблицу БД.
Делай два - одним (страшным) запросом рассовываем данные в постоянные таблицы. Тут важно обойтись без цикла, так будет быстрее и дешевле.

?
У меня на входе файл с несколькими тысячами записей (в каждой более сотни измеренных параметров на одно и то же время) с одного тепловоза (одна конфигурация). Потом другой файл. Может с этого, а может с другого тепловоза.
SERG1257Далее - дата-время съема параметра для вашей структуры будет ключевым полем (первым полем первичного ключа). По этому полю надо будет обязательно кластеризовать (в Оракле это IOT) чтобы упростить очистку устаревших данных.
Одна "строка" (запись) во входящем файле содержит более сотни измеренных параметров. Время измерения для них одинаково.

SERG1257, читая ветку, нашел тут тему со схожей задачей (пусть она и проще), в которой Вы принимали активное участие: http://www.sql.ru/forum/789033/hranenie-parametrov-priborov?hl=???????
Мне показалось, что мое решение может быть походим: отдельный прибор (у меня АСУ) - отдельная таблица.

...

Рейтинг:

0 / 0

04.02.2014, 14:02:57

| Ответить | Цитировать | Написать

БД для объектов с разным количеством параметров

#38548606

Vladimir A.K.

Гость

йцукеЕсли какие-либо данные в первой или во второй базе могут правиться руками, то со временем базы начнут "ехать". Например, один тепловоз обозвали по-разному в разных базах и т.д..

Это будет грубой ошибкой.
Наименование серий, нумерация экземпляров - вещь нормируемая.
В принципе задумка: при создании в приложении-менеджере формируется конфигурация АСУ: все входы выходы, с требуемыми характеристиками (коэффициенты, масштабирования, нумерация байт в записи из входного файла, типы и т.п.). По окончании в обоих базах делаются Create table по правилам каждой СУБД. В случае необходимости изменения конфигурации АСУ: считали из БД в мэнеджер, изменили, проверили корректность: alter table. Ну и, по необходимости вьюверы и т.п.
Пользователю сия возможность будет недоступна. только админу.
йцукеЕсли потребуется сравнивать параметры разных конфигураций, может быть неудобно.
Спасибо. Подумаю над этим.
Хотя, с первого взгляда, скорее может потребоваться сравнение агрегатированных итогов обработки разных объектов, чем одномоментно измеренных параметров.

...

Рейтинг:

0 / 0

04.02.2014, 14:11:46

| Ответить | Цитировать | Написать

БД для объектов с разным количеством параметров

#38548611

Vladimir A.K.

Гость

MasterZivНикак. Это название песни. (10-ая) .
5 Баллов!
Хорошая команда.
Купила мама коника ... :)

...

Рейтинг:

0 / 0

04.02.2014, 14:13:27

| Ответить | Цитировать | Написать

БД для объектов с разным количеством параметров

#38548975

йцуке

Участник

Сообщения: 228

Рейтинг: 0 / 0

Vladimir A.K.,

1) Забудьте о EAV. Это не ваш случай.
2) Делить данные на несколько баз нужно лишь в случае четкого понимания необходимости этого. Например, в одной идет активная текущая работа (добавление/изменение) в другой интенсивный анализ, и делать это в одной базе одновременно не хватает производительности.
3) По загрузке, у каждого производителя есть утилиты/команды для массового импорта данных. Например, в MS SQL это bcp и bulk insert. Готовите данные, и ночью, пакетом, грузите.

...

Рейтинг:

0 / 0

04.02.2014, 16:41:59

| Ответить | Цитировать | Написать

БД для объектов с разным количеством параметров

#38549134

SERG1257

Участник

Сообщения: 2 932

Рейтинг: 0 / 0

авторСкорее будут вариации селекта: выбрать поля A, B, X, XY ... ZZZ в интервале времени при такх-то значенияз входов D, E ...
или просто в заданном интервале времени.Если при этом поля A, B, X, XY ... ZZZ и D, E будут в одной таблице то это выполнится быстрее чем если в нескольких.
Vladimir A.K.И все-таки, правильно ли я понимаю, что EAV, это растащить мою задачу на таблицу, где каждая запись:
id_записи, время_измерения, id_параметра, измеренное_значение?Да. Пожалуй я бы добавил id_объекта до кучи. Такая структура позволяет легко добавлять новые параметры, другими словами, добавление нового параметра не приводит к DDL операциям. Это ее основное достоинство, ну и входной файл имеет похожую структуру - импорт будет легко делать. Недостатки я описал.
Vladimir A.K.Мне показалось, что мое решение может быть походим: отдельный прибор (у меня АСУ) - отдельная таблица. Это уже лучше предыдущего подхода с одной таблицей на всех. Каждой такой таблице добавьте первичный ключ вида время_измерения + id_объекта и получите базу с вертикальным секционированием .

С другой стороны я не верю, что все параметры равнозначны. Например на приборной панели автомобиля водитель гораздо чаще смотрит на спидометр, чем на уровень бензина или километры пробега. Поработайте с пользователями чтобы объединить наиболее часто встречающиеся комбинации в общую таблицу типа время_измерения, id_объекта, параметр, параметр .... (см A, B, X, XY ... ZZZ и D, E выше). Остальное (менее популярное) можно сделать отдельными таблицами.
Vladimir A.K.У меня на входе файл с несколькими тысячами записей (в каждой более сотни измеренных параметров на одно и то же время) с одного тепловоза (одна конфигурация). Потом другой файл. Может с этого, а может с другого тепловоза.Именно. Я предостерегал от соблазна устроить цикл по записям.
Предположим что входной файл имеет структуру типа время_измерения, id_объекта, параметр, тогда для заполнения таблицы с несколькими параметрами параметр1 и параметр2 запрос будет типа

Код: sql

select event_datetime, id_object, max(param1),max(param2) from temp_table group by event_datetime, id_object

и уже этот запрос вы сливаете ( merge ) с вашей базой.

Vladimir A.K.В принципе задумка: при создании в приложении-менеджере формируется конфигурация АСУ: все входы выходы, с требуемыми характеристиками (коэффициенты, масштабирования, нумерация байт в записи из входного файла, типы и т.п.). По окончании в обоих базах делаются Create table по правилам каждой СУБД. В случае необходимости изменения конфигурации АСУ: считали из БД в мэнеджер, изменили, проверили корректность: alter table.Плохая идея. Нет, независимость от субд это, конечно, большой плюс для приложения, ошибкой является думать что достаточно правильно сделать Create table. У вас, по любому, будет отдельное приложение для каждой поддерживаемой СУБД. В общем, задача сложнее, чем кажется, советую сейчас с этим не заморачиватся.

...

Рейтинг:

0 / 0

04.02.2014, 17:59:40

| Ответить | Цитировать | Написать

БД для объектов с разным количеством параметров

#38549696

Vladimir A.K.

Гость

йцукеVladimir A.K.,

1) Забудьте о EAV. Это не ваш случай.

Да, спасибо. С помощью подсказок, в т.ч. и Ваших я уже понял, что это такое, и что это меня не устраивает :)
йцуке2) Делить данные на несколько баз нужно лишь в случае четкого понимания необходимости этого. Например, в одной идет активная текущая работа (добавление/изменение) в другой интенсивный анализ, и делать это в одной базе одновременно не хватает производительности.

Понимание есть. Даже если это будут разные таблицы, то смысловая нагрузка у них разная.
Более конкретно:
1-я база. Назовем БД Эксплуатации. Та, в которой данных меньше и которые будут храниться постоянно (или очень долго).
Нужна для оценки оценки производственных показателей (типа тонно-километры, расход топлива и т.п) за разные отрезки времени. Или какие-то сходные статистические задачи.
В настоящий момент не используется. Требует доступности из внешнего мира: т.е. веб-сервер + БД.
Помните я рассказывал, что сервер купили черти когда, но его еще в глаза не видели? :)

2-я база. БД диагностики. Та в который данные за сравнительно небольшой отрезок времени, но в полном объеме.
Прогонка через алгоритмы, с выдачей неких итогов. Итоги, вполне возможно, будут накапливаться в специальных таблицах.
Причем существует большая вероятность, что при появлении нового алгоритма или модификации старого, когда-то уже обработанные данные будут опять импортироваться в БД и прогоняться по новой.
Тут БД интересно наверное скорее не как хранилище, а как некий универсальный механизм выборки данных по заданным критериям и выдачи их на вход алгоритма.
йцуке3) По загрузке, у каждого производителя есть утилиты/команды для массового импорта данных. Например, в MS SQL это bcp и bulk insert. Готовите данные, и ночью, пакетом, грузите.
Спасибо за ценную информацию.
Зарубку сделал :)

...

Рейтинг:

0 / 0

05.02.2014, 09:30:50

| Ответить | Цитировать | Написать

БД для объектов с разным количеством параметров

#38549724

Vladimir A.K.

Гость

SERG1257Если при этом поля A, B, X, XY ... ZZZ и D, E будут в одной таблице то это выполнится быстрее чем если в нескольких.

Забыл уточнить. С вероятностью близкой к единице могу предполагать, что конкретный запрос будет выбирать информацию из одной таблицы. Т.е. наиболее вероятна выборка для одного объекта (тепловоза) или максимум: для однотипных объектов.
SERG1257Да. Пожалуй я бы добавил id_объекта до кучи.

Да точно. Ступил :)
SERG1257Такая структура позволяет легко добавлять новые параметры, другими словами, добавление нового параметра не приводит к DDL операциям. Это ее основное достоинство, ну и входной файл имеет похожую структуру - импорт будет легко делать. Недостатки я описал.

Читал. Понял, что не мое.
SERG1257Это уже лучше предыдущего подхода с одной таблицей на всех. Каждой такой таблице добавьте первичный ключ вида время_измерения + id_объекта и получите базу с вертикальным секционированием .

Да, конечно, время измерения + id_объекта обязательно будут присутствовать.
Инфу по ссылке изучу.
SERG1257С другой стороны я не верю, что все параметры равнозначны. Например на приборной панели автомобиля водитель гораздо чаще смотрит на спидометр, чем на уровень бензина или километры пробега. Поработайте с пользователями чтобы объединить наиболее часто встречающиеся комбинации в общую таблицу типа время_измерения, id_объекта, параметр, параметр .... (см A, B, X, XY ... ZZZ и D, E выше). Остальное (менее популярное) можно сделать отдельными таблицами.

Я наверное опять не все корректно рассказал.
Входной файл представляет из себя ту же самую таблицу (2-мерную матрицу) со строками вида:
время_измерения, параметр_1, параметр_2, параметр_3 ... параметр_N.

Только вот количество N и типы параметров у разных объектов (АСУ тепловозов) - разные.
SERG1257Плохая идея. Нет, независимость от субд это, конечно, большой плюс для приложения, ошибкой является думать что достаточно правильно сделать Create table. У вас, по любому, будет отдельное приложение для каждой поддерживаемой СУБД. В общем, задача сложнее, чем кажется, советую сейчас с этим не заморачиватся.
Хорошо. Забыли идею.
Одно или два приложения будет, для меня уж точно не является принципиальным вопросом :)

...

Рейтинг:

0 / 0

05.02.2014, 09:56:29

| Ответить | Цитировать | Написать

БД для объектов с разным количеством параметров

#38550159

йцуке

Участник

Сообщения: 228

Рейтинг: 0 / 0

Vladimir A.K.Понимание есть. Даже если это будут разные таблицы, то смысловая нагрузка у них разная.
Более конкретно:
1-я база. Назовем БД Эксплуатации. Та, в которой данных меньше и которые будут храниться постоянно (или очень долго).
Нужна для оценки оценки производственных показателей (типа тонно-километры, расход топлива и т.п) за разные отрезки времени. Или какие-то сходные статистические задачи.

2-я база. БД диагностики. Та в который данные за сравнительно небольшой отрезок времени, но в полном объеме.
Прогонка через алгоритмы, с выдачей неких итогов. Итоги, вполне возможно, будут накапливаться в специальных таблицах.
Причем существует большая вероятность, что при появлении нового алгоритма или модификации старого, когда-то уже обработанные данные будут опять импортироваться в БД и прогоняться по новой.
Тут БД интересно наверное скорее не как хранилище, а как некий универсальный механизм выборки данных по заданным критериям и выдачи их на вход алгоритма.

И, все-таки, делайте вначале одну базу. Разделить её на несколько, при необходимости, более чем просто. А вот объединись несколько баз в одну может быть весьма наоборот.
Упорно рекомендую попробовать промышленные базы. В них решен вопрос очень компактного хранения необходимых вам параметров (то, что у вас входит во 2-ю базу). Вполне вероятна ситуация, когда на одном и том же железе пром. база будет держать все данные лет за 5-10, а в самодельном решении затыкаться на данных за год.

...

Рейтинг:

0 / 0

05.02.2014, 13:29:56

| Ответить | Цитировать | Написать

БД для объектов с разным количеством параметров

#38558076

Vladimir A.K.

Гость

Уважаемые консультанты.
Есть идея по хранению описанных выше данных в БД. Возможно бредовая. Возможно не реализуемая.
Возникла так.
Есть новый АСУ. Пока в разработке-отладке. Данные с АСУ по мобильным сетям сразу скидываются в БД. У провайдера хостинга арендуется виртуальный сервер с PostgreSQL.

На данном этапе прорабатываю вариант импорта данных с этого сервера и заливки в нашу БД. В дальнейшем конечно же будет организована передача данных непосредственно на наш сервер, минуя посредников.
Запись (та самая, с кучей аналоговых и дискретных параметров) хранится в таблице в виде поля формата bytea: байтовый массив.
Первоначальная мысль: брать этот массив и запихивать в таблицу с кучей полей.
Но, может быть возможен такой вариант: хранить байтовый массив. Но написать вювер(ы) или хранимую процедуру(ы), которые будут брать этот массив и преобразовывать его в "таблицу", уже содержащую те самые поля с аналоговыми и дискретными полями.
Тогда фактически запросы будут нормальные, с именами полей вьювера, но хранение данных - оптимальное.

Насколько бредовая идея?
Я пока не представляю, насколько такое преобразование ресурсо-затратно. Видится, что работа с дисковой подсистемой будет гораздо проще: меньше полей читать, да и байт, соответственно, тоже меньше.
Так же не представляю, возможно ли вообще осуществление таких преобразований (разбор массива на байты и операции с ними) средствами SQL, т.к. с таким типом данных пока не работал вообще.

Потому и решил воспользоваться вашими знаниями для оценки "уровня бредовости" затеи :)

...

Рейтинг:

0 / 0

12.02.2014, 09:48:54

| Ответить | Цитировать | Написать

БД для объектов с разным количеством параметров

#38558121

WebSharper

Участник

Сообщения: 304

Рейтинг: 0 / 0

Vladimir A.K.Уважаемые консультанты.
Есть идея по хранению описанных выше данных в БД. Возможно бредовая.

Если СУБД не будет знать о полях, как она сможет построить по ним индексы? По крайней мере, те поля, по которым надо искать нужно вводить явно, я считаю.

...

Рейтинг:

0 / 0

12.02.2014, 10:25:55

| Ответить | Цитировать | Написать

БД для объектов с разным количеством параметров

#38558265

Vladimir A.K.

Гость

WebSharperVladimir A.K.Уважаемые консультанты.
Есть идея по хранению описанных выше данных в БД. Возможно бредовая.

Если СУБД не будет знать о полях, как она сможет построить по ним индексы? По крайней мере, те поля, по которым надо искать нужно вводить явно, я считаю.
Логично. Слона-то я и не заметил :(
Спасибо!

...

Рейтинг:

0 / 0

12.02.2014, 12:07:48

| Ответить | Цитировать | Написать

БД для объектов с разным количеством параметров

#38562503

Бредятина

Участник

Откуда: Москва

Сообщения: 4 039

Рейтинг: 0 / 0

Vladimir A.K.Логично. Слона-то я и не заметил :(
Спасибо!
О слонах Вы, пока, мало что знаете))
http://www.spaceops2012.org/proceedings/documents/id1275512-Paper-003.pdf
Возьмите MUMPS и сделайте все, что требуется. Никаких других технологий БД, пока, не изобрели))

...

Рейтинг:

0 / 0

16.02.2014, 22:29:12

| Ответить | Цитировать | Написать

БД для объектов с разным количеством параметров

#38578278

Alexey Tomin

Участник

Откуда: Самара

Сообщения: 1 715

Рейтинг: 0 / 0

Vladimir A.K.Запись (та самая, с кучей аналоговых и дискретных параметров) хранится в таблице в виде поля формата bytea: байтовый массив.

Я не тормоз, я только прочитал. Мысли вслух...

Под первую задачу- временное хранение неструктурированных- SQL вообще не очень подходит.

Можно взять какую-нибудь NoSQL, например MongoDB. В неё поток льёт абстрактные данные (JSON). Атомарность операций есть, а большего и не надо. БД бесплатная, можно создавать кластер. API кривоват, но что делать.

Второй уровень- показания читаются, парсятся и раскладываются в SQL (Oracle) по отдельным таблицам, можно делать выборки и т.п.
Можно грузить кучами.

Недавно за сутки с небольшим в Монгу 200млн записей запихали (кроме других операций в ней). Не тормозило ничего.

...

Рейтинг:

0 / 0

04.03.2014, 20:56:33

| Ответить | Цитировать | Написать

БД для объектов с разным количеством параметров

#38578282

Dimitry Sibiryakov

Участник

Сообщения: 54 521

Рейтинг: 0 / 0

Alexey TominНедавно за сутки с небольшим в Монгу 200млн записей запихали (кроме
других операций в ней). Не тормозило ничего.
Вставка 2 тысяч записей в секунду нынче в натуре считается HiLoad или вы это делали на
обычном писюке?..
Posted via ActualForum NNTP Server 1.5

...

Рейтинг:

0 / 0

04.03.2014, 21:06:25

| Ответить | Цитировать | Написать

БД для объектов с разным количеством параметров

#38578476

Alexey Tomin

Участник

Откуда: Самара

Сообщения: 1 715

Рейтинг: 0 / 0

Dimitry SibiryakovAlexey TominНедавно за сутки с небольшим в Монгу 200млн записей запихали (кроме
других операций в ней). Не тормозило ничего.
Вставка 2 тысяч записей в секунду нынче в натуре считается HiLoad или вы это делали на
обычном писюке?..

Это фоновая задача, при этом много больше того, что у автора.
И да, обычная персоналка.

...

Рейтинг:

0 / 0

05.03.2014, 09:17:00

| Ответить | Цитировать | Написать

16 сообщений из 66, страница 3 из 3

все

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=32&msg=38547968&tid=1540962]:	0ms
get settings:	7ms
get forum list:	15ms
check forum access:	3ms
check topic access:	3ms
track hit:	65ms
get topic data:	11ms
get forum data:	3ms
get page messages:	69ms
get tp. blocked users:	1ms
others:	190ms

total:	367ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы