powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / MySQL [игнор отключен] [закрыт для гостей] / Большой объем данныех
25 сообщений из 50, страница 1 из 2
Большой объем данныех
    #38332224
ldar
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Имеется быстрорастущая таблица
500 строк в секунду
таблица innodb состоит из 4 столбцов
id(int),id_tag(int),date(int),value(float)
индексы по четырем колонкам.
Если прикинуть размеры через год
500*3600*24*30*12=15 552 000 000 строк
Цифра внушительная.
Как мне в будущем работать с таким объемом?
Необходимо же не только считывать, но и записывать, а это постоянный пересчет индексов.
Во первых, если не ошибаюсь, необходимо будет делать Партицирование.
Никогда с ним еще не работал. вопрос тогда, как происходит вставка, пересчет идет только партиции?
Еще один вопрос, чем старше данные, тем реже используются для выборки, какие есть инструменты чтоб сжимать данные старые или еще что то, чтоб при необходимости только разворачивались?
Еще вопрос по объему, сейчас 7,5 млн сторк, весит таблица 700 МБ, если примерно прикинуть это получается при 15 552 000 000 строк = 1 451 520 МБ = 1.384277 ТБ Это получается на второй год эксплуатации файловая систем NTFS переполнится.
Эх, помогите советами, опыт еще маленький.
...
Рейтинг: 0 / 0
Большой объем данныех
    #38332261
krevedko13
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
...
Рейтинг: 0 / 0
Большой объем данныех
    #38332269
miksoft
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ldar,

А зачем вам хранить эту массу записей долго?
...
Рейтинг: 0 / 0
Большой объем данныех
    #38332436
ldar
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
krevedko13,Спасибо. как я понял каждая партиция mysql воспринимает как отдельную таблицу. Скажите тогда оптимальный размер строк или объем партиции И можно ли будет удалять данные по партициям, к примеру партицирование за месяц, другой месяц начался, партиция последняя удалилась вместе с данными, без указывания диапазонов и id, просто указать партиция и DELETE. Блин удаление вообще дорогое удовольствие будет, ведь после удаления надо еще оптимизировать таблицу.
...
Рейтинг: 0 / 0
Большой объем данныех
    #38332442
ldar
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
miksoft, Ну больше года наверно и уже после подсчетов скорей всего не будет. Ну а данные за год нужны. Это получается 15 миллиардов.
...
Рейтинг: 0 / 0
Большой объем данныех
    #38332457
tanglir
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ldarИ можно ли будет удалять данные по партициямВы почитайте, почитайте ман. По ссылкам там пройдитесь. Вот тут, например, посмотрите http://dev.mysql.com/doc/refman/5.1/en/partitioning-management-range-list.html
...
Рейтинг: 0 / 0
Большой объем данныех
    #38332459
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ldar,

Я боюсь, такие объемы уже не для MySQL.

Миллионы ещё куда не шло, миллиарды -- нет.
К сожалению, опыта с MySQL в этом вопросе у меня нет, ни отрицательного, ни положительного.

Тут Нужны columnstore, Vertica, например, и т.п.
...
Рейтинг: 0 / 0
Большой объем данныех
    #38332485
miksoft
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Еще можно попробовать самодельное партиционирование. Например, по таблице на день. Тогда и количества записей будут не такие страшные, и колонка date уберется, что сократит объем данных.
...
Рейтинг: 0 / 0
Большой объем данныех
    #38332489
miksoft
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А вообще - нужно детально смотреть, что это за данные.
...
Рейтинг: 0 / 0
Большой объем данныех
    #38332592
ldar
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Спасибо за советы. Данные эти, это показание различных датчиков с дискретностью секунда. Насчет создание таблиц надо подумать, разделить их по месяцу это получится миллиард, если по дням уже лучше, но тогда получится немерено таблиц. 365 таблиц в год. Это нормально?
...
Рейтинг: 0 / 0
Большой объем данныех
    #38332646
miksoft
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ldarДанные эти, это показание различных датчиков с дискретностью секунда.А обязательно их сохранять в 500 отдельных записей? В одну нельзя (с разбивкой по полям или без)?
(Разбивка по полям опасна, если количество датчиков может измениться).

ldar365 таблиц в год. Это нормально?Не вижу в этом ничего страшного.
...
Рейтинг: 0 / 0
Большой объем данныех
    #38332758
ldar
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
miksoft, 500 это я взял максимальное количество уникальных датчиков, на данный момент их около 200. Спасибо за совет по поводу создание таблиц, наверно так и поступлю.
...
Рейтинг: 0 / 0
Большой объем данныех
    #38333014
miksoft
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ldar,

а точно нужно все датчики в отдельные записи писать? в MySQL потом с ними какая-то аналитика будет или только хранение?
...
Рейтинг: 0 / 0
Большой объем данныех
    #38333047
ldar
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
miksoft, да, желательно в отдельные записи. Потом я провожу агрегацию данных для быстроты выборки в таблицы с дискретностью минута, час, день.
...
Рейтинг: 0 / 0
Большой объем данныех
    #38333078
miksoft
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ldarmiksoft, да, желательно в отдельные записи. Потом я провожу агрегацию данных для быстроты выборки в таблицы с дискретностью минута, час, день.Если вынести эту агрегацию на клиентскую сторону и хранить все показания в одной записи, то можно будет объем хранимых данных сократить кардинально (вдвое или больше).
...
Рейтинг: 0 / 0
Большой объем данныех
    #38333122
ldar
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
miksoft, а можно поподробней.
...
Рейтинг: 0 / 0
Большой объем данныех
    #38333129
miksoft
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ldarmiksoft, а можно поподробней.Исчезнет многократное хранение вспомогательных полей, например, времени.
А поля id и id_tag, подозреваю, вообще станут не нужны. Зависит от деталей их предназначения.
...
Рейтинг: 0 / 0
Большой объем данныех
    #38333255
Фотография javajdbc
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ldar ,

в обшем виде работа с большими обьемами данных
требует особых приемов. Практически очень трудно (иили невозможно)
загружать, хранить и использовать большие данные
в единой структуре. Прочитайте про DWH, ДатаМарт, BI.
Идея в разделении OLTP и OLAP, раделение сбора, загрузки,
чистики данных (ETL), создание преагрегатов, репортов, и т.д.

Что немаловажно, надо подходить с обоих сторон --
и со стороны исходных данных и со стороны требований
бизнеса на использование этих данных.
Архитектура и процессы вашего проекта 70% зависит
от того кто, какие, когда и как будет запрашивать информацию и репорты.

Без понимания зачем вам нужны данные -- все разговоры про
варианты хранения данные -- трата времени.
...
Рейтинг: 0 / 0
Большой объем данныех
    #38333883
ldar
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
miksoft, я понимаю вы такую таблицу предлагаете?

Ну да, объем существенно снизится и скорость выборки увеличится, только как я понимаю эту таблицу нужно делать с уже фиксированным количеством столбцов и в случае необходимости добавления датчика, это уже будет невозможным, если только не создавать еще одну таблицу.
Пока остановился на версии создания на каждый день таблицы, но это надо для начала поэксперементировать, чтоб убедится в эффективности.
...
Рейтинг: 0 / 0
Большой объем данныех
    #38333895
ldar
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
javajdbc,
Спасибо за наводку, теперь есть о чем поразмыслить и почитать.
Еще хотел спросить, из свободных SQL баз какая лучше подойдет для этих целей?
...
Рейтинг: 0 / 0
Большой объем данныех
    #38333981
tanglir
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ldarmiksoft, я понимаю вы такую таблицу предлагаете?Он предлагает или такую, илиmiksoftА обязательно их сохранять в 500 отдельных записей? В одну нельзя (с разбивкой по полям или без )?
( Разбивка по полям опасна, если количество датчиков может измениться ).такую: {id int, tags_data varchar(500)}, а в поле tags_data будет лежать что-нибудь типа "1:123;2:456;3:789"
...
Рейтинг: 0 / 0
Большой объем данныех
    #38333991
miksoft
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ldarmiksoft, я понимаю вы такую таблицу предлагаете?
Только как вариант (который с разбивкой по полям).
Можно и без разбивки, т.е. писать все float-значения в одно поле. Например, в BLOB.
Кстати, поле id тут уже становится не очень нужно, если в datetime дублей не будет.
...
Рейтинг: 0 / 0
Большой объем данныех
    #38334090
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
krevedko13,Спасибо. как я понял каждая партиция mysql воспринимает как отдельную таблицу.

Нет, все вместе только как таблица выглядит.


Скажите тогда оптимальный размер строк или объем партиции

Для каждого приложения это индивидуально.

И можно ли будет удалять данные по партициям, к примеру партицирование за месяц, другой месяц начался, партиция последняя удалилась вместе с данными, без указывания диапазонов и id, просто указать партиция и DELETE. Блин удаление вообще дорогое удовольствие будет, ведь после удаления надо еще оптимизировать таблицу.


Да, можно будет. Именно для этого разделы и нужны.
...
Рейтинг: 0 / 0
Большой объем данныех
    #38334101
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ldarСпасибо за советы. Данные эти, это показание различных датчиков с дискретностью секунда. Насчет создание таблиц надо подумать, разделить их по месяцу это получится миллиард, если по дням уже лучше, но тогда получится немерено таблиц. 365 таблиц в год. Это нормально?

Нет. Даже странно, что миксофт тебе это посоветовал.
...
Рейтинг: 0 / 0
Большой объем данныех
    #38334204
ldar
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
miksoft, tanglir , Понял я вас, хорошая идея, а десериализировать (структурировать) данные из поля BLOB только средствами сторонних языков программирования или имеются что то в mysql?
...
Рейтинг: 0 / 0
25 сообщений из 50, страница 1 из 2
Форумы / MySQL [игнор отключен] [закрыт для гостей] / Большой объем данныех
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]