Как правильно разбить большую БД на части/файлы? / Microsoft SQL Server

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Как правильно разбить большую БД на части/файлы?

9 сообщений из 9, страница 1 из 1

Как правильно разбить большую БД на части/файлы?

#40094603

Badhabit

Гость

День добрый. Подскажите, как будет лучше сделать следующее. Есть довольно много данных 5-6Тб разделенных в файлы помесячно. Их нужно "залить" в две таблицы БД, по одной предварительно построив ClusterdColumnStore индекс (для сжатия данных) ну и потом по некоторым полям построить обычные индексы. БД будет использоваться исключительно для чтения ну и "доливки" новых данных каждый месяц...
Заливать весь объем в одиночные таблицы что-то не хочется, т.к. может понадобится заменить какой-нибудь месяц в середине, ну а delete, как я понимаю с такими объемами не справится да и размер .mdf-файла получается огромным. Есть две идеи.
1. Сделать много "маленьких" БД куда заливать данные по месяцу, ну и строить индексы и сделать одну БД в которой сделать два View в котором через union all объединять соответствующие таблицы из этих "маленьких" баз.
2. Заливать в одну БД в разные таблицы, которые каждая в своей файловой группе (ну и в отдельном файле) и потом объединить все их секционированием.
Так собственно вопрос какой из подходов лучше/оптимальнее с точки зрения логики, скорости работы (может есть какие-нибудь нюансы с индексами) и пр. Или вообще всё не так и нужно делать всё по другому?

...

Рейтинг:

0 / 0

01.09.2021, 20:36

| Ответить | Цитировать | Написать

Как правильно разбить большую БД на части/файлы?

#40094607

SERG1257

Участник

Сообщения: 2 932

Рейтинг: 0 / 0

разбивая по разным базам у тебя будут разные права на разных базах.

Секционирование в этом случае проще.

...

Рейтинг:

0 / 0

01.09.2021, 20:42

| Ответить | Цитировать | Написать

Как правильно разбить большую БД на части/файлы?

#40094610

flexgen

Участник

Откуда: Город на песке

Сообщения: 936

Рейтинг: 0 / 0

Badhabit,

Я не очень понял вот это:
автор2. Заливать в одну БД в разные таблицы, которые каждая в своей файловой группе (ну и в отдельном файле) и потом объединить все их секционированием.

Секционирование это, строго говоря, разделение данных, что ты собрался объединять? Или имеется ввиду загрузка данных в heap таблицы с последующим переключением в заранее созданную секционированную таблицу? Если время загрузки ограничено, то это вполне подходящий вариант, ты можешь грузить данные в несколько таблиц одновременно.

...

Рейтинг:

0 / 0

01.09.2021, 20:51

| Ответить | Цитировать | Написать

Как правильно разбить большую БД на части/файлы?

#40094635

Владислав Колосов

Участник

Сообщения: 9 447

Рейтинг: 0 / 0

Badhabit,

если потребуется перезагрузить какой-то период полностью, то секционирование по этому периоду. Секции можно переключать через alter table.

...

Рейтинг:

0 / 0

01.09.2021, 22:24

| Ответить | Цитировать | Написать

Как правильно разбить большую БД на части/файлы?

#40094780

Badhabit

Гость

авторразбивая по разным базам у тебя будут разные права на разных базах.
Наверно с правами проблем не будет, БД вообще на локальном компе и работаю из под sa и права сам все назначаю... Или какие-то другие права?
авторсекционирование это, строго говоря, разделение данных, что ты собрался объединять? Или имеется ввиду загрузка данных в heap таблицы с последующим переключением в заранее созданную секционированную таблицу? Если время загрузки ограничено, то это вполне подходящий вариант, ты можешь грузить данные в несколько таблиц одновременно.
Да, имелось ввиду подключение закруженных месяцев в заранее созданную секционированную таблицу...

Ну в принципе я хотел узнать есть ли преимущество у секций перед View с union all из разных БД? Потому что мне как-то комфортнее работать именно с несколькими маленькими ДБ, чем с секционированными таблицами в одной БД. Только не будет ли каких-нибудь просадок в производительности при данном выборе?

...

Рейтинг:

0 / 0

02.09.2021, 12:30

| Ответить | Цитировать | Написать

Как правильно разбить большую БД на части/файлы?

#40094793

Владислав Колосов

Участник

Сообщения: 9 447

Рейтинг: 0 / 0

Badhabit,

есть только один способ узнать. Я не замечал, например.

...

Рейтинг:

0 / 0

02.09.2021, 13:15

| Ответить | Цитировать | Написать

Как правильно разбить большую БД на части/файлы?

#40094796

uaggster

Гость

Badhabit

Это классическая задача под секционирование.
У меня, например, аналогичная задача. Сводная БД, куда (пере)загружаются данные разных филиалов помесячно.
Таблицы поделены на, примерно, 6000 секций, с ключом по id филиала + месяц.
Заливка происходит в динамически создаваемые создаваемые таблицы в отдельной схеме, а потом секция подменяется через partition switch.
С учетом того, что данные льются не в основную структуру, чтение данных из основной структуры - практически не блокируется. Практически, потому что partition switch приводит к аварийному завершению запроса, если он работает на момент переключения секций. Но, к счастью, в 2019 появилось ленивое переключение. Оно сначала ждет задаваемый в команде таймаут, а потом - переключает.
Да!
Дозагрузка реализована несколько уродски. :-)
В автономные таблицы заливаются новые данные, а потом туда же - ранее загруженные данные из продуктовой таблицы.
Потом в этой таблице строятся индексы, а потом - секция переключается.

Могу сказать, что не смотря на постоянную заливку данных 24Х7 в 8 потоков, по продуктовым таблицам вполне можно строить оперативные отчеты. Сложные агрегаты, конечно, считаются в кубе, который строится на базе, восстановленной из бэкапа раз в сутки.

Объем всего этого дела не очень большой, чуть менее 10 Тб, но, думаю, потенциал у нее где то до 20-30 Тб дорасти, судя по нагрузке, откликам и т.д.

...

Рейтинг:

0 / 0

02.09.2021, 13:19

| Ответить | Цитировать | Написать

Как правильно разбить большую БД на части/файлы?

#40094797

Badhabit

Гость

авторесть только один способ узнать. Я не замечал, например.
Понял, потестирую...
Всем спасибо!

...

Рейтинг:

0 / 0

02.09.2021, 13:19

| Ответить | Цитировать | Написать

Как правильно разбить большую БД на части/файлы?

#40094900

a_voronin

Участник

Откуда: Москва

Сообщения: 4 636

Рейтинг: 0 / 0

Владислав Колосов

По моему опыту altertable с целью разбить партиции на части виснет замертво. Всегда создавал и подменял таблицу.

...

Рейтинг:

0 / 0

02.09.2021, 18:17

| Ответить | Цитировать | Написать

9 сообщений из 9, страница 1 из 1

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Как правильно разбить большую БД на части/файлы?

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=46&msg=40094796&tid=1684340]:	0ms
get settings:	11ms
get forum list:	15ms
check forum access:	4ms
check topic access:	4ms
track hit:	31ms
get topic data:	11ms
get forum data:	3ms
get page messages:	49ms
get tp. blocked users:	1ms
others:	271ms

total:	400ms