powered by simpleCommunicator - 2.0.53     © 2025 Programmizd 02
Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Загрузка 170 000 000 записей
12 сообщений из 37, страница 2 из 2
Загрузка 170 000 000 записей
    #39988300
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
a_voronin
andreymx
на самом деле 170 млн строк не так уж и много

тут еще вопрос уже поднимали насчет пропускной способности сети
и еще могут быть тормоза, если сервер оракл на земле, а сервер мсскл в ажуре (или наоборот)


Надо сразу писать инкрементальную загрузку. Чтобы она продолжала с того места, где закончила. Надеяться, что 170 лямов пройдут за один заход не стоит.

Я бил по хешу от первичного ключа выгрузки на порции. На 2,4,8,16 по выбору. И тогда даже терабайтные таблички
нормально грузятся за 1 транзакцию.
...
Рейтинг: 0 / 0
Загрузка 170 000 000 записей
    #39988501
Фотография a_voronin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Критик
a_voronin
При любом раскладе есть решение через доп таблицу и триггер на источнике. На Oracle они не так сильно тупят как на MSSQL.


Ага, поставьте триггер на таблицу в первичной банковской системе...
Часто проще грузить по 200 млн ежедневно.


Расклады бывают разные. Я такое проворачивал именно в банке.

Есть различные способы инкриментальной выгрузки. Можно по хешу с партиционированием по диапазону ключей или по дате.
...
Рейтинг: 0 / 0
Загрузка 170 000 000 записей
    #39988703
andreymx
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton
a_voronin
пропущено...


Надо сразу писать инкрементальную загрузку. Чтобы она продолжала с того места, где закончила. Надеяться, что 170 лямов пройдут за один заход не стоит.

Я бил по хешу от первичного ключа выгрузки на порции. На 2,4,8,16 по выбору. И тогда даже терабайтные таблички
нормально грузятся за 1 транзакцию.
а зачем по хешу?
...
Рейтинг: 0 / 0
Загрузка 170 000 000 записей
    #39988704
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
andreymx
mayton
пропущено...

Я бил по хешу от первичного ключа выгрузки на порции. На 2,4,8,16 по выбору. И тогда даже терабайтные таблички
нормально грузятся за 1 транзакцию.
а зачем по хешу?

Мне нравится. А у тебя есть другая функция которая терабайт побъёт на ровные фрагменты?
...
Рейтинг: 0 / 0
Загрузка 170 000 000 записей
    #39988727
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton,

например, по остатку от деления на количество потоков,
или в свежем SSIS есть блок, который сам делит входящий поток на несколько потоков вставки
...
Рейтинг: 0 / 0
Загрузка 170 000 000 записей
    #39988738
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Критик
mayton,

например, по остатку от деления на количество потоков,
или в свежем SSIS есть блок, который сам делит входящий поток на несколько потоков вставки

А ты про это....

Извини я вообще не специалист в SSIS. Я это применял для Oracle/Java стека технологий.
Щас я вот озабочен экспортом из Oracle/PG в колончатый формат.
https://www.sql.ru/forum/1323925/ponedelnichnye-razgovory-ob-eksporte-i-column-oriented-files
Это фоновая задача которой я занимают время-от времени. Моя попытка вывести часть
облачных технологий в повседневное не-облачное использование. Тоесть дать админам
и девопсам колончатый экспорт утилиту в руки. Я думаю там я и реализую партишеннинг
по разным формулам. И снапшоты чтоб консистентно было.
...
Рейтинг: 0 / 0
Загрузка 170 000 000 записей
    #39988758
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
mayton,

Мм, а разве в самом Oracle нет такого архивирования?
А то для MSSQL я поступал просто - сливал старые данные в таблицу с кластерным колоночным индексом с архивным видом сжатия.
...
Рейтинг: 0 / 0
Загрузка 170 000 000 записей
    #39988784
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
В оракле есть exp/expdp. Но они - строчно-ориентированные.
Яже делаю - колоночно.
...
Рейтинг: 0 / 0
Загрузка 170 000 000 записей
    #39988799
Фотография SIMPLicity_
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
тема отделилась от своего создателя
...
Рейтинг: 0 / 0
Загрузка 170 000 000 записей
    #39988858
Фотография a_voronin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Критик
mayton,

например, по остатку от деления на количество потоков,
или в свежем SSIS есть блок, который сам делит входящий поток на несколько потоков вставки




Что за блок и в какой версии?
...
Рейтинг: 0 / 0
Загрузка 170 000 000 записей
    #39989031
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
a_voronin,

вот на картинке, добавлен вроде бы с 2016
только, в ru-версию не осилили сделать, поэтому он не вытаскивается, т.к. название формируется неправильное
...
Рейтинг: 0 / 0
Загрузка 170 000 000 записей
    #39989036
Фотография a_voronin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Критик
a_voronin,

вот на картинке, добавлен вроде бы с 2016
только, в ru-версию не осилили сделать, поэтому он не вытаскивается, т.к. название формируется неправильное


https://www.sqlshack.com/ssis-balanced-data-distributor-overview/

Судя по описанию, такое через conditional split можно было и раньше делать.
...
Рейтинг: 0 / 0
12 сообщений из 37, страница 2 из 2
Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Загрузка 170 000 000 записей
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]