powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / покритикуйте синхронизацию данных
5 сообщений из 5, страница 1 из 1
покритикуйте синхронизацию данных
    #39476889
fduch f.f.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
делаю все в SSIS

есть три источника данных, данные из них должны поступать в одну таблицу
сперва из первого источника, потом из второго те которых нет в первом, потом из третьего те которых нет в двух предыдущих

все источники разные, завернуть их в транзакцию нельзя

идея такая
1) загружаю данные по очереди в промежуточную таблицу
2) если она не пустая то удаляю данные из рабочей таблицы и заливаю из временной в одной транзакции
3) удаляю данные из временной таблицы

таким образом я исключаю ситуацию когда загрузка новой версии данных не прошла, а предыдущие данные удалились
...
Рейтинг: 0 / 0
покритикуйте синхронизацию данных
    #39476900
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
fduch f.f.,

загружать все в 3 разные таблицы в STAGE-области одновременно,
потом отправлять нужные по вашей логике данные в расчетную область
...
Рейтинг: 0 / 0
покритикуйте синхронизацию данных
    #39476940
dmitriy756
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Что-то тоже не пойму, зачем эти переливания?
Грузите все в stage-область, хоть в несколько таблиц, хоть в одну, но с учётом источника данных (код системы источника).
А дальше что душе угодно: добавляйте, обновляйте, удаляйте, пересчитывайте, генерируйте суррогатники, откатывайте, перегружайте за 3 прошедших дня и т.д.
...
Рейтинг: 0 / 0
покритикуйте синхронизацию данных
    #39476944
Гулин Федор
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
обычно ETL так в 3 слоя
landing -> staging -> DWH

landing транкейтится и туда заливаестя дельта
(елси есть поля типа dat_lstUpdate то отлично - если нет то можно проверять хеш записей или нужных полей и тоже забирать дельту)
staging хранит все данные

но если данных немного и логика простая
то можно и без landing - staging вместо него с полной перезаливкой и truncate

если в исходных системах есть ПК (т.е они конечно должны быть - но файлы могут прийти и csv скажем а там это не всегда очевидно)
то при заливке в staging проверятеся по ПК
и апдейттися или инсертится
а если его даже и нет - то придется найти :) набор полей к-й считается уникальным.
...
Рейтинг: 0 / 0
покритикуйте синхронизацию данных
    #39477034
Voyager_lan
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Гулин Федоробычно ETL так в 3 слоя
landing -> staging -> DWH

если в исходных системах есть ПК (т.е они конечно должны быть - но файлы могут прийти и csv скажем а там это не всегда очевидно)
то при заливке в staging проверятеся по ПК
и апдейттися или инсертится
а если его даже и нет - то придется найти :) набор полей к-й считается уникальным.

Проверять приходилось практически всегда, когда не уверен на 100% в источнике (т.е. во всех случаях когда к источнику не подпускают). Столько неожиданного г-на иногда видишь, что лучше перестаховаться :)
...
Рейтинг: 0 / 0
5 сообщений из 5, страница 1 из 1
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / покритикуйте синхронизацию данных
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]