|
|
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
Всем привет. У коллег есть идея перевести полностью транспорт извлечения данных (часть extract из ETL) c SQL запросов на работу с очередью изменений объектов. Вроде бы очередь обычно используется как механизм для получения дельты (для инкрментального обновления) - полная замена представляется довольно озорным мероприятием - кто что думает? sergeyavdovin.ru ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2017, 15:10 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
Evolex_Всем привет. У коллег есть идея перевести полностью транспорт извлечения данных (часть extract из ETL) c SQL запросов на работу с очередью изменений объектов. Вроде бы очередь обычно используется как механизм для получения дельты (для инкрментального обновления) - полная замена представляется довольно озорным мероприятием - кто что думает? sergeyavdovin.ruА зачем? Кто будет данные класть в очередь? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2017, 16:40 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
Alexander Ryndin, CDC например ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2017, 16:53 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
Источник тот же самый - он и будет наполнять очередь. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2017, 17:04 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
Evolex_, Если после того, как это взлетит и вы будете спать спокойно, то почему бы и нет если это реально требуется. Тут очевидны доп. трудозадраты на администрирование этой очереди и согласованноть работ при обновлении. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2017, 17:20 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
ShIgorAlexander Ryndin, CDC напримерДля большинства кейсов CDC прекрасно справляется и без очередей. Хотя, не спорю, есть кейсы, где очереди весьма полезны. Главное понимать, а какую ценность приносит очередь? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2017, 17:35 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
Evolex_Источник тот же самый - он и будет наполнять очередь.В случае ETL сам ETL опрашивает источник и забирает данные асинхронно, чаще всего ночью. А кто будет класть данные в случае очереди? ETL? P.S. На самом деле, выше правильно сказали про CDC. Только хорошо бы понимать, нафига тут очереди, ибо (опять же правильно сказано выше) их нужно сопровождать, очереди часто плохо масштабируются и т.д., и т.п. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2017, 17:37 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
Очередь наполянет система-источник данных. ETL запускается в то же время, что и раньше, только вместо обращения к SQL обращается к очереди. У меня пока такие сомнения: 1. full load (vs incremental load) тут можно рассмотреть случаи, когда требуется: 1.1 при изменении системы - добавлении - удалени поля 2. Сопровождение при устранении проблем данные часто сравниваютсяс помощью sql запросов - произвольный доступ к любой части информации. В случае с очередью теряем произвольный доступ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2017, 17:50 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
"зачем очередь": приняли решение (не я). Я пробую сейчас оценить то что потеряли и что нужно будет реализовывать ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2017, 17:55 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
Evolex_Очередь наполянет система-источник данных. Т.е. 1) Система-источник должна уметь наполнять очередь асинхронно (иначе транзакции будут тормозить) 2) Система-источник должна быть доработана, чтобы самостоятельно наполнять очередь 3) Система-источник должна быть доработана при добавлении новых таблиц на источнике 4) Должны быть учтены факторы консистентности и согласованности забора данных. 5) На выходе получится довольно серьезный и уникальный велосипед для сопровождения которого понадобится разработчик этого велосипеда ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2017, 18:18 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
Alexander Ryndin, Да, все верно. Мысль про велосипед меня тоже не покидает - решил на форуме проверить что я не один такой )))). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2017, 18:20 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
Evolex_, Вам Alexander Ryndin довольно подробно ответил. Дополню из опыта - в SAP ERP - BW работает похожая схема. По опыту работы и разработки для нее: 1. Нужно предусмотреть как экстрактор дельт, так и экстрактор полного содержимого таблицы или с определенным фильтром. Для инициализации или решения проблем. 2. При расширении состава полей - нужно согласованно расширить объекты на стороне источника и затем обновить получатель. 3. На стороне DWH - желательна реализация схемы ODS, куда падают распакованные из очереди данные, и они затем асинхронно/пакетно применяются. 4. Ко всему этому нужно прикрутить регистрацию ошибок/сообщений и мониторинг И как такой велосипед поддерживать - тоже отдельный вопрос. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2017, 18:31 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
FerdipuxИ как такой велосипед поддерживать - тоже отдельный вопрос. а потом появляется еще 3-4 новых источника, + весь этот функционал нужно повторить на системах, модифицировать которые вы не имеете права, т.к. иначе с поддержки снимут )) в общем, выглядит как попытка переложить etl на специалистов, которые занимаются системой-источником ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2017, 19:14 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
Критик, Желание использовать другой транспорт было как раз от тех кто занимается системой - источником. Наверное, не ожидали сами. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2017, 19:51 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2017, 21:23 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
Voyager_lan, По крайней мере, из описания деталей на главной странице, непонятны особенности этой системы из-за которых ее следовало бы выделить из остальных для решения проблем описанных выше ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 18.05.2017, 13:27 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
Evolex_Voyager_lan, По крайней мере, из описания деталей на главной странице, непонятны особенности этой системы из-за которых ее следовало бы выделить из остальных для решения проблем описанных выше готов рассказать особенности - но с чем сравнивать? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.05.2017, 18:48 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
Есть мысль что тут пригодится ELT - типа hadoop (вместо ETL) это часть проблем, вроде, решит - загружаем все сообщения очереди через ELT потом можно будет пересматривать довольно долго (насколько хватит места) и изменять структуру того что загружается в DWH с полной перезагрузкой DWH без обращения к исходной системы ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.07.2017, 00:37 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
Evolex_Есть мысль что тут пригодится ELT - типа hadoop (вместо ETL) это часть проблем, вроде, решит - загружаем все сообщения очереди через ELT потом можно будет пересматривать довольно долго (насколько хватит места) и изменять структуру того что загружается в DWH с полной перезагрузкой DWH без обращения к исходной системыомг ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.07.2017, 01:24 |
|
||
|
перевод транспорта извлечения данных полностью на очередь изменений объектов
|
|||
|---|---|---|---|
|
#18+
Alexander Ryndin, ?)))) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.07.2017, 01:33 |
|
||
|
|

start [/forum/topic.php?fid=49&fpage=30&tid=1858188]: |
0ms |
get settings: |
10ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
53ms |
get topic data: |
13ms |
get forum data: |
3ms |
get page messages: |
56ms |
get tp. blocked users: |
2ms |
| others: | 247ms |
| total: | 405ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...