Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Oracle [игнор отключен] [закрыт для гостей] / Выгрузки в другие БД / 9 сообщений из 9, страница 1 из 1
09.02.2017, 17:03
    #39401770
Preved
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Выгрузки в другие БД
Идет прием выгрузки данных. xml.
Каждый день приходит три млн записей.
Из них реально новых примерно 50тыс., то есть реально полезной инфы 1-2%.
Между тем грузятся 10-ки Гб (вместе с записями идут доки).

Вопрос насколько это нормальная практика выгружать полностью всю историю условно объекта, все его текущее состояние, вместо того, чтобы выгружать только дельту порядка 1%?
Ведь эти 3млн, надо мало того, что скачивать, загружать, потом еще смерджить с сотнями млн записей в базах-приемниках.
...
Рейтинг: 0 / 0
09.02.2017, 17:05
    #39401774
andreymx
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Выгрузки в другие БД
Preved,

не нормально
наверное
...
Рейтинг: 0 / 0
09.02.2017, 20:36
    #39401897
CrazyCat
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Выгрузки в другие БД
казалось бы, причем тут оракл?
...
Рейтинг: 0 / 0
09.02.2017, 21:23
    #39401913
Preved
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Выгрузки в другие БД
andreymxне нормально наверное
Тоже так щитаю. Например, есть платежи клиента за месяц. Зачем каждый день выгружать все платежи за месяц вместо того, чтобы выгрузить только дельту, т.е. за прошлый день. При чем выгрузка идет и по связанных сущностей тоже.
CrazyCatказалось бы, причем тут оракл?
Конечно можно отнести к любой СУБД, но взял просто т.к. рабтаю с ним немного.
У меня пока объяснение одно - чтобы было за что деньги брать, одно дело когда выгружается каждый день сотня метров и другое дело десятки Гб )
Но действительно, это или в форум БД или вообще в ПТ.
...
Рейтинг: 0 / 0
10.02.2017, 10:17
    #39402054
CrazyCat
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Выгрузки в другие БД
PrevedНо действительно, это или в форум БД или вообще в ПТ.
может. а все же по теме то какой вопрос?
...
Рейтинг: 0 / 0
10.02.2017, 11:06
    #39402094
veep_in_office
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Выгрузки в другие БД
PrevedИдет прием выгрузки данных. xml.
Каждый день приходит три млн записей.
Из них реально новых примерно 50тыс., то есть реально полезной инфы 1-2%.
Между тем грузятся 10-ки Гб (вместе с записями идут доки).
....
....
....


неплохая таки задачка по оптимизации. 98% процентов ресурсов тратится в пустую. В итоге это приведет к удорожанию железа. Лучше заплатить денег "кому надо" сейчас за оптимизацию
Чем потом в 10 раз больше на новые железки.
...
Рейтинг: 0 / 0
10.02.2017, 12:14
    #39402198
Preved
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Выгрузки в другие БД
CrazyCatможет. а все же по теме то какой вопрос?
Это и есть вопрос: насколько это нормальная практика делать массовые выгрузки не дельты, а всех связанных данных.
То есть условно в БД есть договор с клиентом, на поставку чего-либо по этому договору прошло уже куча накладных, счетов и т.д.,
но условно с каждой новой накладной выргужаются все его прежние накладные, счета и т.д. и ладно бы просто 5млн записей, так еще доки выгружаются в виде pdf-ок (отсюда и объемы), так ладно бы еще pdf-ки доков выгружались отдельно, чтобы можно было их просто не брать например, но они как нарочно прошиты внутрь файлов с записями :)
veep_in_officeнеплохая таки задачка по оптимизации. 98% процентов ресурсов тратится в пустую. В итоге это приведет к удорожанию железа. Лучше заплатить денег "кому надо" сейчас за оптимизацию
Чем потом в 10 раз больше на новые железки.
Ну соптимизировать-то ничего сложного только никому это не надо, кроме ТС (но повлиять не могу на поставщика данных), т.к. кажется, что это не нормально, потому и решил уточнить, а то может чего не понимаю.
К удорожанию железа это особо не приведет - только диски докупать придется периодически.
А может и мне это выгодно: одно дело обработать сотню метров файлов, другое - десятки гигов в отведенное время смержить с сотнями гигов :) важная сложная задача аднака )))
...
Рейтинг: 0 / 0
10.02.2017, 12:28
    #39402217
Alexander Ryndin
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Выгрузки в другие БД
PrevedЭто и есть вопрос: насколько это нормальная практика делать массовые выгрузки не дельты, а всех связанных данных.
Ну соптимизировать-то ничего сложного только никому это не надо, кроме ТС (но повлиять не могу на поставщика данных), т.к. кажется, что это не нормально, потому и решил уточнить, а то может чего не понимаю.1) Работает - не трогай.
2) Никто не жалуется - незачем оптимизировать.
...
Рейтинг: 0 / 0
10.02.2017, 14:13
    #39402295
env
env
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Выгрузки в другие БД
Preved,

Возможно, система источник
- не умеет определять дельту
- даёт возможность безвозвратного удаления данных
- собирает данные из нескольких слабосвязанных систем

В качестве примера попробуйте инкрементально загружать справочник ФИАС от налоговой.
Если за год у вас все инкременты в формате xml обработаются нормально и у пользователей системы не появится вопросов вида "куда пропал Воронеж?", то я таки буду вам завидовать.
...
Рейтинг: 0 / 0
Форумы / Oracle [игнор отключен] [закрыт для гостей] / Выгрузки в другие БД / 9 сообщений из 9, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]