|
|
|
Выгрузки в другие БД
|
|||
|---|---|---|---|
|
#18+
Идет прием выгрузки данных. xml. Каждый день приходит три млн записей. Из них реально новых примерно 50тыс., то есть реально полезной инфы 1-2%. Между тем грузятся 10-ки Гб (вместе с записями идут доки). Вопрос насколько это нормальная практика выгружать полностью всю историю условно объекта, все его текущее состояние, вместо того, чтобы выгружать только дельту порядка 1%? Ведь эти 3млн, надо мало того, что скачивать, загружать, потом еще смерджить с сотнями млн записей в базах-приемниках. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2017, 17:03 |
|
||
|
Выгрузки в другие БД
|
|||
|---|---|---|---|
|
#18+
Preved, не нормально наверное ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2017, 17:05 |
|
||
|
Выгрузки в другие БД
|
|||
|---|---|---|---|
|
#18+
казалось бы, причем тут оракл? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2017, 20:36 |
|
||
|
Выгрузки в другие БД
|
|||
|---|---|---|---|
|
#18+
andreymxне нормально наверное Тоже так щитаю. Например, есть платежи клиента за месяц. Зачем каждый день выгружать все платежи за месяц вместо того, чтобы выгрузить только дельту, т.е. за прошлый день. При чем выгрузка идет и по связанных сущностей тоже. CrazyCatказалось бы, причем тут оракл? Конечно можно отнести к любой СУБД, но взял просто т.к. рабтаю с ним немного. У меня пока объяснение одно - чтобы было за что деньги брать, одно дело когда выгружается каждый день сотня метров и другое дело десятки Гб ) Но действительно, это или в форум БД или вообще в ПТ. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.02.2017, 21:23 |
|
||
|
Выгрузки в другие БД
|
|||
|---|---|---|---|
|
#18+
PrevedНо действительно, это или в форум БД или вообще в ПТ. может. а все же по теме то какой вопрос? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.02.2017, 10:17 |
|
||
|
Выгрузки в другие БД
|
|||
|---|---|---|---|
|
#18+
PrevedИдет прием выгрузки данных. xml. Каждый день приходит три млн записей. Из них реально новых примерно 50тыс., то есть реально полезной инфы 1-2%. Между тем грузятся 10-ки Гб (вместе с записями идут доки). .... .... .... неплохая таки задачка по оптимизации. 98% процентов ресурсов тратится в пустую. В итоге это приведет к удорожанию железа. Лучше заплатить денег "кому надо" сейчас за оптимизацию Чем потом в 10 раз больше на новые железки. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.02.2017, 11:06 |
|
||
|
Выгрузки в другие БД
|
|||
|---|---|---|---|
|
#18+
CrazyCatможет. а все же по теме то какой вопрос? Это и есть вопрос: насколько это нормальная практика делать массовые выгрузки не дельты, а всех связанных данных. То есть условно в БД есть договор с клиентом, на поставку чего-либо по этому договору прошло уже куча накладных, счетов и т.д., но условно с каждой новой накладной выргужаются все его прежние накладные, счета и т.д. и ладно бы просто 5млн записей, так еще доки выгружаются в виде pdf-ок (отсюда и объемы), так ладно бы еще pdf-ки доков выгружались отдельно, чтобы можно было их просто не брать например, но они как нарочно прошиты внутрь файлов с записями :) veep_in_officeнеплохая таки задачка по оптимизации. 98% процентов ресурсов тратится в пустую. В итоге это приведет к удорожанию железа. Лучше заплатить денег "кому надо" сейчас за оптимизацию Чем потом в 10 раз больше на новые железки. Ну соптимизировать-то ничего сложного только никому это не надо, кроме ТС (но повлиять не могу на поставщика данных), т.к. кажется, что это не нормально, потому и решил уточнить, а то может чего не понимаю. К удорожанию железа это особо не приведет - только диски докупать придется периодически. А может и мне это выгодно: одно дело обработать сотню метров файлов, другое - десятки гигов в отведенное время смержить с сотнями гигов :) важная сложная задача аднака ))) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.02.2017, 12:14 |
|
||
|
Выгрузки в другие БД
|
|||
|---|---|---|---|
|
#18+
PrevedЭто и есть вопрос: насколько это нормальная практика делать массовые выгрузки не дельты, а всех связанных данных. Ну соптимизировать-то ничего сложного только никому это не надо, кроме ТС (но повлиять не могу на поставщика данных), т.к. кажется, что это не нормально, потому и решил уточнить, а то может чего не понимаю.1) Работает - не трогай. 2) Никто не жалуется - незачем оптимизировать. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.02.2017, 12:28 |
|
||
|
Выгрузки в другие БД
|
|||
|---|---|---|---|
|
#18+
Preved, Возможно, система источник - не умеет определять дельту - даёт возможность безвозвратного удаления данных - собирает данные из нескольких слабосвязанных систем В качестве примера попробуйте инкрементально загружать справочник ФИАС от налоговой. Если за год у вас все инкременты в формате xml обработаются нормально и у пользователей системы не появится вопросов вида "куда пропал Воронеж?", то я таки буду вам завидовать. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.02.2017, 14:13 |
|
||
|
|

start [/forum/topic.php?fid=52&tid=1886466]: |
0ms |
get settings: |
5ms |
get forum list: |
22ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
34ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
55ms |
get tp. blocked users: |
2ms |
| others: | 216ms |
| total: | 355ms |

| 0 / 0 |
