Хардкорный мердж / Oracle

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Oracle [игнор отключен] [закрыт для гостей] / Хардкорный мердж

10 сообщений из 10, страница 1 из 1

Хардкорный мердж

#39274199

СноваОНевозможном

Гость

Кода под рукой нет, но выглядит примерно так
Есть:

Код: plsql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.

create table1 (id number, start_date date, field1 varchar2);
create index table1_i on table1(id, start_date);
create table2 (id number, start_date date, field1 varchar2);
create index table2_i on table2(id, start_date);

create global temporary table3 (id number, start_date date, field1 varchar2) on commit preserve rows;

create view test_view
as
select * from table1 where start_date < to_date('01012000', 'ddmmyyyy')
union all
select * from table2 where start_date >= to_date('01012000', 'ddmmyyyy')

На вью есть два инстиадоф-триггера на инсерт и апдейт.
То есть если при апдейте указана start_date, то по фильтру запрос идет сразу в нужную таблицу.

Теперь задача в table3 есть куча записей и их надо смержить в эти две таблицы через test_view.
Для записей у которых изменилось только field1, а id и start_date все быстро и замечательно.
А вот для записей, у которых изменилась start_date запросу приходится бегать по всем таблицам, чтобы найти нужный id.
Теперь считаем, что таблиц во вьюшке 20 и в каждой миллионы записей.
Получается очень долго в сравнении с тем, когда поиск идет еще и по start_date.

Cейчас алгоритм такой:
1. Сначала по for loop, ищем записи в test_view из table3 по id + start_date.
Апдейтим test_view, запоминая id в коллекцию.
2. Удаляем из темповой table3 записи с id, которые нашлись в п.1
3. Идем по for loop, ищем записи в test_view из table3 по id (самый долгий этап).
Апдейтим test_view, запоминая id в коллекцию
(при этом понятно, что т.к. start_date изменилась, то хоть и редко, но она может измениться настолько, что в инстеад-триггере запись будет перенесена в другую таблицу, чтобы соответствовать условиям вьюшки)
4. Удаляем из темповой table3 записи с id, которые нашлись в п.3
5.

Код: plsql

insert into test_view select * from table3

Интересует возможно ли как-то оптимизировать п.3, именно медленный поиск по id записей, у которых изменилась data? Понимаю, что самым лучшим вариантом было бы разбить данные на части не по дате, которая иногда тоже может меняться, но по сути, кроме id не меняющихся полей нет. Можно было бы например по последним цифрам того же id разбить сразу на сто "патишенов" или по какому-нибудь модулю от id и т.д. но нужно и по дате тоже, а делать многоуровневое "патиционирвание" с помощью вьюшки...
В общем есть ли варианты кроме изменения структуры?
Возможно,
1. сделать один проход по темповой таблице в цикле (один loop)
и внутри:
1.1. апдейт по id + start_date
1.2. апдейт по id, если sql%rowcount = 0
1.3. insert если sql%rowcount = 0
Но это примерно то же самое.

...

Рейтинг:

0 / 0

14.07.2016, 23:32:12

| Ответить | Цитировать | Написать

Хардкорный мердж

#39274314

kaldorey

Участник

Сообщения: 572

Рейтинг: 0 / 0

СноваОНевозможном,

Я правильно понимаю, это некая имитация партиций?
Если при изменении даты триггер по какому-то правилу перемещает запись, то почему бы по этому же правилу не искать нужную таблицу, а не искать по всем?

...

Рейтинг:

0 / 0

15.07.2016, 09:39:51

| Ответить | Цитировать | Написать

Хардкорный мердж

#39274429

СноваОНевозможном

Гость

kaldoreyЯ правильно понимаю, это некая имитация партиций?
Если при изменении даты триггер по какому-то правилу перемещает запись, то почему бы по этому же правилу не искать нужную таблицу, а не искать по всем?
Да. Некая имитация.
На данном примере:
1. Пришла некая запись у нее есть id и дата
2. Сначала пробуем обновиться по id + дата - здесь оракл, по условию во вью сам выбирает нужную таблицу по плану (FILTER по дате). И триггер тоже по дате апдейтит сразу нужную таблицу (о чем вы и пишете). Здесь все быстро.
3. Но допустим, что обновление в п.2 нам ничего не дало (sql%rowcount=0), т.е. не нашли запись через вьюшку по id + Дата, это значит, что или к нам пришла новая запись, или у id изменилась дата. И чтобы выяснить точно нам надо искать теперь только по id уже во всех таблицах вьюшки (дата нам теперь не известна), после того, как находим запись, переносим ее в другую таблицу (соответствующую по дате в условиях вьюшки). И вот этот поиск по id конечно очень не оптимальный момент.

...

Рейтинг:

0 / 0

15.07.2016, 11:31:30

| Ответить | Цитировать | Написать

Хардкорный мердж

#39274477

СноваОНевозможном

Гость

Решение нашел. Но оно относится к специфике организации данных в конкретном случае,
поэтому описывать его здесь смысла нет к сожалению. Тему можно закрыть. Спасибо.

...

Рейтинг:

0 / 0

15.07.2016, 12:01:26

| Ответить | Цитировать | Написать

Хардкорный мердж

#39274484

kaldorey

Участник

Сообщения: 572

Рейтинг: 0 / 0

СноваОНевозможном,

Может у кого-то есть решение получше, но если без сильных изменений, то у меня мысль только держать индексную табличку с существующими ID и на предмет существования обращаться к ней, а при вставке использовать insert all

...

Рейтинг:

0 / 0

15.07.2016, 12:07:22

| Ответить | Цитировать | Написать

Хардкорный мердж

#39274511

СноваОНевозможном

Гость

kaldoreyМожет у кого-то есть решение получше, но если без сильных изменений, то у меня мысль только держать индексную табличку с существующими ID и на предмет существования обращаться к ней, а при вставке использовать insert all
Если коротко, то таких структур/сущностей еще и несколько штук.
Они связаны между собой условно по fk.
И решение в том, чтобы вообще уйти от ситуации в п.3 путем постоянного поддержания актуальной даты, опираясь на ее изменение в основной (мастер или задающей) сущности. То есть при мердже основной, если у нее изменилась дата, перетаскиваем ее в нужную патицию и сразу перетаскиваем зависимые сущности в соответствующие их патиции, благо здесь дата и исходная таблица нам известна и времени это займет меньше. Тогда в дочерних сущностях от п.3 вообще можно отказаться и останутся только быстрые апдейт по id + дата и insert. Но в целом ...опа конечно.

...

Рейтинг:

0 / 0

15.07.2016, 12:23:12

| Ответить | Цитировать | Написать

Хардкорный мердж

#39274558

Egoр

Участник

Сообщения: 840

Рейтинг: 0 / 0

СноваОНевозможном,

Можно глянуть на ваши инстиадоф-триггера?

...

Рейтинг:

0 / 0

15.07.2016, 12:53:34

| Ответить | Цитировать | Написать

Хардкорный мердж

#39274570

СноваОНевозможном

Гость

EgoрМожно глянуть на ваши инстиадоф-триггера?
Самые самые обычные с параметризованным динскл, который по входящей дате инсертит(апдейтит) нужную таблицу вьюшки.

...

Рейтинг:

0 / 0

15.07.2016, 13:03:12

| Ответить | Цитировать | Написать

Хардкорный мердж

#39274726

Egoр

Участник

Сообщения: 840

Рейтинг: 0 / 0

СноваОНевозможном,

Обычно в триггере на апдейт есть два значения для каждого поля. старое и новое.
что мешает по старому значению id+start_date идентифицировать и таблицу и запись, которая апдейтится?

...

Рейтинг:

0 / 0

15.07.2016, 14:55:13

| Ответить | Цитировать | Написать

Хардкорный мердж

#39275187

СноваОНевозможном

Гость

EgoрОбычно в триггере на апдейт есть два значения для каждого поля. старое и новое.
что мешает по старому значению id+start_date идентифицировать и таблицу и запись, которая апдейтится?
Все так. Но речь о другом немного.
Как делается апдейт? Правильно сначала оракл ищет запись, которую надо обновить, т.е. условно выполняет селект. Так вот когда мы делаем апдейт и у нас есть только id (даты нет точнее есть, но она изменилась и по ней запись уже не найти), то идет скан индекса всех таблиц вьюшки. На этом этапе еще даже не попали в триггер и у нас нет ни олд, ни нью.
Вопрос был в том, как оптимизировать этот момент (хотя сам понимаю, что практически никак). В итоге логику переделал так, что от этого пункта вообще избавился во всяком случае на дочерних таблицах, что ощутимо ускорило процедуру мерджа.

То есть допустим, есть мастер-запись с id + дата.
К нам пришли новые записи (и новая мастер-запись и новые дочерние записи).
И у этих записей дата уже измененная, т.е. при апдейте по новым id+дата в текущих данных мы записи не найдем. Поэтому сначала обрабатываем записи мастер-таблицы и для тех, у которых изменилась дата ищем только по id и меняем ее и во всех дочерних записях других таблицах (с возможным переносом в соответсвующие "патишены"), благо на данном этапе мы знаем и старую и новую дату и делаться это будет быстро. А когда уже будем мерджить данные дочерних таблиц, то к этому моменту дата в них уже будет актуализирована на предыдущем этапе при мердже мастер-таблицы. В общем очевидный вариант получается, не сразу только пришел к этому.

...

Рейтинг:

0 / 0

17.07.2016, 10:17:09

| Ответить | Цитировать | Написать

10 сообщений из 10, страница 1 из 1

Форумы / Oracle [игнор отключен] [закрыт для гостей] / Хардкорный мердж

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=52&fpage=211&tid=1887874]:	0ms
get settings:	9ms
get forum list:	22ms
check forum access:	3ms
check topic access:	3ms
track hit:	37ms
get topic data:	10ms
get forum data:	2ms
get page messages:	50ms
get tp. blocked users:	1ms
others:	204ms

total:	341ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы