Сравнить 2 большие таблицы по PK ?? / Microsoft SQL Server

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Сравнить 2 большие таблицы по PK ??

10 сообщений из 10, страница 1 из 1

Сравнить 2 большие таблицы по PK ??

#40010053

teCa

Участник

Сообщения: 1 075

Рейтинг: 0 / 0

Всем привет.
Подскажите, как лучше сравнить 2 большие таблицы (1.8млрд) по PK?

Есть 2 таблицы, из одной переносились данные в копию разными методами (триггер+insert into), хочу проверить, не потерялись ли при переносе какие то строки. Возможно ли на таком массиве выявить, каких ID недостает в таблице получателе?

...

Рейтинг:

0 / 0

20.10.2020, 03:52

| Ответить | Цитировать | Написать

Сравнить 2 большие таблицы по PK ??

#40010054

fkthat

Участник

Сообщения: 3 601

Рейтинг: 0 / 0

Код: sql

1.
2.
3.
4.

select c1.id from
  customers1 c1 left outer join customers2 c2
   on c1.id = c2.id
  where c2.id is null

...

Рейтинг:

0 / 0

20.10.2020, 04:22

| Ответить | Цитировать | Написать

Сравнить 2 большие таблицы по PK ??

#40010124

teCa

Участник

Сообщения: 1 075

Рейтинг: 0 / 0

fkthat,

Сколько по времени данная конструкция обработает такой объём?

...

Рейтинг:

0 / 0

20.10.2020, 11:43

| Ответить | Цитировать | Написать

Сравнить 2 большие таблицы по PK ??

#40010132

felix_ff

Участник

Откуда: Moscow

Сообщения: 1 982

Рейтинг: 0 / 0

teCa,

на таких объемах может достаточно долго.

я бы написал так:

Код: sql

select c1.id from customers1 c1 where not exists (select 1 from customers2 c2 where c2.id = c1.id)

что бы добиться оператора MJ:right anti semi join

иначе у вас может получиться план где будет соединение слиянием с последующим оператором фильтра по c2.id is null

...

Рейтинг:

0 / 0

20.10.2020, 12:17

| Ответить | Цитировать | Написать

Сравнить 2 большие таблицы по PK ??

#40010165

fkthat

Участник

Сообщения: 3 601

Рейтинг: 0 / 0

felix_ff,

На миллионе записей:

Как видно цена фильтрации невысока на самом деле.

...

Рейтинг:

0 / 0

20.10.2020, 15:02

| Ответить | Цитировать | Написать

Сравнить 2 большие таблицы по PK ??

#40010168

fkthat

Участник

Сообщения: 3 601

Рейтинг: 0 / 0

felix_ff,

Впрочем, судя по планам, твой вариант пошустрее должен быть.

...

Рейтинг:

0 / 0

20.10.2020, 15:28

| Ответить | Цитировать | Написать

Сравнить 2 большие таблицы по PK ??

#40010173

felix_ff

Участник

Откуда: Moscow

Сообщения: 1 982

Рейтинг: 0 / 0

fkthat,

на мелких объемах разницы видно не будет. + важным фактором является как раз количество отсутствующих строк во второй таблице.

если скажем в обоих таблицах по 2 лярда, а разница между строками ~100k, то оба запроса в плане потребления ресурсов будут почти идентичны.
а вот если разница будет большой, к примеру ~овер 10 лямов строк, то тогда план с оператором фильтра потребит больше циклов CPU

...

Рейтинг:

0 / 0

20.10.2020, 15:36

| Ответить | Цитировать | Написать

Сравнить 2 большие таблицы по PK ??

#40010174

Владислав Колосов

Участник

Сообщения: 9 447

Рейтинг: 0 / 0

Есть смысл попробовать вариант с EXCEPT, он работает вполне сносно при сверке крупных массивов данных.

...

Рейтинг:

0 / 0

20.10.2020, 15:36

| Ответить | Цитировать | Написать

Сравнить 2 большие таблицы по PK ??

#40010178

felix_ff

Участник

Откуда: Moscow

Сообщения: 1 982

Рейтинг: 0 / 0

Владислав Колосов,

вот кстати хорошая статья по сравнению
https://sqlperformance.com/2012/12/t-sql-queries/left-anti-semi-join

...

Рейтинг:

0 / 0

20.10.2020, 15:49

| Ответить | Цитировать | Написать

Сравнить 2 большие таблицы по PK ??

#40010220

teCa

Участник

Сообщения: 1 075

Рейтинг: 0 / 0

felix_ff

teCa,

на таких объемах может достаточно долго.

я бы написал так:

Код: sql

select c1.id from customers1 c1 where not exists (select 1 from customers2 c2 where c2.id = c1.id)

Воспользовался этим вариантом, сравнилось за 22 минуты, более чем хорошо. Выявил 650 тысяч отсутствующих строк.

...

Рейтинг:

0 / 0

20.10.2020, 16:53

| Ответить | Цитировать | Написать

10 сообщений из 10, страница 1 из 1

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Сравнить 2 большие таблицы по PK ??

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=46&gotonew=1&tid=1685515]:	0ms
get settings:	9ms
get forum list:	14ms
check forum access:	3ms
check topic access:	3ms
track hit:	138ms
get topic data:	11ms
get first new msg:	7ms
get forum data:	5ms
get page messages:	57ms
get tp. blocked users:	1ms
others:	239ms

total:	487ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы