Повышение производительности запроса / Microsoft SQL Server

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Повышение производительности запроса

9 сообщений из 9, страница 1 из 1

Повышение производительности запроса

#38333118

DaniilSeryi

Участник

Сообщения: 621

Рейтинг: 0 / 0

Есть необходимость найти в таблице пары строк, у которых есть совпадения по значениям полей.
Первый вариант поиска - CROSS JOIN и условия отбора в Where, второй - INNER JOIN и аналогичный отсев во From.

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.

 Select A.ID, B.ID
From Table1 as A 
INNER JOIN
Table1 as B 
on  A.[ID]<>B.ID and
      (
A.[Number]=B.[Number] 
  or (A.[Date]=B.[Date] and A.[Authority] =B.[Authority])
  or (A.[TaxID]=B.[TaxID] and A.[DateProcurementID] =B.[DateProcurementID])
  or (A.Country=B.Country and A.[City] =B.[City] and A.[Street] =B.[Street])
  or (meta.hashname(a.[BorrowerName])=meta.hashname(B.[BorrowerName]))
  or (meta.hashname(a.[BorrowerNmeEnglish])=meta.hashname(B.[BorrowerNameEnglish]))
)

функция meta.hashname чистит строку от служебных символов - скобок, точек, запятых и прочего мусора...

В обоих случаях - и для CROSS JOIN, и для INNER JOIN получаю практически одинаковый план выполнения (см. рисунок) и один в один время выполнения - полторы минуты для таблицы в 373 строки.
Индекс - только Primary Key на поле ID.
Как можно ускорить процесс?

P.S. 2008 R2 (SP1) - 10.50.2811.0 (X64)

...

Рейтинг:

0 / 0

16.07.2013, 16:28

| Ответить | Цитировать | Написать

Повышение производительности запроса

#38333175

Гость333

Участник

Сообщения: 3 618

Рейтинг: 0 / 0

DaniilSeryiфункция meta.hashname чистит строку от служебных символов - скобок, точек, запятых и прочего мусора...
Покажите исходный код этой функции.

...

Рейтинг:

0 / 0

16.07.2013, 16:58

| Ответить | Цитировать | Написать

Повышение производительности запроса

#38333178

Shakill

Участник

Откуда: мск

Сообщения: 1 887

Рейтинг: 0 / 0

DaniilSeryiИндекс - только Primary Key на поле ID.
Как можно ускорить процесс?

можно хранить данные, которые должна возвращать функция meta.hashname
а в плане что-то вашего PK не видно

...

Рейтинг:

0 / 0

16.07.2013, 16:59

| Ответить | Цитировать | Написать

Повышение производительности запроса

#38333208

Гость333

Участник

Сообщения: 3 618

Рейтинг: 0 / 0

Shakillа в плане что-то вашего PK не видно
Очевидно, это PK по некластерному индексу.

...

Рейтинг:

0 / 0

16.07.2013, 17:14

| Ответить | Цитировать | Написать

Повышение производительности запроса

#38333217

DaniilSeryi

Участник

Сообщения: 621

Рейтинг: 0 / 0

Сделал совершенно по-другому - через Group by итогов Union ALL кучи запросов с раскиданными по этим запросам условиям OR. То есть FROM A.ID <>B.ID and одно из OR-условий в каждом запросе.
В итоге получилось меньше секунды вместо полутора минут.
Теперь на будущее только индексы создать осталось, как я понимаю, а то везде Table Scan, да Table Scan.

...

Рейтинг:

0 / 0

16.07.2013, 17:17

| Ответить | Цитировать | Написать

Повышение производительности запроса

#38333226

Shakill

Участник

Откуда: мск

Сообщения: 1 887

Рейтинг: 0 / 0

Гость333Shakillа в плане что-то вашего PK не видно
Очевидно, это PK по некластерному индексу.
нечасто приходится видеть таблицу с единственным индексом - некластерным pk

...

Рейтинг:

0 / 0

16.07.2013, 17:20

| Ответить | Цитировать | Написать

Повышение производительности запроса

#38333349

DaniilSeryi

Участник

Сообщения: 621

Рейтинг: 0 / 0

Собственно, в том и оставшийся вопрос, какие индексы по каким полям добавить?
Идея создать мегаиндекс по всем полям, участвовавшим в отборе, кроме ID, мне сразу не понравилась.
Теперь, когда для каждого запроса есть вменяемое число полей, по которым производится отбор, и при этом для каждого запроса в списке полей фигурирует поле ID, какие индексы делать?

P.S. Уточнил структуру таблицы - ID - не является индексом, только Identity.
P.P.S. вопрос Primary Key - будет следующим. Сейчас он составной из двух полей, и да, некластерный.

...

Рейтинг:

0 / 0

16.07.2013, 18:47

| Ответить | Цитировать | Написать

Повышение производительности запроса

#38334694

Mind

Участник

Откуда: Лучший город на Земле

Сообщения: 2 317

Рейтинг: 0 / 0

DaniilSeryiСобственно, в том и оставшийся вопрос, какие индексы по каким полям добавить?А какой запрос оптимизируем?

...

Рейтинг:

0 / 0

17.07.2013, 19:33

| Ответить | Цитировать | Написать

Повышение производительности запроса

#38335223

Crimean

Участник

Сообщения: 12 992

Рейтинг: 0 / 0

постройте хешфункцию по всем вашим полям сравнения
материализуйте результат
проиндексируйте, включая ИД в индекс
запрос будет теперь по равенству хешей и неравенству ИД, а "попавшее" уже дополнительно точно сравнить по значениям полей ибо коллизии хеша никто не отменял
будет быстро

...

Рейтинг:

0 / 0

18.07.2013, 11:14

| Ответить | Цитировать | Написать

9 сообщений из 9, страница 1 из 1

Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Повышение производительности запроса

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=46&gotonew=1&tid=1706101]:	0ms
get settings:	12ms
get forum list:	16ms
check forum access:	4ms
check topic access:	4ms
track hit:	45ms
get topic data:	14ms
get first new msg:	9ms
get forum data:	3ms
get page messages:	59ms
get tp. blocked users:	2ms
others:	242ms

total:	410ms