Медленный запрос для 2 больших таблиц / PostgreSQL

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Медленный запрос для 2 больших таблиц

10 сообщений из 10, страница 1 из 1

Медленный запрос для 2 больших таблиц

#39667885

polin11

Гость

Есть 2 таблицы Table1 (1 млн записей) и Тable2 (10 млн записей)
Свзяь между таблицами один ко многим.
Нужно вытащить определнное колчичество записей, например 100 из Table1,
следующим запросом:

Код: sql

1.
2.
3.
4.
5.
6.

SELECT *
FROM Table1
WHERE Field1 IN (SELECT Field1 FROM Table2  WHERE Field2 = 'val1' GROUP BY Field1 )
AND Field2='val2'
ORDER BY Field3
LIMIT 100

Можно переписать так:

Код: sql

1.
2.
3.
4.
5.
6.
7.
8.

SELECT *
FROM Table1
INNER JOIN Table2 ON Table1.Field1=Table2.Field1
WHERE Table2.Field2 = 'val1'
AND Table1.Field2='val2'
GROUP BY Table1.Field1
ORDER BY Table1.Field3
LIMIT 100

Но оба запроса выполняются медленно.
Хочется из вложенного запроса делать выборку не всей таблицы Table2 по фильтру Field2 = 'val1',
а только 100 записей, например

Код: sql

1.
2.
3.
4.
5.

SELECT *
FROM Table1
WHERE Field1 IN (SELECT Field1 FROM Table2  WHERE Field2 = 'val1' GROUP BY Field1 LIMIT 100)
AND Field2='val2'
ORDER BY Field3

но так как есть условие Table1.Field2='val2', то этот запрос неверный. Может есть
стандартное решение аналогичной проблемы?

...

Рейтинг:

0 / 0

30.06.2018, 18:46

| Ответить | Цитировать | Написать

Медленный запрос для 2 больших таблиц

#39667892

Maxim Boguk

Участник

Откуда: Melbourne, Австралия

Сообщения: 5 148

Рейтинг: 0 / 0

polin11,

Для начала уберите GROUP BY в первом запросе и покажите какой план получается.
Ну и скорее всего будет нужен индекс на Table1(Field2, Field3)

--
Maxim Boguk
лучшая поддержка PostgreSQL: dataegret.ru

...

Рейтинг:

0 / 0

30.06.2018, 19:57

| Ответить | Цитировать | Написать

Медленный запрос для 2 больших таблиц

#39667913

polin11

Гость

Maxim Boguk,

Пока не хочу затрагивать вопрос индексов, меня интересует вопрос возможного улучшения самого запроса.
Для подзапроса в первом запросе мне нужно уникальные Table2.Field1, если убрать GROUP BY, тогда нужно написать DISTINCT в начало подзапроса

...

Рейтинг:

0 / 0

30.06.2018, 22:30

| Ответить | Цитировать | Написать

Медленный запрос для 2 больших таблиц

#39667919

Maxim Boguk

Участник

Откуда: Melbourne, Австралия

Сообщения: 5 148

Рейтинг: 0 / 0

polin11Для подзапроса в первом запросе мне нужно уникальные Table2.Field1, если убрать GROUP BY, тогда нужно написать DISTINCT в начало подзапроса

Интересная мысль. Обоснуйте почему?
Если можно с ссылкой на SQL стандарт или документацию.

PS: что значит улучшение самого запроса?? если улучшения возможные зависят от доступных индексов и только от них.

--
Maxim Boguk
лучшая поддержка PostgreSQL: dataegret.ru

...

Рейтинг:

0 / 0

30.06.2018, 22:45

| Ответить | Цитировать | Написать

Медленный запрос для 2 больших таблиц

#39667923

polin11

Гость

Maxim Boguk,

Если при наличии предложения GROUP BY, в предложении SELECT отсутствуют агрегатные функции, то запрос просто вернет по одной строке из каждой группы. Эту возможность, наряду с ключевым словом DISTINCT, можно использовать для исключения дубликатов строк в результирующем наборе.
http://www.sql-tutorial.ru/ru/book_group_by_clause.html

Под словами улучшения структуры запроса, возможно вместо IN использовать EXISTS, либо другие варианты. Если это не возможно буду думать про индексы

...

Рейтинг:

0 / 0

30.06.2018, 22:58

| Ответить | Цитировать | Написать

Медленный запрос для 2 больших таблиц

#39667924

qwwq

Участник

Сообщения: 2 880

Рейтинг: 0 / 0

polin11Maxim Boguk,

Пока не хочу затрагивать вопрос индексов, меня интересует вопрос возможного улучшения самого запроса.
Для подзапроса в первом запросе мне нужно уникальные Table2.Field1, если убрать GROUP BY, тогда нужно написать DISTINCT в начало подзапроса

йа худею, дорогая редакция.

а о кардинальностях речь тоже пока не ко двору ?

при соотв. инд-ах и кардинальностях просится екзист вместо угробища с групбаем.
+ тонкости одербаев с лимитами при наличии фильтров. всё завязывается на индексы.

при других условиях -- может и групбай в цте не повредить. и фуллскан. раз уж без индексов.

...

Рейтинг:

0 / 0

30.06.2018, 23:00

| Ответить | Цитировать | Написать

Медленный запрос для 2 больших таблиц

#39667925

qwwq

Участник

Сообщения: 2 880

Рейтинг: 0 / 0

polin11Maxim Boguk,

Если при наличии предложения GROUP BY, в предложении SELECT отсутствуют агрегатные функции, то запрос просто вернет по одной строке из каждой группы. Эту возможность, наряду с ключевым словом DISTINCT, можно использовать для исключения дубликатов строк в результирующем наборе.
http://www.sql-tutorial.ru/ru/book_group_by_clause.html

Под словами улучшения структуры запроса, возможно вместо IN использовать EXISTS, либо другие варианты. Если это не возможно буду думать про индексы

вы не ответили на вопрос максима. "нужно" и "хотелось бы" -- сыршенно разные математические конструкции.

вы написали выше "нужно" -- т.е. "необходимо", но для конструкции с "ИН" такой необходимости нет.

...

Рейтинг:

0 / 0

30.06.2018, 23:05

| Ответить | Цитировать | Написать

Медленный запрос для 2 больших таблиц

#39667926

polin11

Гость

qwwq,
У таблиц бинарная связь с показателем кардинальности "один ко многим" (1:М).
Table1.Field1 - Pk
Table2.Field1 - Fk

...

Рейтинг:

0 / 0

30.06.2018, 23:07

| Ответить | Цитировать | Написать

Медленный запрос для 2 больших таблиц

#39667931

Maxim Boguk

Участник

Откуда: Melbourne, Австралия

Сообщения: 5 148

Рейтинг: 0 / 0

polin11Maxim Boguk,

Если при наличии предложения GROUP BY, в предложении SELECT отсутствуют агрегатные функции, то запрос просто вернет по одной строке из каждой группы. Эту возможность, наряду с ключевым словом DISTINCT, можно использовать для исключения дубликатов строк в результирующем наборе.
http://www.sql-tutorial.ru/ru/book_group_by_clause.html

Как то не очевидно каким боком это связано с IN.
Чем вам дубликаты внутри IN то мешают?
Я спросил зачем вам "Для подзапроса в первом запросе мне нужно уникальные Table2.Field1"?

PS: на всякий случай подсказка - "GROUP BY Field1" с очень хорошими шансами вам делает запрос СИЛЬНО медленнее.

--
Maxim Boguk
лучшая поддержка PostgreSQL: dataegret.ru

...

Рейтинг:

0 / 0

30.06.2018, 23:31

| Ответить | Цитировать | Написать

Медленный запрос для 2 больших таблиц

#39667978

qwwq

Участник

Сообщения: 2 880

Рейтинг: 0 / 0

polin11qwwq,
У таблиц бинарная связь с показателем кардинальности "один ко многим" (1:М).
Table1.Field1 - Pk
Table2.Field1 - Fk

кардинальность :
автор для конечного множества понятие мощности совпадает с привычным понятием количества .

тут за реальные числа в конечных множествах и их числовые соотношения трут, а не за эфемерные типы связей

/*от цифири зависит оптимальность того или иного

...

Рейтинг:

0 / 0

01.07.2018, 12:12

| Ответить | Цитировать | Написать

10 сообщений из 10, страница 1 из 1

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Медленный запрос для 2 больших таблиц

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=53&msg=39667892&tid=1995693]:	0ms
get settings:	7ms
get forum list:	14ms
check forum access:	3ms
check topic access:	3ms
track hit:	162ms
get topic data:	9ms
get forum data:	2ms
get page messages:	50ms
get tp. blocked users:	1ms
others:	204ms

total:	455ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы