Анализ запроса DISTINCT, GROUP BY / MySQL

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / MySQL [игнор отключен] [закрыт для гостей] / Анализ запроса DISTINCT, GROUP BY

3 сообщений из 3, страница 1 из 1

Анализ запроса DISTINCT, GROUP BY

#39121319

devKP

Гость

Версия MySQL: 5.6.27

Задача: вывести список уникальных пар id с одинаковыми title.

Есть таблица(упрощенная версия):

Код: sql

1.
2.
3.
4.
5.

CREATE TABLE `items` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,
  `title` varchar(255) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=201109 DEFAULT CHARSET=utf8;

Реализовал два решения и пытаюсь разобраться почему одно работает быстрее другого. Если есть другие решения так же бы на них посмотрел. Дополнительные индексы добавлять не надо.

1ый запрос:

Код: sql

1.
2.
3.
4.
5.

SELECT g.id, gs.id 
    FROM item i 
    JOIN item im ON i.title = im.title AND i.id != im.id 
    GROUP BY LEAST(i.id, im.id), GREATEST(i.id, im.id) 
    ORDER BY NULL;

Код: javascript

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.

{
  "query_block": {
    "select_id": 1,
    "ordering_operation": {
      "using_filesort": false,
      "grouping_operation": {
        "using_temporary_table": true,
        "using_filesort": false,
        "nested_loop": [
          {
            "table": {
              "table_name": "i",
              "access_type": "ALL",
              "rows": 106,
              "filtered": 100
            }
          },
          {
            "table": {
              "table_name": "im",
              "access_type": "ALL",
              "rows": 106,
              "filtered": 100,
              "using_join_buffer": "Block Nested Loop",
              "attached_condition": "((`tmp_login`.`im`.`name` = `tmp_login`.`i`.`name`) and (`tmp_login`.`i`.`id` <> `tmp_login`.`im`.`id`))"
            }
          }
        ]
      }
    }
  }
}

2ой запрос:

Код: sql

1.
2.
3.
4.

SELECT DISTINCT LEAST(i.id, im.id) , GREATEST(i.id, im.id) 
    FROM  `items` i
    JOIN  `items` im ON i.title = im.title
    AND i.id != im.id

Код: javascript

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.

{
  "query_block": {
    "select_id": 1,
    "duplicates_removal": {
      "using_temporary_table": true,
      "using_filesort": false,
      "nested_loop": [
        {
          "table": {
            "table_name": "i",
            "access_type": "ALL",
            "rows": 106,
            "filtered": 100
          }
        },
        {
          "table": {
            "table_name": "im",
            "access_type": "ALL",
            "rows": 106,
            "filtered": 100,
            "using_join_buffer": "Block Nested Loop",
            "attached_condition": "((`tmp_login`.`im`.`name` = `tmp_login`.`i`.`name`) and (`tmp_login`.`i`.`id` <> `tmp_login`.`im`.`id`))"
          }
        }
      ]
    }
  }
}

Теперь непосредственно к вопросу:
Как можно обьяснить, что 2ой запрос работает быстрее? Где можно почитать про расшифровку explain'a в формате json? Возможно есть более оптимальный путь решения этой задачи?

Если посмотреть на простой explain, то они одинаковые и сделать вывод почему один быстрее другого сделать сложно(во всяком случае мне). А как этот вывод сделать из формата json я пока не совсем понимаю. Интересно было бы понять, что происходит под капотом. Возможно ответ находится в описание distinct, group by, temporary table, количестве данных в этой таблице? Не понятно для меня так же почему в 2ом запросе с DISTINCT используется временная таблица( https://docs.oracle.com/cd/E17952_01/refman-5.6-en/internal-temporary-tables.html ).

Буду рад любым ответам, спасибо!

...

Рейтинг:

0 / 0

05.12.2015, 14:06:00

| Ответить | Цитировать | Написать

Анализ запроса DISTINCT, GROUP BY

#39121398

Akina

Участник

Откуда: Зеленоград, Москва, Россия

Сообщения: 20 644

Рейтинг: 0 / 0

devKP

Код: sql

AND i.id != im.id

Можно использовать строгое "меньше" (или "больше"). Заодно избавишься и от LEAST/GREATEST, и от DISTINCT...

...

Рейтинг:

0 / 0

05.12.2015, 17:38:48

| Ответить | Цитировать | Написать

Анализ запроса DISTINCT, GROUP BY

#39121441

devKP

Гость

Akina, Спасибо! Хороший вариант.

...

Рейтинг:

0 / 0

05.12.2015, 18:59:06

| Ответить | Цитировать | Написать

3 сообщений из 3, страница 1 из 1

Форумы / MySQL [игнор отключен] [закрыт для гостей] / Анализ запроса DISTINCT, GROUP BY

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=47&msg=39121398&tid=1832409]:	0ms
get settings:	11ms
get forum list:	31ms
check forum access:	4ms
check topic access:	4ms
track hit:	55ms
get topic data:	10ms
get forum data:	2ms
get page messages:	38ms
get tp. blocked users:	1ms
others:	242ms

total:	398ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы