Оптимизация запроса на большой таблице ~ 40 GB / MySQL

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / MySQL [игнор отключен] [закрыт для гостей] / Оптимизация запроса на большой таблице ~ 40 GB

7 сообщений из 7, страница 1 из 1

Оптимизация запроса на большой таблице ~ 40 GB

#39272871

Serious Cat

Гость

Добрый день, друзья!

Есть таблица - 300 млн строк и размером ~40 GB

Простая структура [owner_id, Artist, Title] (список песен пользователей)

Нужно выбрать количество сопадений по песням (Artist+Title) для заданного пользователя @user_id со всеми остальными и вывести в формате [user_id:кол-во_совпадений]

На данный момент запрос такой:

SELECT d2.owner_id, COUNT(*) AS kolvo
FROM data d1
JOIN data d2 USING(Artist,Title)
WHERE d1.owner_id = @user_id
GROUP BY d1.owner_id

Индекы [Artist,Title] и [owner_id], движок InnoDB

Но с ростом таблицы пропорционально увеличивается время выполнения запроса и на данный момент он выполняется около минуты

Есть ли идеи как оптимизировать данную задачу на программном уровне?

Заранее большое спасибо!

...

Рейтинг:

0 / 0

13.07.2016, 10:50

| Ответить | Цитировать | Написать

Оптимизация запроса на большой таблице ~ 40 GB

#39272941

tanglir

Участник

Сообщения: 30 379

Рейтинг: 0 / 0

Serious CatНа данный момент запрос такой:

SELECT d2.owner_id, COUNT(*) AS kolvo
FROM data d1
JOIN data d2 USING(Artist,Title)
WHERE d1.owner_id = @user_id
GROUP BY d1.owner_idизвините за мой французский, начешуя?

Код: sql

1.
2.
3.

SELECT COUNT(distinct Artist,Title) AS kolvo 
FROM data d1 
WHERE d1.owner_id = @user_id

...

Рейтинг:

0 / 0

13.07.2016, 11:53

| Ответить | Цитировать | Написать

Оптимизация запроса на большой таблице ~ 40 GB

#39272944

tanglir

Участник

Сообщения: 30 379

Рейтинг: 0 / 0

или вам для каждого юзера надо получить совпадения со всеми остальными ? ну так тогда от фулскана(индексов, но они у вас тоже немаленькие) вам не уйти, как ни старайтесь.

...

Рейтинг:

0 / 0

13.07.2016, 11:55

| Ответить | Цитировать | Написать

Оптимизация запроса на большой таблице ~ 40 GB

#39273105

Serious Cat

Гость

tanglir, да, именно со всеми остальными...

...

Рейтинг:

0 / 0

13.07.2016, 14:14

| Ответить | Цитировать | Написать

Оптимизация запроса на большой таблице ~ 40 GB

#39273481

tanglir

Участник

Сообщения: 30 379

Рейтинг: 0 / 0

Serious Cat, хз, вроде бы оптимизировать уже нечего. Разве что... В групбае у вас опечатка или ошибка? По смыслу запроса должно быть d2.owner_id.

...

Рейтинг:

0 / 0

14.07.2016, 05:30

| Ответить | Цитировать | Написать

Оптимизация запроса на большой таблице ~ 40 GB

#39274443

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

tanglirSerious CatНа данный момент запрос такой:

SELECT d2.owner_id, COUNT(*) AS kolvo
FROM data d1
JOIN data d2 USING(Artist,Title)
WHERE d1.owner_id = @user_id
GROUP BY d1.owner_idизвините за мой французский, начешуя?

Код: sql

1.
2.
3.

SELECT COUNT(distinct Artist,Title) AS kolvo 
FROM data d1 
WHERE d1.owner_id = @user_id

запросы неверные, оба. первый почти правильный, нужен count distinct и правильная группировка. Правильная группировка заключается в том, что группировки вообще не нужно.

distinct возможно тоже не нужен в зависимости от того, какие совпадения считаем - у данного пользователя (нужен) или у других пользователей (не нужен).

...

Рейтинг:

0 / 0

15.07.2016, 11:44

| Ответить | Цитировать | Написать

Оптимизация запроса на большой таблице ~ 40 GB

#39274452

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

MasterZiv,
да, для оптимального выполнения
нужно два индекса, по owner, и по (artist, title)

при этом это будет потолок, лучше уже не будет.

хотя, если нужны дубликаты данного пользователя, можно чутка улучшить.

...

Рейтинг:

0 / 0

15.07.2016, 11:47

| Ответить | Цитировать | Написать

7 сообщений из 7, страница 1 из 1

Форумы / MySQL [игнор отключен] [закрыт для гостей] / Оптимизация запроса на большой таблице ~ 40 GB

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=47&msg=39272941&tid=1831576]:	0ms
get settings:	8ms
get forum list:	15ms
check forum access:	2ms
check topic access:	2ms
track hit:	163ms
get topic data:	9ms
get forum data:	2ms
get page messages:	51ms
get tp. blocked users:	1ms
others:	208ms

total:	461ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы