Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Добрый день, Есть такой запрос: Код: sql 1. 2. pkey в данном случае ключ по которому таблица партицированна. Всего партиций 15000. Если запустить подобный запрос на не партицированной таблице: Код: sql 1. 2. То время исполнения (из Джава приложения) в два-три раза ниже: 170ms вместо 400-500. Но при этом у первого запроса в реальном плане исполнения Estimated subtree cost = 0.073 а у вторго 0.1366 Почему более низкая стоимость запроса не транслируется в более короткое время исполнения? Спасибо. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.10.2019, 11:20 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Roust_mПочему более низкая стоимость запроса не транслируется в более короткое время исполнения? потому что стоимость плана это не время исполнения. Не говоря уже, что это Estimated Покажите планы ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.10.2019, 11:43 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Roust_m, вы смотрите на предполагаемый план, смотрите на фактический. Сравните, например, объем просмотренных данных в том и ином случае. Например, для второй таблицы есть индекс по ID и вы получите seek, а в первой таблице индекса нет и получите просмотр секции. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.10.2019, 11:44 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Вот план по партицированной таблице. Ниже добавлю второй план по непартицированной По идее вся суть партицирования это зверски улучшить скорость чтения когда ты знаешь в какой партиции ищещь. А получается наоборот, улучшение в непартицированной таблице. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 02:41 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Вот непартицированная таблица ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 02:41 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Roust_mПо идее вся суть партицирования это зверски улучшить скорость чтения когда ты знаешь в какой партиции ищещьТот евангелист, который вам это в уши напел, вас злостно обманул. Index seek по индексу даже с невероятной глубиной в 8-9 уровней уделает любой скан по партиции, если нет нормального seek predicate после elimination. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 02:46 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Модератор: Короче, уважаемый Roust_m. Давайте так. Или вы предоставляете скрипты ваших таблиц, ваши запросы и нормальные планы (обфусцируйте уж как-нибудь), или я к вам за троллинг санкции применю. А то вот сначала эти эпатажные вбросы в двух топиках, что секционирование вам все замедлило, а потом выясняется, что всего лишь у разных ваших запросов к разным вашим таблицам разный план. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 02:54 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Модератор: Еще раз русскими буквами: скрипты таблиц с индексами (в текстовом виде), запросы к этим таблицам (в текстовом виде), планы этих запросов (в текстовом виде или в виде sqlplan-файлов). Cкриншоты будут стираться на месте. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 03:15 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Вот скрипт партицированной таблицы. Там 15000 партиций. Ключ pkey есть функция от st_id: st_id % 14999 + 1 Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 03:25 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Вот непартицированная таблица: Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 03:33 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
У вас вторые некластерные индексы UX_mypartitionedtable / UX_my_not_partitionedtable вообще не идентичны если убрать ключ секционирования. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 03:35 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Вот запрос в партицированной таблице: Код: sql 1. А это к непратицированной: Код: sql 1. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 03:37 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Удивительно, что хоть где-то index seek... Чтобы было быстро выбирать все поля по sid, надо сделать индекс по (sid) include (все остальные поля, кроме ключей кластерного индекса). А секционирование уберите. В вашем случае оно разве что могло бы быть похоже на борьбу с latch contention, которого, скорее всего, у вас и в помине нет. Рано еще оно вам. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 03:43 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Гавриленко Сергей АлексеевичУ вас вторые некластерные индексы UX_mypartitionedtable / UX_my_not_partitionedtable вообще не идентичны если убрать ключ секционирования. Хоть этот индекс и не используется, исправил, теперь непратицированная таблица выглядит так. (ниже). Непратицированная таблица по прежнему гораздо быстрее по времени. Щас зашишрую немного имена объектов и выложу планы. Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 03:56 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Гавриленко Сергей АлексеевичУдивительно, что хоть где-то index seek... Чтобы было быстро выбирать все поля по sid, надо сделать индекс по (sid) include (все остальные поля, кроме ключей кластерного индекса). А секционирование уберите. В вашем случае оно разве что могло бы быть похоже на борьбу с latch contention, которого, скорее всего, у вас и в помине нет. Рано еще оно вам. Предполагалось, что таблица будет зверски расти и число одновременных пользователей тоже будет сильно расти. База в стадии дизайна, какие запросы будут к ней до конца неизвестно. Большая часть запросов герерится Джавой (там есть какая-то автоматическая приблуда для этого). В редких случаях, когда совсем никак эти запросы выносятся в хранимую процедуру, остальное автоматом, чтобы ускорить время разработки. Повлиять я на это не могу. Еще один момент, который учитывался при решении применить секционирование, это то, что большинство запросов используют st_id или он известен. Поскольку диапазон st_id около миллиона, то, создали pkey, который есть остаток от деления st_id на 14999 плюс 1. То есть предполагалось, что все данные для одного и того-же студента будут в одной партиции. На данный момент в партиции с pkey=13707 всего 353 записи, из которых выбирается 31 запись. В непартицированной таблице 5843430 записей, из которых выбирается 52. Я не понимаю, почему выбрать 31 запись из 353 занимает больше времени, чем выбрать 52 записи из почти 6-ти миллионов. Я теряю веру в технологический прогресс и вообще во все человечество. Решение убрать секционирование не очень простое, ибо это может затронуть другие запросы. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 04:16 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Гавриленко Сергей АлексеевичУдивительно, что хоть где-то index seek... Чтобы было быстро выбирать все поля по sid, надо сделать индекс по (sid) include (все остальные поля, кроме ключей кластерного индекса). Разные запросы будут использовать разные поля, то есть придется создать индекс по sid и включить туда почти все поля в таблице. Если следовать этому подходу и для других запросов, то размер индексов будет огромен, что замедлит вставку данных в таблицу а также изменение данных. Палка о двух конца. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 04:40 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Вот зашифрованный план по партицированной таблице. Очень желательно найти способ сделать так, чтобы это работало быстро на партицированной таблице. Убирать партицирование будет означать проблемы в других местах. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 04:56 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Владислав КолосовRoust_m, вы смотрите на предполагаемый план, смотрите на фактический. Сравните, например, объем просмотренных данных в том и ином случае. Например, для второй таблицы есть индекс по ID и вы получите seek, а в первой таблице индекса нет и получите просмотр секции. В обеих таблицах есть индекс по ID (sid), в партицированной таблице он тоже партицирован, однако же в партицированной таблице такой индекс не используется и происходит скан по кластерному индексу. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 05:18 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Roust_m Большая часть запросов герерится Джавой (там есть какая-то автоматическая приблуда для этого). В редких случаях, когда совсем никак эти запросы выносятся в хранимую процедуру, остальное автоматом, чтобы ускорить время разработки. Повлиять я на это не могу. как это знакомо, а вот теперь огребаем по полной. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 05:53 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Roust_m, партиционирование это в основном для удобства обслуживания, а не для ускорения запросов ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 09:49 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Roust_m, у вас на плане просмотр секционированной таблицы и поиск в индексе по несекционированной. Отсюда и разница. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 11:27 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Roust_m, сканирование может происходить в результате несоблюдения приоритета типов или самих типов передаваемого в запрос параметра и аргумента функции секционирования. И да, секционирование не всегда имеет смысл создавать для сокращения времени запросов. Нельзя утверждать, что оно предназначено именно для обслуживания, его назначение MS как раз и определяет как "средство, позволяющее ускорить выполнения запросов при больших размерах таблиц" в учебных курсах, например. Однако, они не рассматривают подробно сценарии, применимые для таких практик, поэтому возникает ощущение, что так следует делать всегда на любых больших таблицах. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 11:36 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Roust_mВот зашифрованный план по партицированной таблицеПокажите план для Код: sql 1. 2. 3. ЗЫ: Анонимайзер планов есть в SentryOne Plan Explorer ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 14:00 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Roust_mЯ не понимаю, почему выбрать 31 запись из 353 занимает больше времени, чем выбрать 52 записи из почти 6-ти миллионов. Я теряю веру в технологический прогресс и вообще во все человечество. В управдомы вам, батенька, надо переквалифицироваться. Иначе бы знали, что выборка по уникальному индексу из индексированной таблицы от размеров таблицы, практически, не зависит. Или другими словами: бесполезно ожидать ускорения выборки от партиционирования. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 15:57 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
aleks222, авторИли другими словами: бесполезно ожидать ускорения выборки от партиционирования. деградацию так точно стоит ожидать ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 15:58 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Владислав Колосовего назначение MS как раз и определяет как "средство, позволяющее ускорить выполнения запросов при больших размерах таблиц" Поздравляю вас, соврамши. Нигде, никогда MS такого не обещала. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 15:59 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
aleks222Владислав Колосовего назначение MS как раз и определяет как "средство, позволяющее ускорить выполнения запросов при больших размерах таблиц" Поздравляю вас, соврамши. Нигде, никогда MS такого не обещала.На некоторых сценариях, связанных со сканами, выигрыш все-таки есть. И этот выигрыш особенно ощутим, если можно при этом сэкономить на индексе. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 16:06 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
автор ускорить выполнения запросов при больших размерах таблиц удалять хорошо, обслуживать индексы, иногда вставкоу разруливают.. В общем как и сказали это чисто административная штука, не для селектов :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 16:07 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
aleks222, Вы сочиняете, а MS пишет в справке раздел Секционированные таблицы и индексы: Можно повысить скорость выполнения запросов в зависимости от запросов, которые часто выполняются в вашей конфигурации оборудования. Например, оптимизатор запросов может быстрее выполнять запросы на эквисоединение двух и более секционированных таблиц, если в этих таблицах одни и те же столбцы секционирования, потому что можно соединить сами секции. Замечу, что в другом случае, выигрыш производительности получаем при HASH JOIN соединении, т.к. запрос может просмотреть не весь объём данных, а только одну секцию при подборе строк для сравнения. В случае выбора SEEK стратегии разделение на секции не дает преимуществ. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 17:45 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Владислав Колосовaleks222, Вы сочиняете, а MS пишет в справке раздел Секционированные таблицы и индексы: Можно повысить скорость выполнения запросов в зависимости от запросов, которые часто выполняются в вашей конфигурации оборудования. Например, оптимизатор запросов может быстрее выполнять запросы на эквисоединение двух и более секционированных таблиц, если в этих таблицах одни и те же столбцы секционирования, потому что можно соединить сами секции. Замечу, что в другом случае, выигрыш производительности получаем при HASH JOIN соединении, т.к. запрос может просмотреть не весь объём данных, а только одну секцию при подборе строк для сравнения. В случае выбора SEEK стратегии разделение на секции не дает преимуществ.По моему, диапазон кластерного индекса даст то же самое. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 22:13 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
alexeyvgПо моему, диапазон кластерного индекса даст то же самое.Тут рассказывают про то, что в некоторых случаях можно секционированием избежать создания дополнительного индекса. Есть ситуации, когда сканить пару необольших секций терпимо, а делать индекс ради ускорения этого дофига накладно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2019, 22:38 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Гавриленко Сергей АлексеевичalexeyvgПо моему, диапазон кластерного индекса даст то же самое.Тут рассказывают про то, что в некоторых случаях можно секционированием избежать создания дополнительного индекса. Есть ситуации, когда сканить пару необольших секций терпимо, а делать индекс ради ускорения этого дофига накладно.Так секционирование концептуально то же самое, что и кластерный индекс по тому же полю, что и поле секционирования. Индекс не дополнительный, а один, заменяющий секционирование. Для постоянной вставки в секции ещё можно увидеть преимущества секционирования, но для стабильных данных я их не вижу, будет такой же "скан пары небольших секций". Конечно, есть какие то совсем особые случаи, как описал Владислав Колосов, но это всё таки совсем редкость, на практике... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.10.2019, 00:48 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
invmRoust_mВот зашифрованный план по партицированной таблицеПокажите план для Код: sql 1. 2. 3. ЗЫ: Анонимайзер планов есть в SentryOne Plan Explorer Спасибо за подсказку, я предыдущий руками анонимизровал, прилагаю план. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2019, 04:17 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
А вот такой же план по не партицированной таблице. Стоимость дерева похожа, а время выполнения все равно быстрее в не партицированной таблице. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2019, 04:25 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Не знаю, как там у антиподов, в австралии. А в посконной завсегда поиск по ДВУМ полям ключа дольше, чем по одномую ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2019, 06:27 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Roust_mСтоимость дерева похожа, а время выполнения все равно быстрее в не партицированной таблице.Стоимость - это большая условность, вычисляется исходя из, например, определённой скорости HDD. А время выполнения разных запросов может быть разная, что тут удивительного? Они даже разное количество строк возвращают. Хотя вроде бы смотрим разницу одинаковых запросов на одинаковых данных, и разница должна быть только в партицировании. Далее, если вы ищете по sid: Roust_minvmПокажите план для Код: sql 1. 2. 3. ЗЫ: Анонимайзер планов есть в SentryOne Plan Explorer Спасибо за подсказку, я предыдущий руками анонимизровал, прилагаю план.В плане написано INDEX(Column1) ... WHERE Column2=... AND Column3=... Это ошибка анонимайзера, или ваша? Вроде индекс должен быть по той же колонке, по которой вы ищите (то есть по sid)? И третье, вам уже писали, повторю ещё раз - если у вас есть индекс по полю, сервер идёт по этому дереву, достаёт записи, какое преимущество будет, если ему указать партицию? Он всё равно считает те страницы данных, которые нашёл. Если бы сервер понял, что выгоднее скан, поскольку селективность индекса низкая, то понятно, можно отсканить одну партицию, но если делается поиск, то почему вы ожидаете ускорение? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2019, 08:15 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
alexeyvgRoust_mСтоимость дерева похожа, а время выполнения все равно быстрее в не партицированной таблице.Стоимость - это большая условность, вычисляется исходя из, например, определённой скорости HDD. А время выполнения разных запросов может быть разная, что тут удивительного? Они даже разное количество строк возвращают. Хотя вроде бы смотрим разницу одинаковых запросов на одинаковых данных, и разница должна быть только в партицировании. Далее, если вы ищете по sid: Roust_mпропущено... Спасибо за подсказку, я предыдущий руками анонимизровал, прилагаю план.В плане написано INDEX(Column1) ... WHERE Column2=... AND Column3=... Это ошибка анонимайзера, или ваша? Вроде индекс должен быть по той же колонке, по которой вы ищите (то есть по sid)? И третье, вам уже писали, повторю ещё раз - если у вас есть индекс по полю, сервер идёт по этому дереву, достаёт записи, какое преимущество будет, если ему указать партицию? Он всё равно считает те страницы данных, которые нашёл. Если бы сервер понял, что выгоднее скан, поскольку селективность индекса низкая, то понятно, можно отсканить одну партицию, но если делается поиск, то почему вы ожидаете ускорение? Это ошибка анонимайзера, на самом деле там и индекс и один из столбцов по sid. Я пытаюсь понять как можно сервер заставить сканировать одну партицию, или другим способом заставить запрос работать быстрее. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2019, 08:36 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Roust_mЯ пытаюсь понять как можно сервер заставить сканировать одну партицию, или другим способом заставить запрос работать быстрее.Что бы заставить сервер сканировать одну партицию, нужно убрать те индексы, которые позволяют серверу быстро получить данные. тогда сервер свалится в скан. Попробую объяснить ещё раз. Вот у вас есть индекс, там указано, что ваши данные находятся на диске в секторе № 123321 Сервер читает сектор 123321, готово! Далее, вы задаёте вопрос: "как можно сервер заставить сканировать одну партицию" Вы понимаете, что такой вопрос абсурден, в контексте задачи "прочитать сектор 123321"? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2019, 08:57 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Roust_m, План со сканом секции банально дешевле плана с поиском в секции индекса. Стоимость плана с несекционированным индексом аналогична плану с секционированным. Можете ради интереса попробовать Код: sql 1. 2. 3. Учитывая, что у вас бета 2019-го сервера, не вижу смысла в дальнейших разбирательствах. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2019, 09:23 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
alexeyvgRoust_mЯ пытаюсь понять как можно сервер заставить сканировать одну партицию, или другим способом заставить запрос работать быстрее.Что бы заставить сервер сканировать одну партицию, нужно убрать те индексы, которые позволяют серверу быстро получить данные. тогда сервер свалится в скан. Попробую объяснить ещё раз. Вот у вас есть индекс, там указано, что ваши данные находятся на диске в секторе № 123321 Сервер читает сектор 123321, готово! Далее, вы задаёте вопрос: "как можно сервер заставить сканировать одну партицию" Вы понимаете, что такой вопрос абсурден, в контексте задачи "прочитать сектор 123321"? Ну контекст задачи немного шире. Еще одной целью партицирования было собрать все записи по одному и тому же студенту в одной партиции, вместо того, чтобы им быть разбросанными по всей таблице. У одного студента может быть несколько sid. Но pkey есть функция от id студента (st_id). В приложении этот запрос не единственный, поэтому задача заставить это запрос работать на секционированной таблице как можно быстрее. Это на не секционрованной таблице по этому запросу есть индекс где указано, что данные находятся в секторе № 123321. А на секционированной так не получется. Но поскольку секционирование в нашем случае нужно (IMHO), то приодится искать компромисы. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2019, 10:14 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
[quot Roust_m]alexeyvgЕще одной целью партицирования было собрать все записи по одному и тому же студенту в одной партиции, вместо того, чтобы им быть разбросанными по всей таблице. У одного студента может быть несколько sid. Но pkey есть функция от id студента (st_id). В приложении этот запрос не единственный, поэтому задача заставить это запрос работать на секционированной таблице как можно быстрее. ну так соберите их в индексе по pkey, если запросам это надо. одно ваше " Всего партиций 15000" заставляется задуматься о неоправданном оверхеде. вы же своей таблице добавили метаданных больше некуда, вместо 3 строк allocation units на таблицу типа inrow,row overflow, lob у вас их 45000. это не считая индексов, каждый из них еще столько же добавляет. все это добро надо каждый раз просматривать и оно отгрызет место в buffer pool. какое уж тут ускорение процесса... --- ну и у вас что, на каждого студента своя партиция? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2019, 10:53 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
[quot Yasha123]Roust_mпропущено... ну так соберите их в индексе по pkey, если запросам это надо. одно ваше " Всего партиций 15000" заставляется задуматься о неоправданном оверхеде. вы же своей таблице добавили метаданных больше некуда, вместо 3 строк allocation units на таблицу типа inrow,row overflow, lob у вас их 45000. это не считая индексов, каждый из них еще столько же добавляет. все это добро надо каждый раз просматривать и оно отгрызет место в buffer pool. какое уж тут ускорение процесса... --- ну и у вас что, на каждого студента своя партиция? Нет, студентов всего около миллиона. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2019, 14:09 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
а какой у вас объем таблицы в гигабайтах? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2019, 14:50 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Roust_m Но поскольку секционирование в нашем случае нужно (IMHO), то приодится искать компромисы. Бред. Сам себе не может объяснить: нахера ему секционирование. А туда же. Создает трудности и героически их преодолевает. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2019, 18:08 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Yasha123а какой у вас объем таблицы в гигабайтах? На данный момент, пока все еще в зачатаочном состоянии 10ГБ, но в среднесрочтной перспективе 1.5ТБ ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.10.2019, 01:55 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
invmRoust_m, План со сканом секции банально дешевле плана с поиском в секции индекса. Стоимость плана с несекционированным индексом аналогична плану с секционированным. Можете ради интереса попробовать Код: sql 1. 2. 3. Учитывая, что у вас бета 2019-го сервера, не вижу смысла в дальнейших разбирательствах. Это Azure, я так понимаю, что Майкрософт тестирует на своих клиентах новые версии сиквела. У мне контроля над версией нет. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.10.2019, 01:57 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Roust_m, "Все татары кроме я." (с) Вы можете понятнее выражаться? Особенно на тему у кого там Azure случился? И очень интересно, когда вы сообщаете, что у вас контроля над версией нет. Вы уже готовитесь к тому, что вам MS SQL 4.2 раскатают? Или 7.0? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.10.2019, 02:13 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
aleks222Не знаю, как там у антиподов, в австралии. А в посконной завсегда поиск по ДВУМ полям ключа дольше, чем по одномуюAleks, я вот даже не знаю. Поиск по двум полям ключа индекса тупо быстрее, потому что поиск по одному, первому, полю ключа того того же индекса в лучшем случае будет плюс-минус так же, а в худшем приведет к Range-скану. А уж если мы говорим про разные индексы, то по тормознутости будет весьма сложно уделать поиск по индексу с одним ключом в 900 байт. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.10.2019, 02:26 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
aleks222Roust_m Но поскольку секционирование в нашем случае нужно (IMHO), то приодится искать компромисы. Бред. Сам себе не может объяснить: нахера ему секционирование. А туда же. Создает трудности и героически их преодолевает. Ну хорошо, как тогда в терабайтной таблице данные искать? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.10.2019, 02:34 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Roust_mНу хорошо, как тогда в терабайтной таблице данные искать?Физическим оператором Index Seek. Для одного поиска вы запаритесь делать таблицу, для которой понадобится больше 7-8 чтений. Упомянутые мною выше индексы с 900-байтовыми ключами оставим за скобками. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.10.2019, 02:36 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Гавриленко Сергей АлексеевичRoust_m, "Все татары кроме я." (с) Вы можете понятнее выражаться? Особенно на тему у кого там Azure случился? И очень интересно, когда вы сообщаете, что у вас контроля над версией нет. Вы уже готовитесь к тому, что вам MS SQL 4.2 раскатают? Или 7.0? В нашей среде, если нужна база, то отвечающий за это человек заходит на Azure портал и нажимает несколько кнопок, указывая какого размера и производительности нужна база. Выбора версии там нет. Старых версий у нас не раскатают, наоборот, в такой среде Майкрософт использует самую новую версию, даже если она не вышла еще на рынок. Вы разве про это не знаете? Да, они на клиентах как на хомячках обкатывают новую версию, зато потом, когда она готова, получается гораздо стабильнее. Я только что сам туда зашел, кнопки выбрать версию (2016 к примеру) не увидел. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.10.2019, 04:02 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Roust_mНу хорошо, как тогда в терабайтной таблице данные искать?Какая разница, сколько байт в таблице, если вам нужно считать сектор №123321? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.10.2019, 07:31 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Roust_malexeyvgВот у вас есть индекс, там указано, что ваши данные находятся на диске в секторе № 123321 Сервер читает сектор 123321, готово! Далее, вы задаёте вопрос: "как можно сервер заставить сканировать одну партицию" Вы понимаете, что такой вопрос абсурден, в контексте задачи "прочитать сектор 123321"? Ну контекст задачи немного шире. Еще одной целью партицирования было собрать все записи по одному и тому же студенту в одной партиции, вместо того, чтобы им быть разбросанными по всей таблице. У одного студента может быть несколько sid. Но pkey есть функция от id студента (st_id). В приложении этот запрос не единственный, поэтому задача заставить это запрос работать на секционированной таблице как можно быстрее. Это на не секционрованной таблице по этому запросу есть индекс где указано, что данные находятся в секторе № 123321. А на секционированной так не получется. Но поскольку секционирование в нашем случае нужно (IMHO), то приодится искать компромисы.Между тем, что все записи по одному и тому же студенту в одной партиции, или они разбросаны по всей таблице, нет никакой разницы. У вас всего лишь 3 варианта : 1) Вы делаете так, что бы все данные запроса читались в одном блоке (как - вам уже писали). Тогда неважно, в одной партиции у вас данные, или в нескольких. Вы читаете их одной дисковой операцией. 2) Данные разбросаны по разным секторам, и для получения данных вам нужно прочитать N секторов из некоего набора (№123321, №765567, №444333, .........). В этом случае тоже неважно, в одной партиции у вас данные, или в нескольких. Вы просто читаете с диска сектора из списка. Если данные в одной партиции, то сектора будут поближе друг к другу, ну и что? 3) У вас нет списка секторов. Для получения данных вы должны просканировать фрагмент таблицы по какому то условию, и потом их отфильтровать. Да, в этом случае, как одно из решений, можно использовать секционирование. Но можно использовать и другие варианты, никакого преимущества секционирования перед ними нет (за исключением неких тонкостей, но глупо, не зная их, цепляться за секционарование). Однако, тут (вариант 3) важно понимать, что такое сканирование (пусть даже одной секции) - признак грубейшей ошибки проектирования, которая сделает невозможным практическое использование базы данных (почти всегда, хотя есть и исключения). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.10.2019, 07:44 |
|
||
|
Запрос к партицированной таблице и к обычной таблице
|
|||
|---|---|---|---|
|
#18+
Roust_mВот скрипт партицированной таблицы. Там 15000 партиций. Ключ pkey есть функция от st_id: st_id % 14999 +1Сорри, не стал читать весь топик, но это самое идиотское секционирование которое я когда либо видел в жизни. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.10.2019, 22:45 |
|
||
|
|

start [/forum/topic.php?all=1&fid=46&tid=1687154]: |
0ms |
get settings: |
10ms |
get forum list: |
16ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
72ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
100ms |
get tp. blocked users: |
2ms |
| others: | 239ms |
| total: | 462ms |

| 0 / 0 |
