|
|
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Есть вопрос по оптимизации. Как создать индекс для конкретного запроса? Коков алгоритм действий, куда смотреть? Informix Dynamic Server 2000 Version 9.21.HC3 стоит под вебом http://www.micex.ru/online/stock/archive/ Типичный запрос Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. то что находится между комментариями "-- мигает" - иногда присутствует в запросе, иногда - нет. Я делал так - создавал все кучу индексов на ngcb_hist по всем полям, участвующем в запросе (всевозможные перестановки id, trdate, boardGroup, numtrades), делал апдейт статистикс хай, запускал запрос с експлайном и смотрел какие индексы использует информикс. Оставались несколько индексов, их-то и переносил в боевую БД. Понимаю, что шел экстенсивным путем, но интенсивного ниасилил. Все эти рассуждения о селективности не смог применить в реальной ситуации - как не делаю, информикс не хочет использовать мои индексы :( Чего-то я недопонимаю... Может многоуважаемое сообщество подскажет _правильный_ путь создания оптимальных индексов для конкретных запросов? Кто как делает? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.11.2005, 16:35 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Сугубый... Код: plaintext 1. мало информации (сколько строк возратится без FIRST 20), планы хотя-бы. дурацкое предположение: SELECT /*+ first_rows*/ FIRST 20 h.pos, h.id, h.idBoard, TO_CHAR(h.trdate, '%Y-%m-%d'), и индекс по h.pos ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.11.2005, 17:01 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. без FIRST запрос вернет порядка 1000 записей. Видно что в данном случае планировщик использовал индекс (trdate, id, boardgroup, numtrades) Я не про этот конкретный запрос. У меня таких штук 20, на разных таблицах, с разным соотношением distinct id, distinct boardgroup, distinct numtrades... Какой _правильный_ алгоритм построения оптимального индекса? На что обращать внимание, как определять порядок колонок в индексе? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.11.2005, 17:31 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Журавлев Денис и индекс по h.pos это для order by? по моему он будет бесполезен при связывании нескольких таблиц. ведь отфильрованный резалт сет пишется в tmpdb, а толко потом упорядочивается. вот если б одна табличка была... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.11.2005, 18:16 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Сугубый Журавлев Денис и индекс по h.pos это для order by? по моему он будет бесполезен при связывании нескольких таблиц. ведь отфильрованный резалт сет пишется в tmpdb, а толко потом упорядочивается. вот если б одна табличка была... :) SELECT /*+ first_rows*/ FIRST 20 h.pos, h.id, h.idBoard, TO_CHAR(h.trdate, '%Y-%m-%d'), ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.11.2005, 20:56 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Сугубый без FIRST запрос вернет порядка 1000 записей. Видно что в данном случае планировщик использовал индекс (trdate, id, boardgroup, numtrades) Судя по Filters: (denn.h.publ = 2 AND denn.h.pos >= 6543 ) более эффективным был бы trdate, pos. Сугубыйh.id IN (SELECT id FROM secsLI WHERE idSecList='INDEXSECS' AND idSector='securies' AND sec_publ=1)Видимо информикс думает что SELECT id FROM secsLI вернет много строк, кстати у меня есть подозрение в этом случае лучше не IN, а EXSIST, и вообще переделать подзапрос в джойн, если он возвращает более одной строки. СугубыйЯ не про этот конкретный запрос. У меня таких штук 20, на разных таблицах, с разным соотношением distinct id, distinct boardgroup, distinct numtrades... Возможно надо несколько индексов, надо цель оптимизации сначала определить, а потом ставить задачи. СугубыйКакой _правильный_ алгоритм построения оптимального индекса? На что обращать внимание, как определять порядок колонок в индексе?Оптимальных индексов не бывает, нужен критерий оптимальности. Самое важное это правильный порядок соединения таблиц, индексы на втором месте. Про порядок колонок: индекс может использоваться если его первые поля были в запросе. в запросе where trdate =? может использоваться индекс (trdate, id) а (id, trdate) не может но (id, trdate) может использоваться при where trdate = ? and id =? Если id внешний ключ, то возможно нужен индекс где оно первое. Если h.numtrades>0 редко (отсекаем выходные?), то его можно не включать в индексы. Если во многих запросах есть h.pos>=? AND h.publ=? AND h.trdate=?, то возможно нужен trdate, publ, pos, но все зависит от селективности. Например если publ всегда =2, то в индекс его можно не включать. Но если селективность высокая или есть исключения, то его можно включить. Бд на мой вкус криво спроектирована: FROM secs s WHERE s.idSector='securies' FROM secsLI WHERE idSector='securies' FROM boardSelect WHERE idSector='securies' ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 09:38 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Журавлев Денис :) SELECT /*+ first_rows*/ FIRST 20 h.pos, h.id, h.idBoard, TO_CHAR(h.trdate, '%Y-%m-%d'), ой, а как такие большие буквы сделать? ;))) Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. 77. 78. 79. 80. 81. 82. 83. 84. 85. 86. 87. 88. 89. 90. 91. 92. 93. 94. 95. 96. 97. 98. 99. 100. Разницы в планах выполнения я не заметил. И забил на директивы оптимизатора... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 13:58 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Журавлев Денис Бд на мой вкус криво спроектирована: FROM secs s WHERE s.idSector='securies' FROM secsLI WHERE idSector='securies' FROM boardSelect WHERE idSector='securies' Ага - особенно если idSector [N]VARCHAR :) Смотри прочие thread'ы про индексы :)) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 14:02 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Сугубый Разницы в планах выполнения я не заметил. И забил на директивы оптимизатора... А сколько времени запрос выполняется? А без order by сколько? На самом деле first_rows хороший хинт, и информикс не будет сортировать, а пойдет по индексу, даже если джойнится много таблиц. Это даже не хинт, это доп.информация оптимизатору, что нам нужны первые строки, ведь у вас first 20 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 14:04 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
АнатоЛой Журавлев Денис Бд на мой вкус криво спроектирована: FROM secs s WHERE s.idSector='securies' FROM secsLI WHERE idSector='securies' FROM boardSelect WHERE idSector='securies' Ага - особенно если idSector [N]VARCHAR :) Смотри прочие thread'ы про индексы :)) Индекс тут как раз используется, проблемы с VARCHAR остались в прошлом, в 7-ке. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 14:07 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Денис, не могли бы вы определить понятие селективности? А то никто мне внятно не может обьяснить. Спасибо заранее :) Журавлев ДенисСудя по Filters: (denn.h.publ = 2 AND denn.h.pos >= 6543 ) более эффективным был бы trdate, pos. Эффективность индекса как раз и определяется этой селективностью, как я понял. Если первый ключ может существенно сузить облать поиска, то выбирается именно он. trdate - это дата, данные хранятся за несколько лет, за один день порядка 400 записей. Роs - уникальна для каждой строки (не спрашивайте почему) Насколько селективен индекс по trdate? Журавлев ДенисВидимо информикс думает что SELECT id FROM secsLI вернет много строк, кстати у меня есть подозрение в этом случае лучше не IN, а EXSIST, и вообще переделать подзапрос в джойн, если он возвращает более одной строки. Джойн мне немного сложнее формировать... Впрочем, где-то прочитал что подселекты оптимизатор все равно раскладывает в джойн. Журавлев Денис Возможно надо несколько индексов, надо цель оптимизации сначала определить, а потом ставить задачи. Цель оптимизации - скорострельность. Параметр - чем больше тем лучше. Текущий уровень, в принципе, удовлетворяет, но потолок уже близок... Другая цель оптимизации - научится оптимизации :) Журавлев Денис Оптимальных индексов не бывает, нужен критерий оптимальности. Самое важное это правильный порядок соединения таблиц, индексы на втором месте. Про порядок колонок: индекс может использоваться если его первые поля были в запросе. в запросе where trdate =? может использоваться индекс (trdate, id) а (id, trdate) не может но (id, trdate) может использоваться при where trdate = ? and id =? Если id внешний ключ, то возможно нужен индекс где оно первое. Если h.numtrades>0 редко (отсекаем выходные?), то его можно не включать в индексы. Если во многих запросах есть h.pos>=? AND h.publ=? AND h.trdate=?, то возможно нужен trdate, publ, pos, но все зависит от селективности. Например если publ всегда =2, то в индекс его можно не включать. Но если селективность высокая или есть исключения, то его можно включить. Бд на мой вкус криво спроектирована: FROM secs s WHERE s.idSector='securies' FROM secsLI WHERE idSector='securies' FROM boardSelect WHERE idSector='securies' h.numtrades>0 у 2/3 записей publ=2 практически всегда (99,9% строк) Вкусы на структуру БД у всех разные ;) Насчет порядка соединения - а как бы его проанализировать? Есть 3 таблицы, одна так сказать ведущая, 2 - вспомогательные; вспомогательные вяжутся в главной одним полем; на все таблички наклыдываются разнообразные условия. И еще раз - что же такое селективность?... (где же у него кнопка? (ц) Урри :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 14:16 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Журавлев ДенисИндекс тут как раз используется, проблемы с VARCHAR остались в прошлом, в 7-ке. ОК, уболтали :) В ближайшее время возвращаюсь из прошлого... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 14:21 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Журавлев Денис Сугубый Разницы в планах выполнения я не заметил. И забил на директивы оптимизатора... А сколько времени запрос выполняется? А без order by сколько? На самом деле first_rows хороший хинт, и информикс не будет сортировать, а пойдет по индексу, даже если джойнится много таблиц. Это даже не хинт, это доп.информация оптимизатору, что нам нужны первые строки, ведь у вас first 20 времена не тестировал :( каюсь. Слишком много запросов, надо было бить по площадям. Сейчас - можно и потестировать (кста, как в dbaccess выводить время выпалнения - есть така фича?) А оптимизатор сам что ли не видит, что у него в запросе first 20? %) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 14:23 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
СугубыйДенис, не могли бы вы определить понятие селективности? А то никто мне внятно не может обьяснить. Спасибо заранее :)Ох, тяжело это. Давай, не будем говорить большая и маленькая селективность, а то совсем запутаемся, будем говорить хорошая селективность. Поле F содержит много разных значений 0,1,2,3,2,1,4 выполняется много запросов where F=? - селективность поля хорошая. Поле F содержит мало разных значений 0,0,0,0,0,0,1,1,1,1 селективность поля плохая. Поле F содержит мало разных значений 0,0,0,0,0,0,0,4 выполняется много запросов where F=0 - селективность поля плохая, а для where F=4 - селективность поля хорошая. СугубыйНасчет порядка соединения - а как бы его проанализировать? Есть 3 таблицы, одна так сказать ведущая, 2 - вспомогательные; вспомогательные вяжутся в главной одним полем; на все таблички наклыдываются разнообразные условия. Читаем план: Код: plaintext 1. 2. 3. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 14:32 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Сугубый выбирается именно он. trdate - это дата, данные хранятся за несколько лет, за один день порядка 400 записей. Роs - уникальна для каждой строки (не спрашивайте почему) Насколько селективен индекс по trdate? Индекс по trdate эффективен, по Роs намного эффективнее при условии что Роs используется в where. Сугубый Цель оптимизации - скорострельность. Параметр - чем больше тем лучше. Текущий уровень, в принципе, удовлетворяет, но потолок уже близок... Другая цель оптимизации - научится оптимизации :) Я понял сейчас. Вы этим запросом листаете 1000 строк кусочками по 20 строк с помощью Роs >, вам однозначно надо уйти от сортировки. Сугубыйh.numtrades>0 у 2/3 записей Плохая селективность. Индекс не нужен. Сугубый publ=2 практически всегда (99,9% строк)Очень плохая селективность. Индекс не нужен. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 14:42 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Сугубыйвремена не тестировал :( каюсь. Слишком много запросов, надо было бить по площадям.Как можно оптимизировать "скорострельность" без времени? Сугубый Сейчас - можно и потестировать (кста, как в dbaccess выводить время выпалнения - есть така фича?)Не знаю как dbaccess :(. Чаще пользуюсь eSQLEditor , там вроде есть такая фича. Сугубый А оптимизатор сам что ли не видит, что у него в запросе first 20? %)По моему не видит, 100% гарантии дать не могу. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 14:47 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Журавлев ДенисИндекс по trdate эффективен, по Роs намного эффективнее при условии что Роs используется в where. сначала я создавал такие составные индексы, в которых pos был на первом месте. оптимизатор их _не_использовал_ , наверно потому что у меня стоит pos > NNN и индекс по этому полю отсекает половину таблицы. А это мало. Оптимизатору лучше сразу выкусить из всех значений наименьший кусок. И он ставил на первые места trdate (дату, одну из нескольких лет) Журавлев Денис Я понял сейчас. Вы этим запросом листаете 1000 строк кусочками по 20 строк с помощью Роs >, вам однозначно надо уйти от сортировки. Вот здесь поподробнее, плз. Я знаю, что индекс используется при сортировке, если только все выбираемые поля лежат в индексе. У меня же в ngcb_hist 30 полей. Все их в индекс? нереально. Журавлев Денис Сугубыйh.numtrades>0 у 2/3 записей Плохая селективность. Индекс не нужен. Сугубый publ=2 практически всегда (99,9% строк)Очень плохая селективность. Индекс не нужен. что и было выявлено на первых этапах, когда я просто создал по индексу на каждую колонку из where - оптимизатор их не использовал вообще Журавлев ДенисКак можно оптимизировать "скорострельность" без времени? на глазок :) по времени отклика браузера :) Журавлев Денис Не знаю как dbaccess :(. Чаще пользуюсь eSQLEditor , там вроде есть такая фича. пасиб, посмотрим. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 15:39 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Сугубый Журавлев Денис Я понял сейчас. Вы этим запросом листаете 1000 строк кусочками по 20 строк с помощью Роs >, вам однозначно надо уйти от сортировки. Вот здесь поподробнее, плз. Я знаю, что индекс используется при сортировке, если только все выбираемые поля лежат в индексе. У меня же в ngcb_hist 30 полей. Все их в индекс? нереально. Вы путаете, в индексе должны быть поля по которым сортируется. Сделай индекс (trdate, pos), собери статистику, и покажите план: Код: plaintext 1. 2. 3. 4. 5. А зачем надо 30 полей сразу? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 15:58 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Журавлев Денис Сугубый Сейчас - можно и потестировать (кста, как в dbaccess выводить время выпалнения - есть така фича?)Не знаю как dbaccess :(. Чаще пользуюсь eSQLEditor , там вроде есть такая фича. Сугубый А оптимизатор сам что ли не видит, что у него в запросе first 20? %)По моему не видит, 100% гарантии дать не могу. А прикольная у вас программка :) Пасиба, буду юзать. Скорость выполнения с {+First} и без него одинаковы (в пределах точности) - 250 и 280 миллисек, к примеру. Видать оптимизатор сам видит, что у него FIRST 20 в запросе стоит :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 15:59 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
СугубыйСкорость выполнения с {+First} и без него одинаковы (в пределах точности) - 250 и 280 миллисек, к примеру. Видать оптимизатор сам видит, что у него FIRST 20 в запросе стоит :)Это ничего не доказывает. Я не поверю, пока не увижу что из-за FIRST 20 меняется план. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 16:02 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
ой, ошибся, с /*+first_rows*/ - то же саме. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 16:08 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Сугубыйой, ошибся, с /*+first_rows*/ - то же саме.Да я догадался. Просто смотрим первую строку плана при first_rows и видим: Код: plaintext А без хинта, один first 20: Код: plaintext ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 16:12 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Журавлев ДенисВы путаете, в индексе должны быть поля по которым сортируется. Сделай индекс (trdate, pos), собери статистику, и покажите план: Код: plaintext 1. 2. 3. 4. 5. Сделал и вот что получилось: Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. он его не использует вообще. Ему больше нравится (trdate boardgroup id numtrades) счас делаю update statistics HIGH для ngcb_hist - может что поменяется Журавлев Денис А зачем надо 30 полей сразу? ну вот к примеру http://www.micex.ru/online/stock/archive/by_date.html?ssector=securies&doSearch=auto ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 16:18 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Попробуй: SELECT /*+first_rows*/ FIRST 20 h.trdate, h.pos, .... ... ORDER BY 1, 2 Сугубый счас делаю update statistics HIGH для ngcb_hist - может что поменяется HIGH необязательно, в случае добавления нового индекса. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 16:32 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
упс, накладочка, перепутал сервера где выполнялись запросы :( Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. индекс испорльзуется и пропала строчка Temporary Files Required For: Order By - значит сортировка идет по индексу? Интересно ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 16:38 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Сугубый индекс испорльзуется и пропала строчка Temporary Files Required For: Order By - значит сортировка идет по индексу? Куда он денется с подводной лодки? Покажи план того же запроса без /*+first_rows*/ SELECT FIRST 20 h.pos,... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 16:56 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Журавлев Денис Сугубый индекс испорльзуется и пропала строчка Temporary Files Required For: Order By - значит сортировка идет по индексу? Куда он денется с подводной лодки? Покажи план того же запроса без /*+first_rows*/ SELECT FIRST 20 h.pos,... Но если не используется Temporary Files, то не загружается tmpdb! А у нас боттлнек по каналу обращения к диску именно для tmpdb - постоянные сортировки идут. И тогда время отклика должно уменьшится... Это хорошая новость :) план не меняется Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 17:15 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
То есть в конец индексов мне бы хорошо еще добавить pos? тогда по нему будет сортировка идти. к примеру Код: plaintext 1. 2. 3. 4. 5. 6. сделать как Код: plaintext 1. 2. 3. 4. 5. 6. 7. я все правильно понимаю? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 17:18 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Сугубый Но если не используется Temporary Files, то не загружается tmpdb! А у нас боттлнек по каналу обращения к диску именно для tmpdb - постоянные сортировки идут. И тогда время отклика должно уменьшится... Это хорошая новость :) Сортировки в файлах можно убрать перенеся их в ОЗУ (если она конечно есть). Используй PDQ. Или переходи на 9.4х4 и настраивай DS_NONPDQ_QUERY_MEM ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 17:22 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Кстати в 10-ке хинты можно не писать External Optimizer Directives The external optimizer directive is a new feature introduced in IBM® Informix® Dynamic Server, Version 10.0. This feature provides a more flexible way of specifying optimizer directives and optimizer hints. What it Does? In previous releases of Dynamic Server, optimizer directives existed within DML statements, but were not stored as separate database objects. External optimizer directives are useful when it is not feasible to rewrite a query for a short-term solution to a problem, for example, when a query starts to perform poorly. The database administrator can create external optimizer directives and apply them to subsequent queries, without changing existing application code. This feature is implemented as a new SQL statement, SAVE EXTERNAL DIRECTIVES, to create and register external optimizer directives in a new system catalog table called sysdirectives. Use the new IFX_EXTDIRECTIVES environment variable or the EXT_DIRECTIVES configuration parameter to enable this feature. The sysdirectives table stores external optimizer directives that can be applied to queries. Whether queries in client applications can use these optimizer directives depends on the setting of the IFX_EXTDIRECTIVES environment variable on the client system, and on the EXT_DIRECTIVES setting in the configuration file of the database server. Following is a structure of the sysdirectives table: Код: plaintext 1. 2. 3. 4. 5. 6. 7. How to use it? 1. Enable the external directive using a combination of the EXT_DIRECTIVES configuration parameter, and the IFX_EXTDIRECTIVES client-side environment variable. Queries within a given client application can use external directives if both the EXT_DIRECTIVES parameter in the configuration file and the IFX_EXTDIRECTIVES environment variable setting on the client system are both set to 1 or ON. The EXT_DIRECTIVE values that you can use are: Value Explanation 0 Off. The directive cannot be enabled even if IFX_EXTDIRECTIVES is on. 1 On. The directive can be enabled for a session if IFX_EXTDIRECTIVES is on. 2 (default) On. The directive can be used even if IFX_EXTDIRECTIVES is not set. IFX_EXTDIRECTIVES environment variable specifies whether the query optimizer allows external query optimization directives from the sysdirectives system catalog table to be applied to queries in existing applications. You can specify either ON and OFF or 1 and 0 to set the IFX_EXTDIRECTIVES environment variable. If IFX_EXTDIRECTIVES is not set, external directives are supported only if the ONCONFIG parameter EXT_DIRECTIVES is set to 2. The following table summarizes the effect of valid IFX_EXTDIRECTIVES and EXT_DIRECTIVES settings on support for external optimizer directives. Код: plaintext 1. 2. 3. 4. 5. 2. Use the SAVE EXTERNAL DIRECTIVES statement to create external optimizer directives for a specified query, and save the directives in the database. These directives are applied automatically to subsequent instances of the same query. Syntax Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. directive the optimizer directive valid for query query Text of a valid SELECT statement. NULL string is not valid Following is an example of SAVE EXTERNAL DIRECTIVES statement and corresponding entry in sysdirectives table: Код: plaintext 1. 2. 3. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. Notes External directives are for occasional use only. The number of directives stored in the sysdirectives catalog should not exceed 50. A typical enterprise only needs 0 to 9 directives. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 17:24 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Сугубыйя все правильно понимаю?Наверно неправильно. Мы вроде уже решили что индексировать numtrades не надо. Я думаю индекс по boardGroup тоже лишний. А по id надо отдельный индекс. Т.о. я вижу три индекса: CREATE INDEX (id) CREATE INDEX (trdate,pos) CREATE Uniq INDEX (pos) Если boardGroup это внешний ключ то можно на всякий добавить еще один индекс CREATE INDEX (boardGroup) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 17:28 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Журавлев Денис Сугубыйя все правильно понимаю?Наверно неправильно. Мы вроде уже решили что индексировать numtrades не надо. Я думаю индекс по boardGroup тоже лишний. А по id надо отдельный индекс. Т.о. я вижу три индекса: CREATE INDEX (id) CREATE INDEX (trdate,pos) CREATE Uniq INDEX (pos) Если boardGroup это внешний ключ то можно на всякий добавить еще один индекс CREATE INDEX (boardGroup) Эх, у меня запросы типовые. И в одном из типов есть Код: plaintext 1. 2. 3. так что индекс нужен. Каюсь, я взял первый попавшийся под руку индекс. Более правильно былоб обсуждать сл. индекс (оптимизатор берет именно его) Код: plaintext 1. 2. 3. 4. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. Вопроос такой - стоит ли для этого индекса добавить в конец pos ? Для оптимизации сортировки. Насчет нескольких одиночных индексов: я считал что один составной индекс гораздо лучше нескольких одинарных. Я не прав? Завтра (уже) попробую создать эту кучку индексов и посмотреть, что там оптимизатор выберет... :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.11.2005, 17:44 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Сугубый Эх, у меня запросы типовые. И в одном из типов есть Код: plaintext 1. 2. 3. Осмелюсь утверждать что индекс в который входит boardGroup, использоваться не будет. SELECT boardGroup FROM boardSelect должен вернуть такие значения чтобы их суммарная селективность h.boardGroup IN была лучше чем h.trdate, но какие именно значения вернуться подзапросом оптимизатор не знает, поэтому он возьмет среднестатистическую селективность и помножит на количество ожидаемых строк подзапроса, и получит нехорошую селективность. Еслиже случится такое несчастье что первым он решит выполнить подзапрос, то будет дисковая сортировка потому что подзапрос вернет несколько значений (по мнению оптимизатора), а в этом случае индекс (boardGroup, pos) принципиально нельзя использовать для order by pos. Еще раз предлагаю переделать IN на EXSIST. Сугубый INDEX (trdate, id); Вопроос такой - стоит ли для этого индекса добавить в конец pos ? Для оптимизации сортировки. (trdate, id, pos) Тоже самое -- будет дисковая сортировка. Сугубый Насчет нескольких одиночных индексов: я считал что один составной индекс гораздо лучше нескольких одинарных. Я не прав? Не прав. Индексы не должны быть ни длинными, ни короткими. Они должны быть такими какими нужны. Этими излишне длинными индексами вы жрете место на диске и замедляете операции обновления таблицы. СугубыйЗавтра (уже) попробую создать эту кучку индексов и посмотреть, что там оптимизатор выберет... :)Статистику после создания нового индекса собирайте LOW, high не НУЖЕН в этом случае. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.12.2005, 08:49 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
СугубыйДжойн мне немного сложнее формировать... Впрочем, где-то прочитал что подселекты оптимизатор все равно раскладывает в джойн. Раскладывает, но не всегда, и если разложит, то в плане это будет видно Query Plans for Subqueries http://publib.boulder.ibm.com/infocenter/idshelp/v10/topic/com.ibm.perf.doc/perf282.htm#sii-10query-32245 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.12.2005, 09:56 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
ТанРаскладывает, но не всегда, и если разложит, то в плане это будет видно Вообще интересный вопрос и сложный, оптимизатор FIRST 20 не видит. А в нашем случае может быть и не надо все h.boardGroup = (SELECT boardGroup FROM boardSelect WHERE boardGroupSet='repo|smal|' AND idSector='securies'), нам возможно не надо выполнять весь селект, а для первых "20" boardGroup проверить EXISTS (SELECT 1 FROM boardSelect WHERE boardGroupSet='repo|smal|' AND idSector='securies' and boardGroup=h.boardGroup) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.12.2005, 10:47 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Журавлев ДенисВообще интересный вопрос и сложный, оптимизатор FIRST 20 не видит. А в нашем случае может быть и не надо все h.boardGroup = (SELECT boardGroup FROM boardSelect WHERE boardGroupSet='repo|smal|' AND idSector='securies'), нам возможно не надо выполнять весь селект, а для первых "20" boardGroup проверить EXISTS (SELECT 1 FROM boardSelect WHERE boardGroupSet='repo|smal|' AND idSector='securies' and boardGroup=h.boardGroup) Нда, оптимизация - странная штука. Переход на EXISTS выйгрыша не дал: Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. 77. 78. 79. 80. 81. 82. 83. 84. 85. 86. 87. 88. 89. 90. 91. 92. 93. 94. 95. 96. 97. 98. 99. 100. 101. 102. 103. 104. 105. 106. 107. 108. 109. 110. 111. 112. 113. 114. 115. 116. 117. Общая стоимость запроса с IN меньше чем с EXISTS. Согласен, возможно индексы на ngcb_hist неоптимальны и из-за это такой разброс... Время выполнения оценить не удается - видимо данные попадают в кэш информикса и второй запрос всегда быстрее первого (я их пачкой пускаю в eSQLEditor, пробовал менять местами). boardselect - мельчайшая табличка, 22 записи, 4 колонки. Она полностью попадает в память. Другое дело secsLI - 14 тысяч записей (попутно кста на ней индекс оптимизировал) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.12.2005, 13:42 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Журавлев Денис Не прав. Индексы не должны быть ни длинными, ни короткими. Они должны быть такими какими нужны. Этими излишне длинными индексами вы жрете место на диске и замедляете операции обновления таблицы. По базе всегда идут только чтения (веб-сервер), обновление данных раз в сутки, вечером. Так что наличие множества индексов имхо оправдано. Места - пока хватает. Я заметил, что оптимизатор использует составные индексы охотнее, нежели чем отдельные по колонкам. И именно поэтому бьюсь над составными индексами, порядком колонок в них. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.12.2005, 13:47 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Тан СугубыйДжойн мне немного сложнее формировать... Впрочем, где-то прочитал что подселекты оптимизатор все равно раскладывает в джойн. Раскладывает, но не всегда, и если разложит, то в плане это будет видно Query Plans for Subqueries http://publib.boulder.ibm.com/infocenter/idshelp/v10/topic/com.ibm.perf.doc/perf282.htm#sii-10query-32245 Спасибо за уточнение. Теперь и сам вижу, что не раскладывает :) Но как показал эксперимент - не всегда разложение в джойн полезнее. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.12.2005, 13:49 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
СугубыйОбщая стоимость запроса с IN меньше чем с EXISTS. Согласен, возможно индексы на ngcb_hist неоптимальны и из-за это такой разброс... Время выполнения оценить не удается - видимо данные попадают в кэш информикса и второй запрос всегда быстрее первого (я их пачкой пускаю в eSQLEditor, пробовал менять местами). boardselect - мельчайшая табличка, 22 записи, 4 колонки. Она полностью попадает в память. Другое дело secsLI - 14 тысяч записей (попутно кста на ней индекс оптимизировал)а +first_rows ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.12.2005, 14:45 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Журавлев Дениса +first_rows план не изменился в обоих случаях. Даже больше, для SELECT /*+first_rows*/ h.pos, h.id, h.idBoard и для просто SELECT h.pos, h.id, h.idBoard (убрал FIRST 20) - тот же самый план выполнения (для IN и EXISTS). Там только иногда появляется "(Key-First)" но это я не создал всевозможные индексы еще. счас попробуем создать :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.12.2005, 15:09 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
СугубыйНо как показал эксперимент - не всегда разложение в джойн полезнее. "не всегда полезнее" - это иногда бесполезно? Или именно вредно?:) ЗЫ Если второе - хотелось бы посмотреть пример. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.12.2005, 16:53 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Valentyn Pidburtnyi СугубыйНо как показал эксперимент - не всегда разложение в джойн полезнее. "не всегда полезнее" - это иногда бесполезно? Или именно вредно?:) ЗЫ Если второе - хотелось бы посмотреть пример. я сужу по Estimated Cost в планах выполнения. Пример был уже дан в этом сообщении - я заменил конструкцию "IN" на "EXISTS" и Estimated Cost увеличилась. Сечас пишу скрипт замера времени выполнения - предварительно время выполнения запроса с EXISTS больше, хотя и не намного, на 1-2%. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.12.2005, 17:05 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
написал скрипт сравнения времен выполнения запросов. Прогоняет N раз рассматриваемую пару, вычисляет среднее время выполнения. Вот что получилось (первый запрос - с EXIST, второй - с IN): Код: plaintext 1. 2. 3. 4. то есть запрос с EXIST на 1.33 % медленнее чем с с IN :) (в сторону: мля, и на это я потратил полдня? ;) ничего, зато у меня теперь измерялка времен выполнения :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.12.2005, 18:48 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Сугубыйя заменил конструкцию "IN" на "EXISTS" и Estimated Cost увеличилась. Сечас пишу скрипт замера времени выполнения - предварительно время выполнения запроса с EXISTS больше, хотя и не намного, на 1-2%. Да, теперь вижу: на своей базе тоже попробовал и тоже увидел, что иногда при exists оптимизатор выбирает план с бОльшей стоимостью. ЗЫ Не пробовал запускать запрос с собранным распределением (по колонкам, по которым есть фильтры и джойны) и без оного? Я у себя пока не могу потестить: тестовая база пустая, а рабочая.. Ну ты понял:) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.12.2005, 17:13 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Valentyn Pidburtnyi Не пробовал запускать запрос с собранным распределением (по колонкам, по которым есть фильтры и джойны) и без оного? Это как? Я создал всевозможные (ну почти) индексы на всех колонках, участвующих в джойне, а после этого сделал UPDATE STATISTICS. Что есть "собранным распределением" ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.12.2005, 12:15 |
|
||
|
Создание оптимальных индексов
|
|||
|---|---|---|---|
|
#18+
Сугубый Valentyn Pidburtnyi Не пробовал запускать запрос с собранным распределением (по колонкам, по которым есть фильтры и джойны) и без оного? Это как? Я создал всевозможные (ну почти) индексы на всех колонках, участвующих в джойне, а после этого сделал UPDATE STATISTICS. Что есть "собранным распределением" ? update statistics high или medium по фильтруемым полям таблиц. Можно distributions only, чтобы не делалось лишней работы, которая и так у тебя уже сделана после update statistics low. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 05.12.2005, 15:38 |
|
||
|
|

start [/forum/topic.php?all=1&fid=44&tid=1608822]: |
0ms |
get settings: |
7ms |
get forum list: |
11ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
31ms |
get topic data: |
8ms |
get forum data: |
2ms |
get page messages: |
46ms |
get tp. blocked users: |
1ms |
| others: | 201ms |
| total: | 313ms |

| 0 / 0 |
