ASA9.0.1 Помогите с оптимальными индексами на большой таблице / Sybase ASA, ASE, IQ

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Sybase ASA, ASE, IQ [игнор отключен] [закрыт для гостей] / ASA9.0.1 Помогите с оптимальными индексами на большой таблице

25 сообщений из 39, страница 1 из 2

все

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32665946

Vovaka

Участник

Откуда: Москва

Сообщения: 532

Рейтинг: 0 / 0

Есть таблица

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.

create table voip.cdr_billing (
  id               integer primary key not null default autoincrement,
  cdrid            integer references voip.cdr_tel(id) on delete cascade on update cascade,
  accounttype      integer,       
  accountid        integer,
  datetime         datetime,
  e164prefix       char( 16 ),
  callduration     integer,
  billingduration  integer,
  minuteprice      double,
  callprice        double,
  currencyrate     double
);

кол-во данных до нескольких десятков миллионов
запросы вида:

Код: plaintext

1.
2.
3.
4.
5.
6.
7.

select
(select first g.name as lang from tel.globalprefixgroup g, tel.globalprefix p where
g.id = prefixgroupid and prefix = e164prefix and prefixgroupsetid =  6 ) lang, 
e164prefix as _e164prefix, minuteprice/currencyrate as minuteprice, count(*), 
sum(billingduration)/ 60  as sbd, sum(callprice/currencyrate) as _sum, sum(callduration)/ 60  as scd 
from voip.cdr_billing where datetime between '2004-08-01' and '2004-08-02' and accounttype in ( 2 ,  3 ,  4 ,  8 ) and accountid =  33  
group by _e164prefix, minuteprice
order by  2

в запросах меняется дата/время , набор значений accounttype и значение accountid

за сутки вставляется примерно 400000 записей, accounttype может принимать десяток значений, accountid - десятки(сотни) тысяч, но регулярные обращения к первой тысяче, есть и другие запросы, но эти - основные
сейчас сделаны

Код: plaintext

1.
2.
3.

create index voip_cdr_billing_e164prefix on voip.cdr_billing (e164prefix);
create index voip_cdr_billing_accountid_accounttype on voip.cdr_billing (accounttype, accountid);
create index voip_cdr_billing_datetime on voip.cdr_billing (datetime);
create index voip_cdr_billing_minuteprice on voip.cdr_billing (minuteprice);

...

Рейтинг:

0 / 0

26.08.2004, 09:28

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32665969

_Dog

Участник

Откуда: от туда...

Сообщения: 275

Рейтинг: 0 / 0

A IndexConsultant не помогает?

...

Рейтинг:

0 / 0

26.08.2004, 09:43

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32666096

ASCRUS

Участник

Откуда: МО Электросталь

Сообщения: 5 642

Рейтинг: 0 / 0

Для начала нужно однозначно переписать запрос и вывести подзапрос из секции SELECT в секцию FROM. Сейчас сто процентов в плане запросов стоит Subquery, который выполняется на каждую строку основного запроса. Нужно от него однозначно избавиться. Попробуйте его соеденить с основным запросом через INNER JOIN или LATERAL, смотря что будет красивее в плане запроса и эффективнее.

P.S. На будующее лучше всего показывать в сообщение помимо структуры таблицы, созданных индексов и текста запроса еще возвращаемый план запроса. Иначе без этого сложно сказать, в чем собака порылась :)

...

Рейтинг:

0 / 0

26.08.2004, 10:37

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32666140

_Dog

Участник

Откуда: от туда...

Сообщения: 275

Рейтинг: 0 / 0

при таком росте данных, если позволяет бюджет, советую посмотреть Sybase IQ.
Анализ CDR'ов/логов - типичная задача для IQ.

...

Рейтинг:

0 / 0

26.08.2004, 10:52

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32666375

Vovaka

Участник

Откуда: Москва

Сообщения: 532

Рейтинг: 0 / 0

Попробую переписать сейчас запрос, тогда план выложу, просто я нифига в нем еще не разбираюсь пока :), девятку только поставили, а раньше все по интуиции больше делалось ...

IQ во первых ОЧЕНЬ дорого, во вторых он не потянет такой объем вставляемых данных, insert очень долго проходит ...

...

Рейтинг:

0 / 0

26.08.2004, 12:19

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32666392

Vovaka

Участник

Откуда: Москва

Сообщения: 532

Рейтинг: 0 / 0

Да, индексконсультант посоветовал кластерный составной индекс
(accounttype, accountid, datetime)
но что-то стремно как-то ....

...

Рейтинг:

0 / 0

26.08.2004, 12:24

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32666493

_Dog

Участник

Откуда: от туда...

Сообщения: 275

Рейтинг: 0 / 0

IQ должен стоять "рядом", как база для анализа/репортинга и т.п.
Перекинуть 400000 записей из АСА в IQ - дело 3-5 сек. Можно как bulk load так и proxy (insert into location).
Цена - это конечно :) Вам решать :) но такие селекты решаются в пределах <X сек (с 1CPU, 512Мб RAM, 40mln row) и еще быстрее на нормальном железе

...

Рейтинг:

0 / 0

26.08.2004, 12:55

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32666546

_Dog

Участник

Откуда: от туда...

Сообщения: 275

Рейтинг: 0 / 0

VovakaДа, индексконсультант посоветовал кластерный составной индекс
(accounttype, accountid, datetime)
но что-то стремно как-то ....

Это ASKRUS спец по индексам. :) Ждите вердикта.
Думаю один кластерный индех не помешает, но довольно сильно увеличит базу.

...

Рейтинг:

0 / 0

26.08.2004, 13:10

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32667173

Vovaka

Участник

Откуда: Москва

Сообщения: 532

Рейтинг: 0 / 0

сделал составной индекс по трем полям, но не кластерный - оптимизатор им не пользуется, пользуется индексом по дате/времени с селективностью 94% .... чего-то то не понимаю совсем :(

...

Рейтинг:

0 / 0

26.08.2004, 15:39

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32667286

ASCRUS

Участник

Откуда: МО Электросталь

Сообщения: 5 642

Рейтинг: 0 / 0

1. Переписали ли Вы запрос ?
2. Если переписали, то ждем его новый текст и его план запроса.
- иначе ничего сказать по поводу того, нужен ли кластерный индекс и по каким полям нельзя.

...

Рейтинг:

0 / 0

26.08.2004, 16:07

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32667354

Vovaka

Участник

Откуда: Москва

Сообщения: 532

Рейтинг: 0 / 0

А что такое UltraPlan ? Видимо я не туда посмотрел, потому как результаты в Plan и UltraPlan разные ...

...

Рейтинг:

0 / 0

26.08.2004, 16:20

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32667372

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

VovakaЕсть таблица

за сутки вставляется примерно 400000 записей, accounttype может принимать десяток значений, accountid - десятки(сотни) тысяч, но регулярные обращения к первой тысяче, есть и другие запросы, но эти - основные.

сейчас сделаны

create index voip_cdr_billing_accountid_accounttype on voip.cdr_billing (accounttype, accountid);

Это бесполезный (или малополезный) индекс, исходя из того, что ты сообщил.
Или тут перепутан порядок полей в посте или при создании индекса.
( accountid,accounttype)???;

Индексы по e164prefix и minuteprice для ЭТОГО запроса тоже малополезны - ему собственно нужен индекс по accountid.

...

Рейтинг:

0 / 0

26.08.2004, 16:24

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32667376

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

(ой, добавочка)
... или datetime

...

Рейтинг:

0 / 0

26.08.2004, 16:24

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32667394

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

ASCRUSДля начала нужно однозначно переписать запрос и вывести подзапрос из секции SELECT в секцию FROM. Сейчас сто процентов в плане запросов стоит Subquery, который выполняется на каждую строку основного запроса. Нужно от него однозначно избавиться. Попробуйте его соеденить с основным запросом через INNER JOIN или LATERAL, смотря что будет красивее в плане запроса и эффективнее.

Как-то не очень бы согласился я :
Из запроса не понятно, коррелированный подзапрос там или нет.
Кажется, что нет. Если да, то куда его не ставь - все едино.

Если запрос некоррелированный, то с какой такой стати ASA его будет для каждой строчки выполнять ? Или оно такое глупое, что ONCE AGREGATE не понимает ?

...

Рейтинг:

0 / 0

26.08.2004, 16:28

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32667395

Vovaka

Участник

Откуда: Москва

Сообщения: 532

Рейтинг: 0 / 0

MasterZiv VovakaЕсть таблица

за сутки вставляется примерно 400000 записей, accounttype может принимать десяток значений, accountid - десятки(сотни) тысяч, но регулярные обращения к первой тысяче, есть и другие запросы, но эти - основные.

сейчас сделаны

create index voip_cdr_billing_accountid_accounttype on voip.cdr_billing (accounttype, accountid);

Это бесполезный (или малополезный) индекс, исходя из того, что ты сообщил.
Или тут перепутан порядок полей в посте или при создании индекса.
( accountid,accounttype)???;

Индексы по e164prefix и minuteprice для ЭТОГО запроса тоже малополезны - ему собственно нужен индекс по accountid.

Перепутано здесь :(

...

Рейтинг:

0 / 0

26.08.2004, 16:29

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32667437

Vovaka

Участник

Откуда: Москва

Сообщения: 532

Рейтинг: 0 / 0

MasterZivИндексы по e164prefix и minuteprice для ЭТОГО запроса тоже малополезны - ему собственно нужен индекс по accountid.

блин, я думал они будут помогать делать group by e164prefix, minuteprice

...

Рейтинг:

0 / 0

26.08.2004, 16:38

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32667519

Vovaka

Участник

Откуда: Москва

Сообщения: 532

Рейтинг: 0 / 0

ASCRUS1. Переписали ли Вы запрос ?
2. Если переписали, то ждем его новый текст и его план запроса.
- иначе ничего сказать по поводу того, нужен ли кластерный индекс и по каким полям нельзя.

А что из плана нужно выложить ? там так всего много ...

...

Рейтинг:

0 / 0

26.08.2004, 16:58

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32667645

ASCRUS

Участник

Откуда: МО Электросталь

Сообщения: 5 642

Рейтинг: 0 / 0

авторКак-то не очень бы согласился я :

Из запроса не понятно, коррелированный подзапрос там или нет.
Кажется, что нет. Если да, то куда его не ставь - все едино.
В скрипте подзапроса в WHERE стоит "prefix = e164prefix". Так что не едино. Во вторых ASA после переноса запроса в FROM уведет его в дерево главного плана, убрав Subquery, что уже прибавит скорости не мало. Так что переписывать нужно в обязку.

авторА что из плана нужно выложить ? там так всего много ...
Ставим в ISQL опцию Long Plan, нажимаем F5 и копируем результат сюда. По другому не разберешься.

...

Рейтинг:

0 / 0

26.08.2004, 17:49

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32667679

Vovaka

Участник

Откуда: Москва

Сообщения: 532

Рейтинг: 0 / 0

Начал уже писать, что не всегда используется этот индекс, что возникают ситуации, когда появляется table scan, если в этом примере поменять accountid на определенное значение - то индексскан почему то уже не используется...

в общем потом попробовал еще пару раз - table scan пропало ... теперь еще непонятней стало :)

вот план

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.

( Plan [ Total Cost Estimate:  497 . 43028  ] 
  ( WorkTable
    ( Sort
      ( HashGroupBy
        ( NestedLoopsJoin[ TRUE ]
          ( InList )
          ( IndexScan cdr_billing voip_cdr_billing_accountid_accounttype_datetime )
        )
      )
    )
  )
)
)

так полезен ли будет кластерный индекс ?

...

Рейтинг:

0 / 0

26.08.2004, 18:05

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32667796

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

Vovaka MasterZivИндексы по e164prefix и minuteprice для ЭТОГО запроса тоже малополезны - ему собственно нужен индекс по accountid.

блин, я думал они будут помогать делать group by e164prefix, minuteprice

Ага, жди ...
Подумай, чему они будут помогать ? Ну, не будет сервер сортировать набор данных при группировке, читая ВСЮ ТВОЮ ТАБЛИЦУ, ты же не этого наверное хочешь ?

...

Рейтинг:

0 / 0

26.08.2004, 19:12

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32667797

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

Vovaka
в общем потом попробовал еще пару раз - table scan пропало ... теперь еще непонятней стало :)
...
так полезен ли будет кластерный индекс ?

Так что ж непонятного ? Я так понимаю, это он и есть - вожделенный оптимальный план.

...

Рейтинг:

0 / 0

26.08.2004, 19:14

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32667803

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

ASCRUS
В скрипте подзапроса в WHERE стоит "prefix = e164prefix". Так что не едино. Во вторых ASA после переноса запроса в FROM уведет его в дерево главного плана, убрав Subquery, что уже прибавит скорости немало.

Не понял. Коррелированный ? или нет ? все равно не ясно. Не факт, что e164prefix - поле из внешнего запроса - квалификатора таблицы-то нет. Перенос же в главное дерево может только замедлить, впрочем, надо сначала разобраться, коррелированный подзапрос или нет.

...

Рейтинг:

0 / 0

26.08.2004, 19:21

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32667807

_Dog

Участник

Откуда: от туда...

Сообщения: 275

Рейтинг: 0 / 0

Vovaka
в общем потом попробовал еще пару раз - table scan пропало ... теперь еще непонятней стало :)

может АСА закешировала запрос?

...

Рейтинг:

0 / 0

26.08.2004, 19:28

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32667823

ASCRUS

Участник

Откуда: МО Электросталь

Сообщения: 5 642

Рейтинг: 0 / 0

Vovaka
Как то я в плане запроса не вижу табличек globalprefixgroup и globalprefix. Или это уже план на другой запрос ? Просто хочется увидеть сам запрос и план на него.

По плану запроса можно сказать, что он неэффективен, так как по нему оптимизатор сначала сканирует по индексу подходящие условию записи, и считывая их значения с таблицы начинает строить хэш-таблицу по полям e164prefix, minuteprice и currencyrate, аггрегируя по ним нужные поля найденных записей. Далее он запихивает результат во временную таблицу для проведения сортировки. Наличие хэша говорит, что оптимизатор не нашел подходящего индекса, а наличие времянки говорит, что самих групп возвращается много и не хватает кэша памяти ASA для их размещения. Так что еще раз хочу сказать, что нужно пока забыть про индексы и более удачно переписать запрос, добившись того, чтобы в нем не было использования хэш алгоритма группировки (он хорош, только при условии малого кол-ва групп).

авторНе понял. Коррелированный ? или нет ? все равно не ясно. Не факт, что e164prefix - поле из внешнего запроса - квалификатора таблицы-то нет. Перенос же в главное дерево может только замедлить, впрочем, надо сначала разобраться, коррелированный подзапрос или нет.
Вся хитрость в том, что ASA != ASE почти во всем:
1. Квалификатор таблицы для указания поля связи в этом подзапросе не нужен, если таблицы подзапроса не имеют такого же поля. Хотя правильней его писать, чтобы вот потом не возникало таких споров.
2. Запрос явно является коррелированным, так как связывается по полю e164prefix с основным запросом, а так как он аггрегированный, то ASA потребовала бы включить его в группировку, что и сделано в запросе.
3. Перенос в главное дерево, т.е. избавление от Subquery всегда увеличивает скорость работы подзапроса в ASA, только при условии, если правильно переносить :) Например в данном случае переносить запрос нужно в основной запрос не через соединение INNER JOIN, а как LATERAL (прямое внутреннее соединение, которое позволяет внутри подзапроса ссылаться на поля главного запроса, но при этом алгоритм его выполнения эффективнее, чем работа с Subquery).

авторТак что ж непонятного ? Я так понимаю, это он и есть - вожделенный оптимальный план.
Как я уже и говорил выше, ничего хорошего в этом плане нет, учитывая размеры таблицы. Хэш-таблицы ASA начинает использовать не от хорошей жизни, а от вынужденной необходимости хоть как то обработать огромный массив записей.

авторможет АСА закешировала запрос?
Кэш не влияет на построение плана запроса. В данном случае правильный ответ будет из фразы:
авторв общем потом попробовал еще пару раз - table scan пропало ... теперь еще непонятней стало :)
а если вспомнить, что в ASA обучающийся эвристический анализатор, который после выполнения каждого запроса сравнивает полученные результаты с предполагаемыми, корректирует статистику по полям таблицы и индексов и начинает вести рэйтинг планов запросов, то этим скорее всего и обьясняется пропажа TableScan-а. Ну еще как вариант - это изменение условий запроса, которые привели к тому, что в выборках стала участвовать не сильно много записей.

...

Рейтинг:

0 / 0

26.08.2004, 19:43

| Ответить | Цитировать | Написать

ASA9.0.1 Помогите с оптимальными индексами на большой таблице

#32668157

Vovaka

Участник

Откуда: Москва

Сообщения: 532

Рейтинг: 0 / 0

в общем вот запрос

Код: plaintext

1.
2.
3.
4.
5.
6.
7.

select
(select g.name as lang from tel.globalprefixgroup g, tel.globalprefix p where
g.id = prefixgroupid and prefix = e164prefix and prefixgroupsetid =  6 ) lang, 
e164prefix as _e164prefix, minuteprice/currencyrate as minuteprice, count(*), 
sum(billingduration)/ 60  as sbd, sum(callprice/currencyrate) as _sum, sum(callduration)/ 60  as scd 
from voip.cdr_billing where datetime between '2004-08-25' and '2004-08-26' and accounttype in ( 2 ,  3 ,  4 ,  8 ) and accountid =  543  
group by _e164prefix, minuteprice
order by  2

индекс в таблице только один (accountid, accounttype, datetime)
вот план

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.

( Plan [ Total Cost Estimate:  16 . 86433  ] 
  ( WorkTable
    ( Sort
      ( HashGroupBy
        ( NestedLoopsJoin[ TRUE ]
          ( InList )
          ( IndexScan cdr_billing voip_cdr_billing_accountid_accounttype_datetime )
        )
      )
    )
  )
)
( SubQ  1  [ Total Cost Estimate: . 0128049703  ] 
  ( NestedLoopsJoin[ TRUE ]
    ( IndexScan ( GlobalPrefix p ) PrefixName )
    ( IndexScan ( GlobalPrefixGroup g ) GlobalPrefixGroup[ g.PrefixGroupSetID =   6  :  3 . 06243673 % Statistics ] )
  )
)

пробовал сделать подзапрос через join - выигрыша нет

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.

( Plan [ Total Cost Estimate:  19 . 44261881  ] 
  ( WorkTable
    ( Sort
      ( HashGroupBy
        ( Left Outer *HashJoin
          ( HashFilter 
            ( NestedLoopsJoin[ TRUE ]
              ( InList )
              ( IndexScan cdr_billing voip_cdr_billing_accountid_accounttype_datetime )
            )
          )
          ( NestedLoopsJoin[ TRUE ]
            ( IndexScan ( GlobalPrefixGroup g ) GlobalPrefixGroupSet )
            ( IndexScan ( GlobalPrefix p ) GlobalPrefixGroup[ hash( p.Prefix ) in hashmap( cdr_billing.e164prefix ) : . 007117643 % Guess ] )
          )
        )
      )
    )
  )
)

через lateral не пробовал, это должно и на 7 и на 8 работать...

а вот как избавиться от хэшей ? результат выборки, в зависимости от периода может достигать сотен тысяч записей, в данном случае за сутки до десятков тысяч, после группировки остается максимум сотни две ...

...

Рейтинг:

0 / 0

27.08.2004, 09:08

| Ответить | Цитировать | Написать

25 сообщений из 39, страница 1 из 2

все

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=55&msg=32667807&tid=2014148]:	0ms
get settings:	5ms
get forum list:	15ms
check forum access:	2ms
check topic access:	2ms
track hit:	151ms
get topic data:	6ms
get forum data:	2ms
get page messages:	38ms
get tp. blocked users:	1ms
others:	220ms

total:	442ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы