select (distinct). Оптимизация в древнем Sybase / Sybase ASA, ASE, IQ

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Sybase ASA, ASE, IQ [игнор отключен] [закрыт для гостей] / select (distinct). Оптимизация в древнем Sybase

9 сообщений из 9, страница 1 из 1

select (distinct). Оптимизация в древнем Sybase

#36991523

Nieky

Гость

Есть таблица, в год возрастает на 1млн записей.
По ней нужно сделать select count ( distinct..) с group by

Sybase 12.5 По всей таблице данный селект делается очень медленно (от 30 сек до 2 минут).

Как можно ускорить работу count ( distinct..) ..?

...

Рейтинг:

0 / 0

02.12.2010, 15:51

| Ответить | Цитировать | Написать

select (distinct). Оптимизация в древнем Sybase

#36991543

Nieky

Гость

ASE 12.5

...

Рейтинг:

0 / 0

02.12.2010, 15:56

| Ответить | Цитировать | Написать

select (distinct). Оптимизация в древнем Sybase

#36991596

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

Запрос, описание таблицы давай.

...

Рейтинг:

0 / 0

02.12.2010, 16:17

| Ответить | Цитировать | Написать

select (distinct). Оптимизация в древнем Sybase

#36991612

Ggg_old

Участник

Откуда: Одесса

Сообщения: 1 474

Рейтинг: 0 / 0

с запросом, описанием и планом каждый сможет, а вы попробуйте телепатией! ;)

...

Рейтинг:

0 / 0

02.12.2010, 16:22

| Ответить | Цитировать | Написать

select (distinct). Оптимизация в древнем Sybase

#36992449

Nieky

Гость

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.

CREATE TABLE myTable  ( 
    a     	numeric( 19 , 0 ) NOT NULL,
    b  	numeric( 1 , 0 ) DEFAULT  0  NOT NULL,
    c	numeric( 1 , 0 ) DEFAULT - 1  NOT NULL,
    Time          	datetime NOT NULL,
    e   	numeric( 9 , 0 ) NULL,
    CONSTRAINT PK_myTable PRIMARY KEY(a,b,c,Time)
	WITH max_rows_per_page =  0 , reservepagegap =  0 
    )
LOCK ALLPAGES
GO

Индексы всяки выдумывал, не помогало. Сейчас на таблице вот такие:

Код: plaintext

1.
2.
3.
4.

 PK_myTable	clustered, unique located on default	a,b,c,Time
INDEX_myTable_TS	nonclustered located on default	 Time, e
INDX_myTable_TIME	nonclustered located on default	 Time
IndexmyTable_ALL	nonclustered located on default	 Time, b, c, e, a

Конечно я с самим primary key накосячил, при расширении добавилось e, которое записывается в group by. А также Time нужно на 1е место, тк оно изменяется с шагом в 1 день
a = {1..00} от 1 до бесконечности) до numeric(19),
b = {1,2}
c={1,2,3},
e={1,2,3,4,5}. теоретически может дойти до 100, практически до 10.

Пример строки:
a b c Time e
1 ,2, 3, '2010-12-03', 1

За день появляется около 6 тыс записей. Инфа возрастает по времени и a,b,c
--с утра незакешированный запрос выполнялся 3.30 минут

Код: plaintext

1.
2.
3.
4.
5.
6.

select e, b, count(distinct a) 
from myTable
where Time >'2006-01-01' and Time <'2010-10-01'
group by e, b

go

План запроса:

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.

   W (1): 
   W (2): QUERY PLAN FOR STATEMENT 1 (at line 1).
   W (3): 
   W (4): 
   W (5):     STEP 1
   W (6):         The type of query is INSERT.
   W (7):         The update mode is direct.
   W (8): 
   W (9):         FROM TABLE
   W (10):             myTable
   W (11):         Nested iteration.
   W (12):         Index : IndexmyTable_ALL
   W (13):         Forward scan.
   W (14):         Positioning by key.
   W (15):         Index contains all needed columns. Base table will not be read.
   W (16):         Keys are:
   W (17):             Time  ASC
   W (18):         Using I/O Size 2 Kbytes for index leaf pages.
   W (19):         With LRU Buffer Replacement Strategy for index leaf pages.
   W (20):         TO TABLE
   W (21):             Worktable1.
   W (22): 
   W (23):     STEP 2
   W (24):         The type of query is SELECT (into Worktable2).
   W (25):         GROUP BY
   W (26):         Evaluate Grouped COUNT AGGREGATE.
   W (27): 
   W (28):         FROM TABLE
   W (29):             Worktable1.
   W (30):         Nested iteration.
   W (31):         Table Scan.
   W (32):         Forward scan.
   W (33):         Positioning at start of table.
   W (34):         Using I/O Size 2 Kbytes for data pages.
   W (35):         With MRU Buffer Replacement Strategy for data pages.
   W (36):         TO TABLE
   W (37):             Worktable2.
   W (38): 
   W (39):     STEP 3
   W (40):         The type of query is SELECT.
   W (41): 
   W (42):         FROM TABLE
   W (43):             Worktable2.
   W (44):         Nested iteration.
   W (45):         Table Scan.
   W (46):         Forward scan.
   W (47):         Positioning at start of table.
   W (48):         Using I/O Size 2 Kbytes for data pages.
   W (49):         With MRU Buffer Replacement Strategy for data pages.
   W (50): 
   W (51): The sort for Worktable1 is done in Serial

Код: plaintext

1.
2.
3.
4.
5.

--запрос выполнялся  после предыдущего 30 сек.
select e, b,c, count(distinct a) from myTable
where Time >'2006-01-01' and Time <'2010-10-01'
group by e, b, c

go

План запроса:

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.

W (1): 
   W (2): QUERY PLAN FOR STATEMENT 1 (at line 2).
   W (3): 
   W (4): 
   W (5):     STEP 1
   W (6):         The type of query is INSERT.
   W (7):         The update mode is direct.
   W (8): 
   W (9):         FROM TABLE
   W (10):            myTable
   W (11):         Nested iteration.
   W (12):         Index : IndexmyTable_ALL
   W (13):         Forward scan.
   W (14):         Positioning by key.
   W (15):         Index contains all needed columns. Base table will not be read.
   W (16):         Keys are:
   W (17):             Time  ASC
   W (18):         Using I/O Size 2 Kbytes for index leaf pages.
   W (19):         With LRU Buffer Replacement Strategy for index leaf pages.
   W (20):         TO TABLE
   W (21):             Worktable1.
   W (22): 
   W (23):     STEP 2
   W (24):         The type of query is SELECT (into Worktable2).
   W (25):         GROUP BY
   W (26):         Evaluate Grouped COUNT AGGREGATE.
   W (27): 
   W (28):         FROM TABLE
   W (29):             Worktable1.
   W (30):         Nested iteration.
   W (31):         Table Scan.
   W (32):         Forward scan.
   W (33):         Positioning at start of table.
   W (34):         Using I/O Size 2 Kbytes for data pages.
   W (35):         With MRU Buffer Replacement Strategy for data pages.
   W (36):         TO TABLE
   W (37):             Worktable2.
   W (38): 
   W (39):     STEP 3
   W (40):         The type of query is SELECT.
   W (41): 
   W (42):         FROM TABLE
   W (43):             Worktable2.
   W (44):         Nested iteration.
   W (45):         Table Scan.
   W (46):         Forward scan.
   W (47):         Positioning at start of table.
   W (48):         Using I/O Size 2 Kbytes for data pages.
   W (49):         With MRU Buffer Replacement Strategy for data pages.
   W (50): 
   W (51): The sort for Worktable1 is done in Serial

Пробовал ставить mru, lru. Приоритет у mru, но лучше вообще не указывать.

Думал насчет параллелизма. Только реализовать пока что невозможно.
Требование: чтобы запрос выполнялся за 5 сек.

...

Рейтинг:

0 / 0

03.12.2010, 07:45

| Ответить | Цитировать | Написать

select (distinct). Оптимизация в древнем Sybase

#36992543

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

За день появляется около 6 тыс записей. Инфа возрастает по времени и a,b,c
--с утра незакешированный запрос выполнялся 3.30 минут

Пока суть да дело -- предварительный вопрос: вы что на ночь сервера выключаете что ли?

...

Рейтинг:

0 / 0

03.12.2010, 09:35

| Ответить | Цитировать | Написать

select (distinct). Оптимизация в древнем Sybase

#36992550

Nieky

Гость

Нет, не выключаем.
Но я хотел этим сказать, что если одно и тоже часто выполнять, то оно практически за секунды выполняется.
А если пройдет какое-то время, то сначала медленно, а потом снова ускоряется выполнение запроса на том же промежутке тех же данных.
Поэтому и написал: незакэшированные данные).

Сегодня еще погонял эти запросы. И они начали снова за 30 сек оба выполняться.

...

Рейтинг:

0 / 0

03.12.2010, 09:39

| Ответить | Цитировать | Написать

select (distinct). Оптимизация в древнем Sybase

#36992576

cherrex_Den

Гость

Nieky,

А проблема в чем? То что у вас происходит вымывание кэша, или то, что (в общем) медленно работают запросы такого рода?
30сек это хорошо или плохо???

...

Рейтинг:

0 / 0

03.12.2010, 09:52

| Ответить | Цитировать | Написать

select (distinct). Оптимизация в древнем Sybase

#36992583

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

On 03.12.2010 7:45, Nieky wrote:

Вопрос номер 2:

> select e, b, count(distinct a)
> from myTable
> where Time >'2006-01-01' and Time <'2010-10-01'
> group by e, b
>
> go

> --запрос выполнялся после предыдущего 30 сек.
> select e, b,c, count(distinct a) from myTable
> where Time >'2006-01-01' and Time <'2010-10-01'
> group by e, b, c

Какой из этих двух запросов вам нужно оптимизировать ?

> select e, b, count(distinct a)
> from myTable
> where Time >'2006-01-01' and Time <'2010-10-01'
> group by e, b

Под этот хорошо бы индекс ( Time, e, b )

или просто Time (уже есть)

> --запрос выполнялся после предыдущего 30 сек.
> select e, b,c, count(distinct a) from myTable
> where Time >'2006-01-01' and Time <'2010-10-01'
> group by e, b, c

Под этот хорошо бы индекс ( Time, e, b, c )

или просто Time (уже есть)

Индекс IndexmyTable_ALL сразу же убирай на фиг.
Не нужен индекс, содержащий все колонки. Только оптимизатор путать.

Что возвращают эти запросы :

select count(*)
from myTable
where Time >'2006-01-01' and Time <'2010-10-01'

select count(*) from myTable

Ну и два замечания: ASE 12.5 -- не древний вовсе.
Древний -- это 11.0

Ну и в реляционных многопользовательских СУБД
требования типа "чтобы запрос выполнялся за 5 сек."
извини не катят. Можно только "чтобы запрос в среднем выполнялся за 5 сек.".
Posted via ActualForum NNTP Server 1.4

...

Рейтинг:

0 / 0

03.12.2010, 09:55

| Ответить | Цитировать | Написать

9 сообщений из 9, страница 1 из 1

Форумы / Sybase ASA, ASE, IQ [игнор отключен] [закрыт для гостей] / select (distinct). Оптимизация в древнем Sybase

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=55&msg=36991596&tid=2010457]:	0ms
get settings:	8ms
get forum list:	20ms
check forum access:	4ms
check topic access:	4ms
track hit:	52ms
get topic data:	12ms
get forum data:	3ms
get page messages:	72ms
get tp. blocked users:	2ms
others:	227ms

total:	404ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы