Улучшить производительность WINDOW SORT / Oracle

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Oracle [игнор отключен] [закрыт для гостей] / Улучшить производительность WINDOW SORT

13 сообщений из 38, страница 2 из 2

все

Улучшить производительность WINDOW SORT

#39260009

ora601

Участник

Сообщения: 785

Рейтинг: 0 / 0

Nikolay SavvinovВсе известные мне решения (а я копал на эту тему достаточно давно и долго, и даже как-то Тома Кайта доставал на какой-то конференции этим вопросом) достаточно кривые, но для каких-то конкретных случаев работают ...

Как раз таки решение через index lookup, о котором говориться выше отлично справляется. booby был прав с подходом, но промазал с запросом, результата его запроса я не дождался (что и логично, ведь там еще присутствует ненужный group by, да и гарантии доступа по индексу нет).

На данных и индексах photoshop'a :

Код: plsql

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.
101.
102.
103.
104.
105.
106.
107.
108.
109.
110.
111.
112.
113.
114.
115.
116.
117.
118.
119.
120.
121.
122.
123.
124.
125.
126.
127.
128.
129.
130.
131.
132.
133.
134.
135.
136.
137.
138.
139.
140.
141.
142.
143.
144.
145.
146.
147.
148.
149.
150.
151.
152.
153.
154.
155.
156.
157.
158.
159.
160.
161.
162.
163.
164.
165.
166.
167.
168.
169.
170.
171.
172.
173.
174.
175.
176.
177.
178.
179.
180.
181.
182.
183.
184.
185.
186.
187.
188.
189.
190.
191.
192.
193.
194.
195.
196.
197.
198.
199.
200.
201.
202.
203.
204.
205.
206.
207.
208.
209.
210.
211.
212.
213.
214.
215.
216.
217.
218.
219.
220.
221.
222.
223.
224.
225.
226.
227.
228.
229.
230.
231.
232.
233.
234.
235.

SQL> drop table xt;

Table dropped.

Elapsed: 00:00:00.03
SQL>
SQL> create table xt(a, b not null,x1,x2,x3) as
  2  select trunc(level/1e5) a, dbms_random.value b,
  3  rownum x1, rownum x2, rownum x3
  4  from dual connect by level <= 2e6-1;

Table created.

Elapsed: 00:00:15.45
SQL>
SQL> create index xt_i on xt(a,b desc,x1,x2,x3);

Index created.

Elapsed: 00:00:11.32
SQL>
SQL> select *
  2    from (select xt.*, rank() over(partition by a order by b desc) rn
  3            from xt)
  4   where rn = 1;

20 rows selected.

Elapsed: 00:00:04.45

Execution Plan
----------------------------------------------------------
Plan hash value: 3812567171

--------------------------------------------------------------------------
| Id  | Operation         | Name | Rows  | Bytes | Cost (%CPU)| Time     |
--------------------------------------------------------------------------
|   0 | SELECT STATEMENT  |      |  1576K|   117M| 14846   (1)| 00:02:59 |
|*  1 |  VIEW             |      |  1576K|   117M| 14846   (1)| 00:02:59 |
|*  2 |   WINDOW NOSORT   |      |  1576K|    97M| 14846   (1)| 00:02:59 |
|   3 |    INDEX FULL SCAN| XT_I |  1576K|    97M| 14846   (1)| 00:02:59 |
--------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------

   1 - filter("RN"=1)
   2 - filter(RANK() OVER ( PARTITION BY "A" ORDER BY
              SYS_OP_DESCEND("B"))<=1)

Note
-----
   - dynamic sampling used for this statement (level=2)


Statistics
----------------------------------------------------------
          0  recursive calls
          0  db block gets
      14633  consistent gets
          0  physical reads
          0  redo size
       1758  bytes sent via SQL*Net to client
        430  bytes received via SQL*Net from client
          3  SQL*Net roundtrips to/from client
          0  sorts (memory)
          0  sorts (disk)
         20  rows processed

SQL> select a,
  2         max(b) b,
  3         max(x1) keep(dense_rank first order by b desc) x1,
  4         max(x2) keep(dense_rank first order by b desc) x2,
  5         max(x3) keep(dense_rank first order by b desc) x3
  6    from xt
  7   group by a;

20 rows selected.

Elapsed: 00:00:02.57

Execution Plan
----------------------------------------------------------
Plan hash value: 3894939874

---------------------------------------------------------------------------
| Id  | Operation          | Name | Rows  | Bytes | Cost (%CPU)| Time     |
---------------------------------------------------------------------------
|   0 | SELECT STATEMENT   |      |  1576K|    97M|  3538   (3)| 00:00:43 |
|   1 |  SORT GROUP BY     |      |  1576K|    97M|  3538   (3)| 00:00:43 |
|   2 |   TABLE ACCESS FULL| XT   |  1576K|    97M|  3470   (1)| 00:00:42 |
---------------------------------------------------------------------------

Note
-----
   - dynamic sampling used for this statement (level=2)


Statistics
----------------------------------------------------------
          0  recursive calls
          0  db block gets
      12577  consistent gets
      12573  physical reads
          0  redo size
       1683  bytes sent via SQL*Net to client
        430  bytes received via SQL*Net from client
          3  SQL*Net roundtrips to/from client
          1  sorts (memory)
          0  sorts (disk)
         20  rows processed

SQL> with t_unique(a) as
  2   (select min(t1.a) a from xt t1
  3    union all
  4    select (select min(t1.a) a from xt t1 where t1.a > t.a) from t_unique t w
here a is not null),
  5  xt_with_max_rowids AS
  6   (SELECT t1.a,
  7           (select t2.column_value rid
  8              FROM TABLE(cast(multiset (select t2.rowid rid
  9                                 from xt t2
 10                                where t1.a = t2.a
 11                                  and rownum = 1
 12                                order by t2.b desc) as sys.odcivarchar2list)
 13                         ) t2) rid_max
 14      from t_unique t1)
 15  SELECT * FROM xt t1 WHERE rowid IN (SELECT rid_max FROM xt_with_max_rowids)
;

20 rows selected.

Elapsed: 00:00:00.01

Execution Plan
----------------------------------------------------------
Plan hash value: 723862557

--------------------------------------------------------------------------------

-------------------------

| Id  | Operation                                    | Name     | Rows  | Bytes
| Cost (%CPU)| Time     |

--------------------------------------------------------------------------------

-------------------------

|   0 | SELECT STATEMENT                             |          | 31533 |    62M

|     9  (12)| 00:00:01 |

|   1 |  NESTED LOOPS                                |          | 31533 |    62M

|     9  (12)| 00:00:01 |

|   2 |   COLLECTION ITERATOR SUBQUERY FETCH         |          |     1 |     2
|     2   (0)| 00:00:01 |

|*  3 |    COUNT STOPKEY                             |          |       |
|            |          |

|*  4 |     INDEX RANGE SCAN                         | XT_I     | 15767 |   585K

|    62   (0)| 00:00:01 |

|   5 |   VIEW                                       | VW_NSO_1 |     2 |  4004
|     7  (15)| 00:00:01 |

|   6 |    HASH UNIQUE                               |          |     2 |    26
|     7  (15)| 00:00:01 |

|   7 |     VIEW                                     |          |     2 |    26
|     6   (0)| 00:00:01 |

|   8 |      UNION ALL (RECURSIVE WITH) BREADTH FIRST|          |       |
|            |          |

|   9 |       SORT AGGREGATE                         |          |     1 |    13
|            |          |

|  10 |        INDEX FULL SCAN (MIN/MAX)             | XT_I     |     1 |    13
|     3   (0)| 00:00:01 |

|  11 |       SORT AGGREGATE                         |          |     1 |    13
|            |          |

|  12 |        FIRST ROW                             |          |     1 |    13
|     3   (0)| 00:00:01 |

|* 13 |         INDEX RANGE SCAN (MIN/MAX)           | XT_I     |     1 |    13
|     3   (0)| 00:00:01 |

|* 14 |       RECURSIVE WITH PUMP                    |          |       |
|            |          |

|* 15 |   TABLE ACCESS BY USER ROWID                 | XT       | 15767 |  1185K

|     1   (0)| 00:00:01 |

--------------------------------------------------------------------------------

-------------------------


Predicate Information (identified by operation id):
---------------------------------------------------

   3 - filter(ROWNUM=1)
   4 - access("T2"."A"=:B1)
  13 - access("T1"."A">:B1 AND "T1"."A" IS NOT NULL)
  14 - filter("A" IS NOT NULL)
  15 - access(CHARTOROWID("RID_MAX"))

Note
-----
   - dynamic sampling used for this statement (level=2)


Statistics
----------------------------------------------------------
          0  recursive calls
          0  db block gets
        125  consistent gets
          0  physical reads
          0  redo size
       1683  bytes sent via SQL*Net to client
        430  bytes received via SQL*Net from client
          3  SQL*Net roundtrips to/from client
         22  sorts (memory)
          0  sorts (disk)
         20  rows processed

SQL>

Вообщем - то 00:00:04.45 vs 00:00:02.57 vs 00:00:00.01 , Довольно очевидно.

...

Рейтинг:

0 / 0

22.06.2016, 00:02

| Ответить | Цитировать | Написать

Улучшить производительность WINDOW SORT

#39260025

booby

Участник

Сообщения: 2 667

Рейтинг: 1 / 0

Николай,

попробую такой комментарий на ваш пост:
По части терминологии сорта "темпоральный", "битемпоральный"
и "правильного решения в рамках СУБД Oracle, к сожалению, не имеет", мое скромное мнение здесь стоит так:
эта опера другими словами поется.
В данном конкретном случае, речь идет всего лишь об ошибке в нормализации данных, допущенной разработчиком.

в задачах на получение "срезов" в любом случае возникает join.
Соединение периода актуальности среза с собственно данными, относящимися к этому срезу.

Там, где он реализован через самосоединение вида

Код: plsql

1.
2.
3.
4.
5.
6.
7.
8.
9.

Select t2.* From 
    (Select идентификатор_среза as geniuse_id, Max(дата_актуальности) as desired_date
    From креативно_дефектная_таблица
    Where
      дата_актуальности <= :D
    Group by идентификатор_среза) t1, креативно_дефектная_таблица t2
Where 
    t2.идентификатор_среза = t1.geniuse_id
And t2.дата_актуальности = t1.desired_date

он и выглядит нелепо и прямо является следствием допущенной ошибки проектирования.
И, также, нет сомнения, что виноват в этом только Oracle.
Поскольку позволяет невинному разработчику проектировать свои данные в эдаком стиле.
Ясно, что хорошая система так поступать не будет, и вовремя наставит ... разработчика на истинный путь.

Поскольку такие заходы встречаются чуть менее, чем повсеместно, простым пионэрством этого не объяснишь.

Имхо, в 10 случаях из 10 это является следствием того, что никакого "первого" или "последнего" среза в первоначальном дизайне просто не было.
Понимание и потребность в истории срезов пришла потом - по мере развития системы.
И выбран конкретный вариант как наименее затратный в смысле количества штук изменений, вносимых а архитектуру системы для минимально работоспособной реализации.
Так технический дефект заливается бетоном, превращаясь архитектуру, на примере которой следующие поколения пионэров
обучаются истинно правоверному би-темпоральному проектированию, одновременно с усвоением знаний о том, чего не может Oracle.

...

Рейтинг:

0 / 0

22.06.2016, 00:46

| Ответить | Цитировать | Написать

Улучшить производительность WINDOW SORT

#39260033

booby

Участник

Сообщения: 2 667

Рейтинг: 1 / 0

ora601,

прошу прощения.
имхо ваши изыскания целиком нерелевантны обсуждаемому случаю.

здесь принципиально , что на пару (a,b) может быть возвращено произвольное количество строк, а вы исходите из предположения о том, что их не более одной.

...

Рейтинг:

0 / 0

22.06.2016, 01:19

| Ответить | Цитировать | Написать

Улучшить производительность WINDOW SORT

#39260043

ora601

Участник

Сообщения: 785

Рейтинг: 0 / 0

boobyora601,

прошу прощения.
имхо ваши изыскания целиком нерелевантны обсуждаемому случаю.

здесь принципиально , что на пару (a,b) может быть возвращено произвольное количество строк, а вы исходите из предположения о том, что их не более одной.

Нужно найти для каждой группы а , b с максимальным b. "Возвращено" (куда? ), "не более одной" (строк, пар, ? ) - какой то сплошной вакуум. Приведи пример, чтобы было более понятно о чем ты пишешь.

...

Рейтинг:

0 / 0

22.06.2016, 02:24

| Ответить | Цитировать | Написать

Улучшить производительность WINDOW SORT

#39260081

Сергей Арсеньев

Участник

Сообщения: 4 121

Рейтинг: 0 / 0

ora601,

TC спрашивал, как найти строки у которых b максимальный. Таких строк может быть вся таблица, а может быть ни одной, а в особо тяжком случае это еще и не вся таблица. :)

...

Рейтинг:

0 / 0

22.06.2016, 07:51

| Ответить | Цитировать | Написать

Улучшить производительность WINDOW SORT

#39260087

Сергей Арсеньев

Участник

Сообщения: 4 121

Рейтинг: 0 / 0

Nikolay SavvinovПо понятным причинам эти workaroundы не столько решают проблему, сколько перекладывают ее с этапа опрашивания данных в этап их сохранения или модификации.

По идее, существуют темпоральные (и даже битемпоральные) СУБД в которых такие запросы должны и кодироваться легко, и выполняться влет.
Простите Николай. Но первое утверждение так же справедливо. Либо раскладываешь так, чтоб было удобно искать и теряешь время на записи, либо теряешь время на чтении.

Да для простых случаев можно использовать хранилища типа стек и т.п. Но это только в том случае если поиск идет по дате поступления, если же информация может поступать задним числом да еще и отменяться, то хоть так, хоть эдак надо тратить время.

И хранение последнего варианта отдельно не такой уж и плохой вариант и тоже один из способов решения проблемы и вполне допустимый.

...

Рейтинг:

0 / 0

22.06.2016, 08:05

| Ответить | Цитировать | Написать

Улучшить производительность WINDOW SORT

#39260228

Sayan Malakshinov

Модератор форума

Откуда: Мск

Сообщения: 5 731

Рейтинг: 0 / 0

Сергей Арсеньев,

Это SCD (slowly changing dimensions) тип 4

...

Рейтинг:

0 / 0

22.06.2016, 11:47

| Ответить | Цитировать | Написать

Улучшить производительность WINDOW SORT

#39260406

Сергей Арсеньев

Участник

Сообщения: 4 121

Рейтинг: 0 / 0

xtenderЭто SCD (slowly changing dimensions) тип 4
Ну да. Забавная, кстати, классификация.
Метод 4 (по сути методы 1+2), это не метод 3,
но метод 6 именно 6 потому, что 1+2+3. :)

...

Рейтинг:

0 / 0

22.06.2016, 14:53

| Ответить | Цитировать | Написать

Улучшить производительность WINDOW SORT

#39260427

Nikolay Savvinov

Гость

booby,

Вы берете какой-то сильно оптимистический случай, когда у вас временное измерение представлено только в одной таблице. А если их несколько, а если вся схема такая?

Возьмите, для конкретности, модель данных для фондового рынка. У вас есть таблица с движениями цен, таблицы, которые задают группировки объектов по каким-то более сложным структурам, вотч листы разные, портфолио конкретных трейдеров, таблицы, которые описывают самих трейдеров и т.д и т.п. И у всех этих данных есть динамическая компонента.

И постоянно вам будет нужно прогонять сложные запросы с многочисленными соединениями, которые для каждой из соединяемых таблиц будут брать данные по состоянию на какой-то конкретный момент времени. Ну то есть если вы считаете какие-то риски или балансы для какого-то трейд деска на 1е сентября 2010го года, то вам нужно брать и цены на этот момент, и состояние портфолио на этот момент, и какие трейдеры куда входили на тот момент и т.д. и т.п.

Вот если вам с самого начала известны требования, как вы их реализуете? Как вы все эти таблицы будете индексировать? Как секционировать, с учетом того, что достаточно быстро счет пойдет на миллиарды строк и терабайты данных?

Эта задача гораздо сложнее, чем может показаться на первый взгляд.

С уважением,
Николай

...

Рейтинг:

0 / 0

22.06.2016, 15:16

| Ответить | Цитировать | Написать

Улучшить производительность WINDOW SORT

#39328517

--Eugene--

Участник

Откуда: Боярышник

Сообщения: 2 193

Рейтинг: 0 / 0

Товарищи, кто-нибудь знает, есть ли разница между

Код: plaintext

max(a) keep (dense_rank first order by b)

Код: plaintext

max(a) keep (dense_rank last order by b desc)

?
(кроме NULLS FIRST/LAST - допустим, колонка b not null)

...

Рейтинг:

0 / 0

17.10.2016, 19:38

| Ответить | Цитировать | Написать

Улучшить производительность WINDOW SORT

#39328610

Sayan Malakshinov

Модератор форума

Откуда: Мск

Сообщения: 5 731

Рейтинг: 0 / 0

--Eugene--,

Года два назад, разницы для not null не было

...

Рейтинг:

0 / 0

18.10.2016, 02:10

| Ответить | Цитировать | Написать

Улучшить производительность WINDOW SORT

#39328617

--Eugene--

Участник

Откуда: Боярышник

Сообщения: 2 193

Рейтинг: 0 / 0

xtender,

не сочтите за дерзость, а откуда такая информация? (что "не было")

...

Рейтинг:

0 / 0

18.10.2016, 03:15

| Ответить | Цитировать | Написать

Улучшить производительность WINDOW SORT

#39328619

Sayan Malakshinov

Модератор форума

Откуда: Мск

Сообщения: 5 731

Рейтинг: 0 / 0

--Eugene--,

Пропустил слово: года два назад тестировал...

...

Рейтинг:

0 / 0

18.10.2016, 03:48

| Ответить | Цитировать | Написать

13 сообщений из 38, страница 2 из 2

все

Форумы / Oracle [игнор отключен] [закрыт для гостей] / Улучшить производительность WINDOW SORT

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=52&startmsg=39260009&tid=1887219]:	0ms
get settings:	10ms
get forum list:	15ms
check forum access:	4ms
check topic access:	4ms
track hit:	191ms
get topic data:	10ms
get forum data:	2ms
get page messages:	41ms
get tp. blocked users:	1ms
others:	226ms

total:	504ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы