Еще раз о ramdisk / Firebird, InterBase

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Firebird, InterBase [игнор отключен] [закрыт для гостей] / Еще раз о ramdisk

25 сообщений из 47, страница 1 из 2

все

Еще раз о ramdisk

#38562224

bazilio77

Гость

FB 2.5.

База FW=OFF

В одной таблице 4 477 968 записей. нужно перекачать их в соседнюю таблицу похожей структуры.
Решил проверить будет ли быстрее работа на ramdisk. Оказалось что на ramdisk экономия всего 24%.

CREATE TABLE RCP_RAW_QLT (
RCPREP_ID ID,
QLT_ID ID,
QLT_VAL REAL_WNULL,
VALUE_IN_DM REAL_WNULL,
VALUE_NATIVE REAL_WNULL,
VALUE_PREMIX REAL_WNULL,
CONSTRAINT PK_RCP_RAW_QLT PRIMARY KEY (RCPREP_ID, QLT_ID),
CONSTRAINT FK_RCP_RAW_QLT_QLT_ID FOREIGN KEY (QLT_ID) REFERENCES QM_DICT (QLT_ID),
CONSTRAINT FK_RCP_RAW_QLT_RCPREP_ID FOREIGN KEY (RCPREP_ID) REFERENCES RCPREP (RCPREP_ID) ON DELETE CASCADE
);

запрос

insert into RCP_RAW_QLT (RCPREP_ID, QLT_ID, QLT_VAL, VALUE_NATIVE, VALUE_PREMIX)
select RR.RCPREP_ID, RQ.QLT_ID, RQ.QLT_VAL, RQ.VALUE_NATIVE, RQ.VALUE_PREMIX
from RCPREP RR
join RCPRQLT RQ on RR.RCP_ID = RQ.RCP_ID and
RR.RAW_ID = RQ.RAW_ID;

RAM 2.23 минуты
Query Time
------------------------------------------------
Prepare : 16,00 ms
Execute : 142 195,00 ms
Avg fetch time: 0,00 ms

Memory
------------------------------------------------
Current: 262 186 112
Max : 264 527 168
Buffers: 60 480

Operations
------------------------------------------------
Read : 85 882
Writes : 135 689
Fetches: 136 491 901
Marks : 18 418 925

HDD 2.56 минуты

Query Time
------------------------------------------------
Prepare : 16,00 ms
Execute : 176 749,00 ms
Avg fetch time: 0,00 ms

Memory
------------------------------------------------
Current: 262 186 956
Max : 264 528 436
Buffers: 60 480

Operations
------------------------------------------------
Read : 85 881
Writes : 270 810
Fetches: 136 491 901
Marks : 18 486 521

...

Рейтинг:

0 / 0

16.02.2014, 13:56:35

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562229

Таблоид

Участник

Сообщения: 9 702

Рейтинг: 0 / 0

bazilio77CREATE TABLE RCP_RAW_QLT (
RCPREP_ID ID,
QLT_ID ID,
QLT_VAL REAL_WNULL,
VALUE_IN_DM REAL_WNULL,
VALUE_NATIVE REAL_WNULL,
VALUE_PREMIX REAL_WNULL,
CONSTRAINT PK_RCP_RAW_QLT PRIMARY KEY (RCPREP_ID, QLT_ID),
CONSTRAINT FK_RCP_RAW_QLT_QLT_ID FOREIGN KEY (QLT_ID) REFERENCES QM_DICT (QLT_ID),
CONSTRAINT FK_RCP_RAW_QLT_RCPREP_ID FOREIGN KEY (RCPREP_ID) REFERENCES RCPREP (RCPREP_ID) ON DELETE CASCADE
);Констрейнты на target-таблице можете временно drop, а после инсертов add ? если да, то попробуйте.

...

Рейтинг:

0 / 0

16.02.2014, 14:18:47

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562232

Таблоид

Участник

Сообщения: 9 702

Рейтинг: 0 / 0

PS. Если констрейнты на target-таблице заглушать нельзя, покажите значение параметра TempCacheLimit. Судя по PK = (RCPREP _ID , QLT _ID ), для создания этого индекса "внутри" TempCacheLimit'a надо установить его не менее 4500000 * (20 + 4 +4 ) = ~126 Mb.

...

Рейтинг:

0 / 0

16.02.2014, 14:25:19

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562368

bazilio77

Гость

ТаблоидPS. Если констрейнты на target-таблице заглушать нельзя, покажите значение параметра TempCacheLimit. Судя по PK = (RCPREP _ID , QLT _ID ), для создания этого индекса "внутри" TempCacheLimit'a надо установить его не менее 4500000 * (20 + 4 +4 ) = ~126 Mb.

Спасибо за рекомендации. Но вопрос у меня чисто риторический.
Задача не практическая, а тестовая.
Почему выигрыш ramdiska на данной операции всего 25%. TempDir кстати тоже на ramdisk.
Я ожидал большего.
Получается в этой задаче мы упираемся в производительность самого сервера (чисто процессорная задача).

...

Рейтинг:

0 / 0

16.02.2014, 18:08:17

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562373

Таблоид

Участник

Сообщения: 9 702

Рейтинг: 0 / 0

bazilio77ТаблоидPS. Если констрейнты на target-таблице заглушать нельзя, покажите значение параметра TempCacheLimit. Судя по PK = (RCPREP _ID , QLT _ID ), для создания этого индекса "внутри" TempCacheLimit'a надо установить его не менее 4500000 * (20 + 4 +4 ) = ~126 Mb.

Спасибо за рекомендации. Но вопрос у меня чисто риторический.
Задача не практическая, а тестовая.
Почему выигрыш ramdiska на данной операции всего 25%. TempDir кстати тоже на ramdisk.
Я ожидал большего.
Получается в этой задаче мы упираемся в производительность самого сервера (чисто процессорная задача).Вы не показали свой TempCacheLimit.

...

Рейтинг:

0 / 0

16.02.2014, 18:17:09

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562377

bazilio77

Гость

ТаблоидВы не показали свой TempCacheLimit.
Стандартный.

...

Рейтинг:

0 / 0

16.02.2014, 18:20:22

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562378

bazilio77

Гость

bazilio77ТаблоидВы не показали свой TempCacheLimit.
Стандартный.
Кстати при чем тут TempCacheLimit если и база и TempDir находятся на ramdiske

...

Рейтинг:

0 / 0

16.02.2014, 18:22:26

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562382

bazilio77

Гость

ТаблоидВы не показали свой TempCacheLimit.
Сделал TempCacheLimit 250 Мб. Ничего не поменялось Время 2:21.

...

Рейтинг:

0 / 0

16.02.2014, 18:31:30

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562383

NickDee

Участник

Сообщения: 1 395

Рейтинг: 0 / 0

bazilio77ТаблоидВы не показали свой TempCacheLimit.
Сделал TempCacheLimit 250 Мб. Ничего не поменялось Время 2:21.
А загрузка ядра процессора какая?

...

Рейтинг:

0 / 0

16.02.2014, 18:32:17

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562386

Таблоид

Участник

Сообщения: 9 702

Рейтинг: 0 / 0

bazilio77Стандартный.Он разный для SS (64 М) vs SC/CS (8M).
bazilio77Кстати при чем тут TempCacheLimit если и база и TempDir находятся на ramdiskeКогда движку не хватает TempCacheLimit, он начинает выталкивать данные на диск, в каталог, заданный параметром TempDirs. ДАЖЕ ЕСЛИ В СИСТЕМЕ ЕЩЕ ПОЛНО ПАМЯТИ. В виндузе это видно просмотром соотв. каталога, в линухе - командой lsof -a +L1 <temp_folder_mount_point>: там появляются и растут времянки.

Ну так вот: даже если параметр TempDirs указывает на ram-диск, обмен между "внутренней" памятью, которая была зарезервирована под TCL, и "наружней", настолько затратен, что там почти без разницы, жесткий это диск или ram. Совсем недавно я напоролся как раз на это, вот тынц .

...

Рейтинг:

0 / 0

16.02.2014, 18:34:41

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562389

dimitr

Участник

Откуда: PNZ

Сообщения: 7 059

Рейтинг: 0 / 0

bazilio77Почему выигрыш ramdiska на данной операции всего 25%
потому что FW=OFF

...

Рейтинг:

0 / 0

16.02.2014, 18:39:32

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562391

dimitr

Участник

Откуда: PNZ

Сообщения: 7 059

Рейтинг: 0 / 0

ТаблоидКогда движку не хватает TempCacheLimit, он начинает выталкивать данные на диск, в каталог, заданный параметром TempDirs. ДАЖЕ ЕСЛИ В СИСТЕМЕ ЕЩЕ ПОЛНО ПАМЯТИ.
вот любишь ты по результатам пары экспериментов обобщенные выводы делать...

...

Рейтинг:

0 / 0

16.02.2014, 18:40:32

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562393

Таблоид

Участник

Сообщения: 9 702

Рейтинг: 0 / 0

dimitrТаблоидКогда движку не хватает TempCacheLimit, он начинает выталкивать данные на диск, в каталог, заданный параметром TempDirs. ДАЖЕ ЕСЛИ В СИСТЕМЕ ЕЩЕ ПОЛНО ПАМЯТИ.
вот любишь ты по результатам пары экспериментов обобщенные выводы делать...Но ведь ФБ не будет оттяпывать себе еще памяти под темпспейс, если TCL исчерпан ?

...

Рейтинг:

0 / 0

16.02.2014, 18:45:10

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562398

dimitr

Участник

Откуда: PNZ

Сообщения: 7 059

Рейтинг: 0 / 0

Таблоид,

не будет. Но пишет он в кеш файловой системы, так что СВОБОДНАЯ ПАМЯТЬ В СИСТЕМЕ ТАКИ БУДЕТ ИСПОЛЬЗОВАТЬСЯ.

...

Рейтинг:

0 / 0

16.02.2014, 18:55:28

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562401

Таблоид

Участник

Сообщения: 9 702

Рейтинг: 0 / 0

dimitrне будет. Но пишет он в кеш файловой системы, так что СВОБОДНАЯ ПАМЯТЬ В СИСТЕМЕ ТАКИ БУДЕТ ИСПОЛЬЗОВАТЬСЯ.да, но я *сразу* после старта видел fb_* файлы в tempfs или в /tmp (когда TCL был мал) - это что получается, сама операционка их начинала записывать ?

...

Рейтинг:

0 / 0

16.02.2014, 19:00:07

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562402

dimitr

Участник

Откуда: PNZ

Сообщения: 7 059

Рейтинг: 0 / 0

Таблоидда, но я *сразу* после старта видел fb_* файлы в tempfs или в /tmp (когда TCL был мал) - это что получается, сама операционка их начинала записывать ?
они создаются сразу по исчерпании TCL, с нулевым размером. А вот писать туда ось начинает отнюдь не сразу. И уж тем более читает из своего кеша, а не с диска.

...

Рейтинг:

0 / 0

16.02.2014, 19:06:50

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562472

bazilio77

Гость

Резюме: FW=OFF при достаточном кэше нисколько не проигравыет ramdisk.

...

Рейтинг:

0 / 0

16.02.2014, 21:13:23

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562491

dimitr

Участник

Откуда: PNZ

Сообщения: 7 059

Рейтинг: 0 / 0

bazilio77,

во-первых, только при установленных в -1 параметрах MaxUnflushed* в конфиге. Во-вторых, все-таки проигрывает, пусть и немного.

...

Рейтинг:

0 / 0

16.02.2014, 22:13:14

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562569

Таблоид

Участник

Сообщения: 9 702

Рейтинг: 0 / 0

dimitrвсе-таки проигрывает, пусть и немного.на линухе при следующих изменённых параметрах конфига (NB: DefaultDBCachePages = 2048; арх-ра = SuperClassic; версия = LI-T3.0.0.30876):

Код: plaintext

1.
2.
3.
4.

FileSystemCacheThreshold = 65536K
RemoteServicePort = 3333
TempBlockSize = 67108864
TempCacheLimit = 1073741824
TempDirectories = /dev/shm;/tmp

- и вставке 5 млн строк в таблицу c последующим их удалением, картина следующая:
DDL:

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.

recreate table t(id int primary key, s01 varchar(36), s02 varchar(36), s03 varchar(36) );
commit;
create index t_s01 on t(s01);
create index t_s02 on t(s02);
create index t_s03 on t(s03);
commit;
set term ^;
execute block as
begin
  begin
    execute statement 'create sequence g';
    when any do begin end
  end
end^
set term ;^
commit;
alter sequence g restart with 0;
commit;

-- 1'000'000 ==> 352 Mb
-- 5'000'000 ==> 1700Mb, ~7 min
set stat on;
set term ^;
execute block as
  declare n int = 5000000;
begin
  while (n>0) do
    insert into t(id, s01, s02, s03)
    values( :n +iif( mod(:n,1000)=0, 0*gen_id(g,1000), 0),
            uuid_to_char(gen_uuid()),
            uuid_to_char(gen_uuid()),
            uuid_to_char(gen_uuid())
          ) returning :n-1 into n;
end^
set term ;^

set echo on;

commit;
select count(*) from t;
delete from t;
commit;
set echo off;
show version;
show database;
set echo on;
exit;

1. FW = OFF, база создана на ram-диске /dev/shm: ins = 381.75", del=11.78"

log

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.

$ /opt/fb30trnk/bin/isql -q
SQL> create database 'tmpram.fdb';
SQL> quit;

$ /opt/fb30trnk/bin/gfix -w async /dev/shm/tmpram.fdb

$ /opt/fb30trnk/bin/gstat -h tmpram.fdb |grep -i attributes
        Attributes

$ /opt/fb30trnk/bin/isql localhost/3333:/dev/shm/tmpram.fdb
Database:  localhost/3333:/dev/shm/tmpram.fdb

SQL> in /var/db/fb30/instest.sql;
Current memory = 12594992
Delta memory = 206248
Max memory = 17706016
Elapsed time= 381.750 sec
Cpu = 0.000 sec
Buffers = 2048
Reads = 20827420
Writes = 15445615
Fetches = 111122956

commit;
Current memory = 12520344
Delta memory = -74648
Max memory = 17706016
Elapsed time= 0.004 sec
Cpu = 0.000 sec
Buffers = 2048
Reads = 1
Writes = 1106
Fetches = 2
select count(*) from t;

                COUNT
=====================
              5000000

Current memory = 12557232
Delta memory = 25800
Max memory = 17706016
Elapsed time= 3.134 sec
Cpu = 0.000 sec
Buffers = 2048
Reads = 200440
Writes = 0
Fetches = 10400445

delete from t;
Current memory = 12659296
Delta memory = 102064
Max memory = 17770280
Elapsed time= 11.779 sec
Cpu = 0.000 sec
Buffers = 2048
Reads = 200448
Writes = 198001
Fetches = 25400488

commit;
Current memory = 12633744
Delta memory = -25552
Max memory = 17770280
Elapsed time= 0.006 sec
Cpu = 0.000 sec
Buffers = 2048
Reads = 1
Writes = 2001
Fetches = 2

set echo off;
ISQL Version: LI-T3.0.0.30876 Firebird 3.0 Alpha 2
Server version:
Firebird/Linux/AMD/Intel/x64 (access method), version "LI-T3.0.0.30876 Firebird 3.0 Alpha 2"
Firebird/Linux/AMD/Intel/x64 (remote server), version "LI-T3.0.0.30876 Firebird 3.0 Alpha 2/tcp (oel64)/P13"
Firebird/Linux/AMD/Intel/x64 (remote interface), version "LI-T3.0.0.30876 Firebird 3.0 Alpha 2/tcp (oel64)/P13"
on disk structure version 12.0
Database: localhost/3333:/dev/shm/tmpram.fdb
        Owner: SYSDBA
PAGE_SIZE 4096
Number of DB pages allocated = 435904
Sweep interval = 20000
Forced Writes are OFF
Transaction - oldest = 22
Transaction - oldest active = 23
Transaction - oldest snapshot = 23
Transaction - Next = 24
ODS = 12.0
Default Character set: NONE
exit;

2. FW = OFF, база создана на hdd-диске, в каталоге /tmp: ins=443.78", del=11.89"

log

Код: plaintext

$ /opt/fb30trnk/bin/isql -q
SQL> create database '/tmp/tmphdd.fdb';
SQL> quit;

$ /opt/fb30trnk/bin/gfix -w async /tmp/tmphdd.fdb


$ /opt/fb30trnk/bin/gstat -h /tmp/tmphdd.fdb | grep -i attributes
        Attributes


$ /opt/fb30trnk/bin/isql localhost/3333:/tmp/tmphdd.fdb -i /var/db/fb30/instest.sql
Current memory = 12594984
Delta memory = 206248
Max memory = 17706008
Elapsed time= 443.738 sec
Cpu = 0.000 sec
Buffers = 2048
Reads = 20826670
Writes = 15444747
Fetches = 111069310

commit;
Current memory = 12520336
Delta memory = -74648
Max memory = 17706008
Elapsed time= 0.025 sec
Cpu = 0.000 sec
Buffers = 2048
Reads = 1
Writes = 1129
Fetches = 2

select count(*) from t;

                COUNT
=====================
              5000000

Current memory = 12557224
Delta memory = 25800
Max memory = 17706008
Elapsed time= 3.191 sec
Cpu = 0.000 sec
Buffers = 2048
Reads = 200440
Writes = 0
Fetches = 10400445

delete from t;
Current memory = 12659288
Delta memory = 102064
Max memory = 17770272
Elapsed time= 11.895 sec
Cpu = 0.000 sec
Buffers = 2048
Reads = 200448
Writes = 198056
Fetches = 25400488

commit;
Current memory = 12633736
Delta memory = -25552
Max memory = 17770272
Elapsed time= 0.007 sec
Cpu = 0.000 sec
Buffers = 2048
Reads = 1
Writes = 1946
Fetches = 2

set echo off;
ISQL Version: LI-T3.0.0.30876 Firebird 3.0 Alpha 2
Server version:
Firebird/Linux/AMD/Intel/x64 (access method), version "LI-T3.0.0.30876 Firebird 3.0 Alpha 2"
Firebird/Linux/AMD/Intel/x64 (remote server), version "LI-T3.0.0.30876 Firebird 3.0 Alpha 2/tcp (oel64)/P13"
Firebird/Linux/AMD/Intel/x64 (remote interface), version "LI-T3.0.0.30876 Firebird 3.0 Alpha 2/tcp (oel64)/P13"
on disk structure version 12.0
Database: localhost/3333:/tmp/tmphdd.fdb
        Owner: SYSDBA
PAGE_SIZE 4096
Number of DB pages allocated = 435776
Sweep interval = 20000
Forced Writes are OFF
Transaction - oldest = 22
Transaction - oldest active = 23
Transaction - oldest snapshot = 23
Transaction - Next = 24
ODS = 12.0
Default Character set: NONE
exit;

Вставки выигрывают примерно на 16%.
Удаления и подсчет числа записей, как видно, остались одинаковыми.

...

Рейтинг:

0 / 0

17.02.2014, 01:38:38

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562572

Таблоид

Участник

Сообщения: 9 702

Рейтинг: 0 / 0

0xFF.
Когда вставка идёт в индексированную GTT, то было бы круто обновлять её индексы НЕ на каждой записи, а после окончания обработки "входного потока". Т.е. пока идёт заливка строк с 1-ой по 100499-ю - плевать на индексы, оставляем их в "несоответствующем" (новым данным) виде.
/* Роллбак посередине случился - тем лучше, меньше откатывать надо (для gtt on commit preserve rows).
Авария хоста - вообще по барабану, GTT и не должны при этом ничего сохранять. */
Когда же заканчивается добавление 100500-ой строки - обновляем все индексы на основе новых данных. Есть смутное сомнение, что так будет быстрее, чем сейчас.
Да, я помню прекрасно, что "в GTT сделано почти всё также, как в fixed-таблицах", ибо времени было в обрез и проч. Это я просто высказал идею на будущее, чтобы в воздухе не растворилась... :-)

...

Рейтинг:

0 / 0

17.02.2014, 01:48:24

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562580

hvlad

Участник

Сообщения: 13 125

Рейтинг: 0 / 0

ТаблоидКогда вставка идёт в индексированную GTT, то было бы круто обновлять её индексы НЕ на каждой записи, а после окончания обработки "входного потока". Т.е. пока идёт заливка строк с 1-ой по 100499-ю - плевать на индексы, оставляем их в "несоответствующем" (новым данным) виде.А что такое "входной поток" ? Где он начинается и где заканчивается ?
И где найти ключи от всего только что вставленного "потока" ? Перечитывать 100500 записей ? Или копить всё в (резиновой) памяти по ходу вставок ?
За контроль уникальности я даже не заикаюсь.
При чём тут вообще GTT\не GTT ???

...

Рейтинг:

0 / 0

17.02.2014, 02:30:53

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562584

kdv

Участник

Откуда: iBase.ru

Сообщения: 30 139

Рейтинг: 0 / 0

Таблоид,

насколько я в курсе, сейчас можно либо обновить один ключ, либо построить все ключи по всем записям, и пофиг это ГТТ или нет.
для "отложенного до-индексирования" все равно пришлось бы целиком сканировать таблицу, проверяя, есть уже такие ключи, или нет. Хотя, по идее, "достроить" ключи быстрее, чем целиком перестроить весь индекс. Но такого механизма все равно (пока) нет.
И он достаточно опасен. Например, в таблицу с 10 млн записей добавляем 1000 записей с "отложенным индексированием". В результате придется потом прочитать все 10млн записей, да еще и 10млн индексных чтений сделать.
Так что спорная штука.

...

Рейтинг:

0 / 0

17.02.2014, 02:33:05

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562875

Таблоид

Участник

Сообщения: 9 702

Рейтинг: 0 / 0

hvladА что такое "входной поток" ? Где он начинается и где заканчивается ?эммм... ну вот когда движок начинает делать вот такое:

Код: sql

insert into t select ... from s;

- то разве он не "чувствует", когда заканчиваются данные из источника ? Трейс же имеет ключик log_statement_finish - он же "видит" каким-то образом этот самый "финиш"...
hvladИ где найти ключи от всего только что вставленного "потока" ? Перечитывать 100500 записей ? Или копить всё в (резиновой) памяти по ходу вставок ?Даже если перечитывать (тест см ниже), будет ощутимый выигрыш. А если накапливать в памяти, так еще больше. Ибо чтобы исчерпать современные 16/32/64 Гб - это постараться надо.
К тому же, накапливая ключи в памяти, можно "на ходу" понять, хватит ли имеющейся памяти или нет и прекратить это накопление, выполенив в итоге простое перечитывание.
hvladЗа контроль уникальности я даже не заикаюсь.Я вёл речь только об insert'ах; delete & update тоже сюда подойдут. Merge - нет, тут безусловно надо контролировать сразу для каждой записи.
Если же прога написана так, что делает insert'ы недопустимых дубликатов - разраб ССЗБ, пусть переписывает на merge.
hvladПри чём тут вообще GTT\не GTT ???При том, что на них:
1) должен получиться наибольший выигрыш, т.к. их данные хранятся в /dev/shm (если настроить TempDirs как надо), там выключены careful writes;
2) в случае реализации такой фичи всякие ошибки (алгоритма этой реализации) будут менее болезненными. Ибо времянки.

Результат теста предсказуем и не интересен, но пусть будет как аргумент.

variant #1.
Создаем GTT, напихиваем в неё данные (5 млн строк), а затем перечитываем её всю для построения индексов:]

perfins_deferred_index_rebuild.sql

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.

set autoddl off;
commit;
recreate global temporary table gtt(id int, s01 varchar(36), s02 varchar(36), s03 varchar(36) )
on commit preserve rows;
commit;

set stat on;
set echo on;
set term ^;
execute block as
  declare n int = 5000000;
  declare i int = 0;
begin
  while (i<n) do
    insert into gtt(id, s01, s02, s03)
    values( :i,
            uuid_to_char(gen_uuid()),
            uuid_to_char(gen_uuid()),
            uuid_to_char(gen_uuid())
          ) returning :i+1 into i;
end^
set term ;^
set stat off;
set echo on;
create unique index t_id on gtt(id);
create index t_s01 on gtt(s01);
create index t_s02 on gtt(s02);
create index t_s03 on gtt(s03);
set stat on;
commit;
exit;

Output:

133 + 33 = 266 sec

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.

set term ^;
execute block as
  declare n int = 5000000;
  declare i int = 0;
begin
  while (i<n) do
    insert into gtt(id, s01, s02, s03)
    values( :i,
            uuid_to_char(gen_uuid()),
            uuid_to_char(gen_uuid()),
            uuid_to_char(gen_uuid())
          ) returning :i+1 into i;
end^
Current memory = 20987952
Delta memory = 103768
Max memory = 23776040
 Elapsed time= 133.044 sec 
Cpu = 0.000 sec
Buffers = 2048
Reads = 5
Writes = 98136
Fetches = 15801650
set term ;^
set stat off;
set echo on;

create unique index t_id on gtt(id);
create index t_s01 on gtt(s01);
create index t_s02 on gtt(s02);
create index t_s03 on gtt(s03);
set stat on;
commit;
Current memory = 21203848
Delta memory = 168672
Max memory = 357819008
 Elapsed time= 32.622 sec 
Cpu = 0.000 sec
Buffers = 2048
Reads = 400336
Writes = 75565
Fetches = 40948184
exit;

variant #2 . Создаем GTT и к ней сразу - те же самые индексы. Заливаем данные, заставляя движок обновлять на каждой записи 4 индекса:

perfins_immediate_index_updating.sql

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.

set autoddl off;
commit;
recreate global temporary table gtt(id int, s01 varchar(36), s02 varchar(36), s03 varchar(36) )
on commit preserve rows;
commit;
create unique index t_id on gtt(id);
create index t_s01 on gtt(s01);
create index t_s02 on gtt(s02);
create index t_s03 on gtt(s03);
commit;

set stat on;
set echo on;
set term ^;
execute block as
  declare n int = 5000000;
  declare i int = 0;
begin
  while (i<n) do
    insert into gtt(id, s01, s02, s03)
    values( :i,
            uuid_to_char(gen_uuid()),
            uuid_to_char(gen_uuid()),
            uuid_to_char(gen_uuid())
          ) returning :i+1 into i;
end^
set term ;^
commit;
exit;

Output:

472 sec

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.

set term ^;
execute block as
  declare n int = 5000000;
  declare i int = 0;
begin
  while (i<n) do
    insert into gtt(id, s01, s02, s03)
    values( :i,
            uuid_to_char(gen_uuid()),
            uuid_to_char(gen_uuid()),
            uuid_to_char(gen_uuid())
          ) returning :i+1 into i;
end^
Current memory = 21257024
Delta memory = 90056
Max memory = 24045376
 Elapsed time= 471.882 sec 
Cpu = 0.000 sec
Buffers = 2048
Reads = 14370102
Writes = 13999718
Fetches = 99245515
set term ;^
commit;
Current memory = 21201064
Delta memory = -55960
Max memory = 24045376
Elapsed time= 0.007 sec
Cpu = 0.000 sec
Buffers = 2048
Reads = 1
Writes = 1385
Fetches = 1
exit;

Разница = 472 / 266 = 1.77 раза.

...

Рейтинг:

0 / 0

17.02.2014, 13:13:13

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562880

Таблоид

Участник

Сообщения: 9 702

Рейтинг: 0 / 0

kdvв таблицу с 10 млн записей добавляем 1000 записей с "отложенным индексированием". В результате придется потом прочитать все 10млн записей, да еще и 10млн индексных чтений сделать.
Так что спорная штука.в идеале было бы накапливать добавленные ключики в памяти. Сейчас век дешёвых гига/терабайтов, времена поменялись уже лет 10 как бэ... :-)

...

Рейтинг:

0 / 0

17.02.2014, 13:14:41

| Ответить | Цитировать | Написать

Еще раз о ramdisk

#38562900

dimitr

Участник

Откуда: PNZ

Сообщения: 7 059

Рейтинг: 0 / 0

Таблоид,

времена поменялись, сервера уже давно многопользовательские, а ты все оптимизируешь исключительно для себя любимого. Выкинет твой волшебный инсерт все конкурентные сортировки в своп и придут по твою душу злые клиенты и/или админы. Будешь им рассказывать про новые времена и свой подход к дешевым гигабайтам.

...

Рейтинг:

0 / 0

17.02.2014, 13:24:15

| Ответить | Цитировать | Написать

25 сообщений из 47, страница 1 из 2

все

Форумы / Firebird, InterBase [игнор отключен] [закрыт для гостей] / Еще раз о ramdisk

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=40&fpage=103&tid=1563883]:	0ms
get settings:	9ms
get forum list:	14ms
check forum access:	3ms
check topic access:	3ms
track hit:	272ms
get topic data:	10ms
get forum data:	3ms
get page messages:	52ms
get tp. blocked users:	1ms
others:	234ms

total:	601ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы