powered by simpleCommunicator - 2.0.56     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Informix [игнор отключен] [закрыт для гостей] / Подает HDR. Не могу понять причину.
14 сообщений из 39, страница 2 из 2
Подает HDR. Не могу понять причину.
    #36400576
IDS Admin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
vasilis,

vasilisсами читаете, разбираетесь, пробуете, задаете внятные вопросы и также сами отвечаете.

А как иначе? Проблема ведь у меня возникла )) И на паблик форуме никто никому ничего не должен. Так что это с вами работать приятно)


vasilisПроверьте, на самом ли деле работает write-back.
Совсем не давно тут рассматривалась проблема падения производительности из-за автоматического отключения кэширования на запись.

Проверил, работает. Сделал простой тест на запись с работающим, а затем отключенным кэшем. В 1 поток. Объем данных сопоставим с объемом грязных страниц в буферах в момент КТ. Размер блока 2к и 4М для сравнения (просто не знаю, блоком какого размера IDS пишет на диск. Возможно, pagesize?).

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
кэш вкл

[root@ondbprm ~]# time dd if=/usr/logs/phys of=/usr/data/temp_of oflag=direct bs=2k count=128000
128000+0 records in
128000+0 records out
262144000 bytes (262 MB) copied, 7.91706 seconds, 33.1 MB/s

real    0m7.920s
user    0m0.024s
sys     0m1.104s

[root@ondbprm ~]# time dd if=/usr/logs/phys of=/usr/data/temp_of oflag=direct bs=4096k count=60
60+0 records in
60+0 records out
251658240 bytes (252 MB) copied, 1.06274 seconds, 237 MB/s

real    0m1.074s
user    0m0.000s
sys     0m0.122s

кэш выкл
[root@ondbprm ~]# time dd if=/usr/logs/phys of=/usr/data/temp_of oflag=direct bs=4096k count=60
60+0 records in
60+0 records out
251658240 bytes (252 MB) copied, 1.01192 seconds, 249 MB/s

real    0m1.023s
user    0m0.000s
sys     0m0.135s

[root@ondbprm ~]# time dd if=/usr/logs/phys of=/usr/data/temp_of oflag=direct bs=2k count=128000
128000+0 records in
128000+0 records out
262144000 bytes (262 MB) copied, 567.298 seconds, 462 kB/s


Для bs=2k без кэша совсем грустно). А для 4М разницы между вкл/выкл кэша просто нет.



vasilisPHYSFILE 16500000
Зачем такой огромный? Ведь обслуживать такой файл и искать там нужную точку тоже нужно время. В моей жизни 1-2Гб хватало даже в самых нагруженных системах, но на истину не претендую

Да, это я дал маху. Ориентировался на суммарный объем буферов. Совсем не учел, что в моем случае изменению подлежит лишь малая их часть. Уменьшил до 2 Гб. Посмотрим, каков будет результат.

vasilis
AUTO_AIOVPS 1
Тоже отключил бы и, помониторив, установил бы ручками.
Я не знаю логики работы этого автомата, но обычно они все заточены под некие очень стандартные и условные параметры. Знающий человек почти всегда сделает лучше.

Следующим шагом отключу и буду «руками» изменять.
vasilis
RESIDENT 0
рекомендую 1 или 2.

Изменил на 1.

vasilisCKPTINTVL 150
А зачем уменьшали диапазон ? Это меньше 3-х минут.
Установите стандартные 300, а я бы даже и увеличил до 600.[quote]

Когда не работали LRU, сократил время, чтобы суммарный объем грязных страниц был меньше. Сейчас вернул в 300.

[quote vasilis]AUTO_CKPTS 1
тоже самое, что я уже писал по поводу "автоматов"
Выключил

vasilisTAPEDEV /dev/null
LTAPEDEV /dev/null
А это как понять ?
У вас разве не промсистема ? Надеюсь, что это тестовая.
Куда пишутся архивы - на диск или ленту? если на диски, то блок можно увеличивать - в нашем ФАК-е помнится были исследования на эту тему...

Пишу на диски. Использую STDIO. Очень удобно. Вот, может пригодится кому:
Бекап
ontape -s -L 0 -t STDIO | gzip -1 > /back/full_backup.gz
gzip сжимает где-то в 10 раз. Процессора почти не ест (т.к. ключ -1).
Восстановление
zcat /back/full_backup.gz | ontape -r -t STDIO
И самое приятное, чтобы не прыгать с ленточкой по серверной, поднятие репликации по сети без файлов и лент:
На primary делаем скрипт /back/stdio_back.sh
# set IDS ENV
ontape -s -L 0 -t STDIO

На secondary запускаем
ssh primary “/back/stdio_back.sh" | gunzip | ontape -p -t STDIO
Ну и все, дальше onmode’ом переключаемся в primary/secondary. По сети перегоняется сжатый бекап. Одновременно работает как бекап так и восстановление, что положительно сказывается на времени работы.

(Когда в этом топике я пишу, что делаю ontape, значит я делаю ontape –s –L 0 –t STDIO | cat > /dev/null. Это чтобы исключить влияние gzip’а и записи файла с бекапом на диск)
По-моему только в 11ом появилось STDIO.


vasilisDS_NONPDQ_QUERY_MEM 128
Однозначно увеличить, хотя бы до 5М - это позволит увеличить память для сортировок

Увеличил до 10 М. Заодно пришлось увеличить и DS_TOTAL_MEMORY до 60М. Было по дефолту меньше 1М.

vasilisBUFFERPOOL size=2K,buffers=4000000,lrus=256,lru_min_dirty=0.100000,lru_max_dirty=0.300000
BUFFERPOOL size=8K,buffers=1500000,lrus=256,lru_min_dirty=0.500000,lru_max_dirty=1.000000
Такие огромные пулы требуюти больших расходов на свое обслуживание.
Надо тщательно помониторить процент кэширования и поиграться с размерами - вполне возможно, что ваша активная часть БД поместится и в значительно меньшем объеме. Тогда будет однозначный плюс для КТ.
+
Я бы установил еще большее количество очередей (мне кажется в 11.5 можно больше 256?) для таких огромных пулов, а также попробовал бы не так сильно уменьшать "окно" сброса, т.е. установил бы для начала на уровне 5 и 2% или даже 10 и 5.

Уменьшил в 2 раза кол-во буферов и увеличил LRU до 500. В моей версии максимум 512.

Теперь буфера выглядят так:
BUFFERPOOL default,buffers=10000,lrus=8,lru_min_dirty=50.000000,lru_max_dirty=60.500000
BUFFERPOOL size=2K,buffers=2000000,lrus=500,lru_min_dirty=0.400000,lru_max_dirty=1.200000
BUFFERPOOL size=8K,buffers=750000,lrus=500,lru_min_dirty=2.000000,lru_max_dirty=4.000000

vasilisБуфер сбрасывается в журнал целиком, а в среднем там меньше двух страниц, при размере буфера в 16 2К-страниц. Т.е. буфера переключаются слишком быстро и не успевают сбрасываться на диск (это если рассматривать ситуацию, описанную В.К.).
Если будет буферизация, то буфер будет сбрасываться только после заполнения, (т.е. преключения будут более редки) т.о. давая время на сброс двум другим буферам.

Спасибо, буду пробовать изменять размер буфера.

Статистику (profile_ из DBA_Tools) выложу, как только соберу
...
Рейтинг: 0 / 0
Подает HDR. Не могу понять причину.
    #36400589
IDS Admin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
АнатоЛойTo IDS Admin:
посмотри результаты (и нам покажи для общего развития)
Код: plaintext
1.
2.
3.
DATABASE sysmaster;
SET ISOLATION TO DIRTY READ;
SELECT * FROM syscheckpoint;
В таблице syscheckpoint куча доп. информации - может подтолкнёт нас к доп. размышлениям в нужную сторону :).

Вот только в syscheckpoint последние 20 чекпоинтов от текущего момента, поэтому попробуй выполнить запрос несколько раз с таким перерывом, чтобы попали все чекпоинты за интервал съёма статистики.

Спасибо, очень удобно. Вот, для моего последнего конфига данные для нескольких "плохих" КТ:

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
intvl	type		caller		clock_time	crit_time	flush_time	cp_time		n_dirty_buffs	plogs_per_sec	llogs_per_sec	dskflush_per_sec	ckpt_logid	ckpt_logpos	physused	logused	n_crit_waits	tot_crit_wait	longest_crit_wait	block_time
7878	Non-Blocking	CKPTINTVL 	1262951793	0.00001		13.29479	13.39282	35000		780		253		2632			1308		1528483864	244185		79391	2		0.11593	0.09488	0
7877	Non-Blocking	CKPTINTVL 	1262951479	0.00847		12.44997	12.54764	34569		775		209		2776			1308		1204076568	242828		65547	5		0.38113	0.09072	0
7876	Non-Blocking	CKPTINTVL 	1262951167	0.00721		13.0222		13.20554	34377		770		203		2639			1308		936083480	241895		63817	8		1.23069	0.1776	0
7875	Non-Blocking	CKPTINTVL 	1262950852	0.01725		12.1557		12.18814	35175		785		190		2893			1308		675184664	247396		60163	6		0.13348	0.02638	0
7874	Non-Blocking	CKPTINTVL 	1262950540	0.22424		14.87492	15.68018	36271		790		192		2438			1308		429200632	237160		57839	7		4.60566	0.79564	0
7873	Blocking    	Backup    	1262950225	0.00001		0.00625		5.70885		151		55		7		151			1308		192901144	557		70	6		0.56406	0.15984	0
7872	Non-Blocking	CKPTINTVL 	1262950218	0.00001		3.93569		3.98364		39662		530		156		10077			1308		192614424	159817		47005	1		0.00366	0.00366	0
7871	Non-Blocking	CKPTINTVL 	1262949914	0.00001		0.00082		0.00258		26		0		0		26			1308		339992		6		4	0		0	0	0
7870	Non-Blocking	HDR       	1262949594	0.00011		0.00179		0.89783		43		0		0		43			1308		323608		29		46	0		0	0	0
7869	Non-Blocking	Startup   	1262949495	0.00001		0.00107		0.00305		13		0		0		13			1308		135192		2		1	0		0	0	0

Нагрузка на БД равномерная, включил ontape сразу после КТ 7872. Время выросло с 4х до 12-16 сек ((
(При одинаковом кол-ве грязных страниц )
...
Рейтинг: 0 / 0
Подает HDR. Не могу понять причину.
    #36400592
IDS Admin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
DaugavaЯ не удивлюсь, если окажется, что к длинному чекпоинту приводит как раз ontape и опять проявился старый баг "OLD PAGES BACKUP", ибо я не верю в то, что он до конца побежден.
2006-й год
Спасибо, буду копать в этом направлении
...
Рейтинг: 0 / 0
Подает HDR. Не могу понять причину.
    #36401096
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
А можно поинтересоваться, почему Вы так привязались к контрольной точке. Ведь, начиная с версии 11 реализован неблокирующий механизм контрольных точек. И, судя по сообщениям топик-стартера, проблем с производительностью у него не было до тех пор, пока он не стал тюнинговать сервер:)
...
Рейтинг: 0 / 0
Подает HDR. Не могу понять причину.
    #36402268
vasilis
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
IDS Admin
Пишу на диски. Использую STDIO. Очень удобно. Вот, может пригодится кому:
Бекап
ontape -s -L 0 -t STDIO | gzip -1 > /back/full_backup.gz
gzip сжимает где-то в 10 раз. Процессора почти не ест (т.к. ключ -1).
Восстановление
zcat /back/full_backup.gz | ontape -r -t STDIO
И самое приятное, чтобы не прыгать с ленточкой по серверной, поднятие репликации по сети без файлов и лент:
На primary делаем скрипт /back/stdio_back.sh
# set IDS ENV
ontape -s -L 0 -t STDIO

На secondary запускаем
ssh primary “/back/stdio_back.sh" | gunzip | ontape -p -t STDIO
Ну и все, дальше onmode’ом переключаемся в primary/secondary. По сети перегоняется сжатый бекап. Одновременно работает как бекап так и восстановление, что положительно сказывается на времени работы.

Спасибо за конкретные примеры - дополню FAQ, а то он уже давненько не обновлялся на эту тему
IDS Admin
По-моему только в 11ом появилось STDIO.

начиная с версии IDS 10.00.xC3 утилита ontape может использовать Standard I/O
...
Рейтинг: 0 / 0
Подает HDR. Не могу понять причину.
    #36402313
vasilis
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
victor16А можно поинтересоваться, почему Вы так привязались к контрольной точке. Ведь, начиная с версии 11 реализован неблокирующий механизм контрольных точек. И, судя по сообщениям топик-стартера, проблем с производительностью у него не было до тех пор, пока он не стал тюнинговать сервер:)
Если начать читать с первого сообщения ТС то можно увидеть, что начали обсуждать падения HDR , которые возникли при длинных КТ на первичке. Т.е. КТ все таки не совсем безобидные. А так проблем с производительностью, действительно не было, по крайней мере, их не озвучивали.
...
Рейтинг: 0 / 0
Подает HDR. Не могу понять причину.
    #36403084
klepa
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Производительность упала потому ИМХО, что грязные буфера сбрасываются на диск все время, а не только во время КТ.
Посмотреть можно:

onstat -F
...
Рейтинг: 0 / 0
Подает HDR. Не могу понять причину.
    #36403139
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
klepaПроизводительность упала потому ИМХО, что грязные буфера сбрасываются на диск все время, а не только во время КТ.
Посмотреть можно:

onstat -Fа как сброс влияет на производительность? Сессии не ждут записи на диск грязных буферов.
...
Рейтинг: 0 / 0
Подает HDR. Не могу понять причину.
    #36403195
АнатоЛой
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Журавлев ДенисklepaПроизводительность упала потому ИМХО, что грязные буфера сбрасываются на диск все время, а не только во время КТ.
Посмотреть можно:

onstat -Fа как сброс влияет на производительность? Сессии не ждут записи на диск грязных буферов.
Что влияет - однозначно: появляются дополнительная нагрузка на диск. Вопрос только в том, насколько большая нагрузка и как долго это длится.
...
Рейтинг: 0 / 0
Подает HDR. Не могу понять причину.
    #36403204
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
АнатоЛойЖуравлев ДенисklepaПроизводительность упала потому ИМХО, что грязные буфера сбрасываются на диск все время, а не только во время КТ.
Посмотреть можно:

onstat -Fа как сброс влияет на производительность? Сессии не ждут записи на диск грязных буферов.
Что влияет - однозначно: появляются дополнительная нагрузка на диск. Вопрос только в том, насколько большая нагрузка и как долго это длится.косвенно, копейки, получается просто запись размазанная во времени, и добавляются перезаписи которые исчезли бы объединением (но мало).
...
Рейтинг: 0 / 0
Подает HDR. Не могу понять причину.
    #36403274
klepa
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Журавлев ДенисАнатоЛойЖуравлев ДенисklepaПроизводительность упала потому ИМХО, что грязные буфера сбрасываются на диск все время, а не только во время КТ.
Посмотреть можно:

onstat -Fа как сброс влияет на производительность? Сессии не ждут записи на диск грязных буферов.
Что влияет - однозначно: появляются дополнительная нагрузка на диск. Вопрос только в том, насколько большая нагрузка и как долго это длится.косвенно, копейки, получается просто запись размазанная во времени, и добавляются перезаписи которые исчезли бы объединением (но мало).

Сколько копеек покажет onstat -F

Whether buffer flushing occurs as part of an LRU write or a Chunk Write should be based on the nature of the system. LRU writes do not block the system, but are random in nature. Chunk Writes block the system, but are sequential in nature and tend to be more efficient for large writes. It is therefore preferable to have LRU writes occuring in a production system for normal operations and Chunk Writes for loads.
...
Рейтинг: 0 / 0
Подает HDR. Не могу понять причину.
    #36403285
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
klepaСколько копеек покажет onstat -F

Whether buffer flushing occurs as part of an LRU write or a Chunk Write should be based on the nature of the system. LRU writes do not block the system, but are random in nature. Chunk Writes block the system, but are sequential in nature and tend to be more efficient for large writes. It is therefore preferable to have LRU writes occuring in a production system for normal operations and Chunk Writes for loads.Где тут про производительность? Пользователям по барабану насколько эффективно используется диск.
...
Рейтинг: 0 / 0
Подает HDR. Не могу понять причину.
    #36431503
IDS Admin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Всем спасибо. Немного подытожу.

1) Причины падения репликации в самом начале топика выяснены: длительная (хоть и неблокирующая ) КТ, превышающая по длительности DRTIMEOUT.
2) Баг "OLD PAGES BACKUP" не проявился.
3) Настройка LRU CLEANERS на более "агрессивную" работу положительно сказалась на OLTP. Общая нагрузка на диск возросла незначительно (судя по sar -d за одинаковые периоды с равномерной нагрузкой), зато стала более "ровной".
4) В момент работы неблокирующей КТ никаких блокировок не происходит. Зато блокировка случается сразу после КТ :)
Блокируются все транзакции с момента окончания КТ на Primary до момента окончания КТ на Secondary при включенном async HDR.

Лучше я создам отдельный топик, т.к. сильно отошел от начальной темы.
...
Рейтинг: 0 / 0
Подает HDR. Не могу понять причину.
    #36448016
victor16
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Дайте еще вывод onstat -P (можно onstat -P|head; onstat -P|tail)
чтобы убедиться в целесообразности большого буферного пула.

С уважением,
Виктор
...
Рейтинг: 0 / 0
14 сообщений из 39, страница 2 из 2
Форумы / Informix [игнор отключен] [закрыт для гостей] / Подает HDR. Не могу понять причину.
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]