Подает HDR. Не могу понять причину. / Informix

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Informix [игнор отключен] [закрыт для гостей] / Подает HDR. Не могу понять причину.

14 сообщений из 39, страница 2 из 2

все

Подает HDR. Не могу понять причину.

#36400576

IDS Admin

Гость

vasilis,

vasilisсами читаете, разбираетесь, пробуете, задаете внятные вопросы и также сами отвечаете.

А как иначе? Проблема ведь у меня возникла )) И на паблик форуме никто никому ничего не должен. Так что это с вами работать приятно)

vasilisПроверьте, на самом ли деле работает write-back.
Совсем не давно тут рассматривалась проблема падения производительности из-за автоматического отключения кэширования на запись.

Проверил, работает. Сделал простой тест на запись с работающим, а затем отключенным кэшем. В 1 поток. Объем данных сопоставим с объемом грязных страниц в буферах в момент КТ. Размер блока 2к и 4М для сравнения (просто не знаю, блоком какого размера IDS пишет на диск. Возможно, pagesize?).

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.

кэш вкл

[root@ondbprm ~]# time dd if=/usr/logs/phys of=/usr/data/temp_of oflag=direct bs=2k count=128000
128000+0 records in
128000+0 records out
262144000 bytes (262 MB) copied, 7.91706 seconds, 33.1 MB/s

real    0m7.920s
user    0m0.024s
sys     0m1.104s

[root@ondbprm ~]# time dd if=/usr/logs/phys of=/usr/data/temp_of oflag=direct bs=4096k count=60
60+0 records in
60+0 records out
251658240 bytes (252 MB) copied, 1.06274 seconds, 237 MB/s

real    0m1.074s
user    0m0.000s
sys     0m0.122s

кэш выкл
[root@ondbprm ~]# time dd if=/usr/logs/phys of=/usr/data/temp_of oflag=direct bs=4096k count=60
60+0 records in
60+0 records out
251658240 bytes (252 MB) copied, 1.01192 seconds, 249 MB/s

real    0m1.023s
user    0m0.000s
sys     0m0.135s

[root@ondbprm ~]# time dd if=/usr/logs/phys of=/usr/data/temp_of oflag=direct bs=2k count=128000
128000+0 records in
128000+0 records out
262144000 bytes (262 MB) copied, 567.298 seconds, 462 kB/s

Для bs=2k без кэша совсем грустно). А для 4М разницы между вкл/выкл кэша просто нет.

vasilisPHYSFILE 16500000
Зачем такой огромный? Ведь обслуживать такой файл и искать там нужную точку тоже нужно время. В моей жизни 1-2Гб хватало даже в самых нагруженных системах, но на истину не претендую

Да, это я дал маху. Ориентировался на суммарный объем буферов. Совсем не учел, что в моем случае изменению подлежит лишь малая их часть. Уменьшил до 2 Гб. Посмотрим, каков будет результат.

vasilis
AUTO_AIOVPS 1
Тоже отключил бы и, помониторив, установил бы ручками.
Я не знаю логики работы этого автомата, но обычно они все заточены под некие очень стандартные и условные параметры. Знающий человек почти всегда сделает лучше.

Следующим шагом отключу и буду «руками» изменять.
vasilis
RESIDENT 0
рекомендую 1 или 2.

Изменил на 1.

vasilisCKPTINTVL 150
А зачем уменьшали диапазон ? Это меньше 3-х минут.
Установите стандартные 300, а я бы даже и увеличил до 600.[quote]

Когда не работали LRU, сократил время, чтобы суммарный объем грязных страниц был меньше. Сейчас вернул в 300.

[quote vasilis]AUTO_CKPTS 1
тоже самое, что я уже писал по поводу "автоматов"
Выключил

vasilisTAPEDEV /dev/null
LTAPEDEV /dev/null
А это как понять ?
У вас разве не промсистема ? Надеюсь, что это тестовая.
Куда пишутся архивы - на диск или ленту? если на диски, то блок можно увеличивать - в нашем ФАК-е помнится были исследования на эту тему...

Пишу на диски. Использую STDIO. Очень удобно. Вот, может пригодится кому:
Бекап
ontape -s -L 0 -t STDIO | gzip -1 > /back/full_backup.gz
gzip сжимает где-то в 10 раз. Процессора почти не ест (т.к. ключ -1).
Восстановление
zcat /back/full_backup.gz | ontape -r -t STDIO
И самое приятное, чтобы не прыгать с ленточкой по серверной, поднятие репликации по сети без файлов и лент:
На primary делаем скрипт /back/stdio_back.sh
# set IDS ENV
ontape -s -L 0 -t STDIO
На secondary запускаем
ssh primary “/back/stdio_back.sh" | gunzip | ontape -p -t STDIO
Ну и все, дальше onmode’ом переключаемся в primary/secondary. По сети перегоняется сжатый бекап. Одновременно работает как бекап так и восстановление, что положительно сказывается на времени работы.

(Когда в этом топике я пишу, что делаю ontape, значит я делаю ontape –s –L 0 –t STDIO | cat > /dev/null. Это чтобы исключить влияние gzip’а и записи файла с бекапом на диск)
По-моему только в 11ом появилось STDIO.

vasilisDS_NONPDQ_QUERY_MEM 128
Однозначно увеличить, хотя бы до 5М - это позволит увеличить память для сортировок

Увеличил до 10 М. Заодно пришлось увеличить и DS_TOTAL_MEMORY до 60М. Было по дефолту меньше 1М.

vasilisBUFFERPOOL size=2K,buffers=4000000,lrus=256,lru_min_dirty=0.100000,lru_max_dirty=0.300000
BUFFERPOOL size=8K,buffers=1500000,lrus=256,lru_min_dirty=0.500000,lru_max_dirty=1.000000
Такие огромные пулы требуюти больших расходов на свое обслуживание.
Надо тщательно помониторить процент кэширования и поиграться с размерами - вполне возможно, что ваша активная часть БД поместится и в значительно меньшем объеме. Тогда будет однозначный плюс для КТ.
+
Я бы установил еще большее количество очередей (мне кажется в 11.5 можно больше 256?) для таких огромных пулов, а также попробовал бы не так сильно уменьшать "окно" сброса, т.е. установил бы для начала на уровне 5 и 2% или даже 10 и 5.

Уменьшил в 2 раза кол-во буферов и увеличил LRU до 500. В моей версии максимум 512.

Теперь буфера выглядят так:
BUFFERPOOL default,buffers=10000,lrus=8,lru_min_dirty=50.000000,lru_max_dirty=60.500000
BUFFERPOOL size=2K,buffers=2000000,lrus=500,lru_min_dirty=0.400000,lru_max_dirty=1.200000
BUFFERPOOL size=8K,buffers=750000,lrus=500,lru_min_dirty=2.000000,lru_max_dirty=4.000000

vasilisБуфер сбрасывается в журнал целиком, а в среднем там меньше двух страниц, при размере буфера в 16 2К-страниц. Т.е. буфера переключаются слишком быстро и не успевают сбрасываться на диск (это если рассматривать ситуацию, описанную В.К.).
Если будет буферизация, то буфер будет сбрасываться только после заполнения, (т.е. преключения будут более редки) т.о. давая время на сброс двум другим буферам.

Спасибо, буду пробовать изменять размер буфера.

Статистику (profile_ из DBA_Tools) выложу, как только соберу

...

Рейтинг:

0 / 0

08.01.2010, 14:55

| Ответить | Цитировать | Написать

Подает HDR. Не могу понять причину.

#36400589

IDS Admin

Гость

АнатоЛойTo IDS Admin:
посмотри результаты (и нам покажи для общего развития)

Код: plaintext

1.
2.
3.

DATABASE sysmaster;
SET ISOLATION TO DIRTY READ;
SELECT * FROM syscheckpoint;

В таблице syscheckpoint куча доп. информации - может подтолкнёт нас к доп. размышлениям в нужную сторону :).

Вот только в syscheckpoint последние 20 чекпоинтов от текущего момента, поэтому попробуй выполнить запрос несколько раз с таким перерывом, чтобы попали все чекпоинты за интервал съёма статистики.

Спасибо, очень удобно. Вот, для моего последнего конфига данные для нескольких "плохих" КТ:

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.

intvl	type		caller		clock_time	crit_time	flush_time	cp_time		n_dirty_buffs	plogs_per_sec	llogs_per_sec	dskflush_per_sec	ckpt_logid	ckpt_logpos	physused	logused	n_crit_waits	tot_crit_wait	longest_crit_wait	block_time
7878	Non-Blocking	CKPTINTVL 	1262951793	0.00001		13.29479	13.39282	35000		780		253		2632			1308		1528483864	244185		79391	2		0.11593	0.09488	0
7877	Non-Blocking	CKPTINTVL 	1262951479	0.00847		12.44997	12.54764	34569		775		209		2776			1308		1204076568	242828		65547	5		0.38113	0.09072	0
7876	Non-Blocking	CKPTINTVL 	1262951167	0.00721		13.0222		13.20554	34377		770		203		2639			1308		936083480	241895		63817	8		1.23069	0.1776	0
7875	Non-Blocking	CKPTINTVL 	1262950852	0.01725		12.1557		12.18814	35175		785		190		2893			1308		675184664	247396		60163	6		0.13348	0.02638	0
7874	Non-Blocking	CKPTINTVL 	1262950540	0.22424		14.87492	15.68018	36271		790		192		2438			1308		429200632	237160		57839	7		4.60566	0.79564	0
7873	Blocking    	Backup    	1262950225	0.00001		0.00625		5.70885		151		55		7		151			1308		192901144	557		70	6		0.56406	0.15984	0
7872	Non-Blocking	CKPTINTVL 	1262950218	0.00001		3.93569		3.98364		39662		530		156		10077			1308		192614424	159817		47005	1		0.00366	0.00366	0
7871	Non-Blocking	CKPTINTVL 	1262949914	0.00001		0.00082		0.00258		26		0		0		26			1308		339992		6		4	0		0	0	0
7870	Non-Blocking	HDR       	1262949594	0.00011		0.00179		0.89783		43		0		0		43			1308		323608		29		46	0		0	0	0
7869	Non-Blocking	Startup   	1262949495	0.00001		0.00107		0.00305		13		0		0		13			1308		135192		2		1	0		0	0	0

Нагрузка на БД равномерная, включил ontape сразу после КТ 7872. Время выросло с 4х до 12-16 сек ((
(При одинаковом кол-ве грязных страниц )

...

Рейтинг:

0 / 0

08.01.2010, 15:05

| Ответить | Цитировать | Написать

Подает HDR. Не могу понять причину.

#36400592

IDS Admin

Гость

DaugavaЯ не удивлюсь, если окажется, что к длинному чекпоинту приводит как раз ontape и опять проявился старый баг "OLD PAGES BACKUP", ибо я не верю в то, что он до конца побежден.
2006-й год
Спасибо, буду копать в этом направлении

...

Рейтинг:

0 / 0

08.01.2010, 15:05

| Ответить | Цитировать | Написать

Подает HDR. Не могу понять причину.

#36401096

victor16

Гость

А можно поинтересоваться, почему Вы так привязались к контрольной точке. Ведь, начиная с версии 11 реализован неблокирующий механизм контрольных точек. И, судя по сообщениям топик-стартера, проблем с производительностью у него не было до тех пор, пока он не стал тюнинговать сервер:)

...

Рейтинг:

0 / 0

08.01.2010, 22:23

| Ответить | Цитировать | Написать

Подает HDR. Не могу понять причину.

#36402268

vasilis

Участник

Откуда: Украина, Киев

Сообщения: 2 212

Рейтинг: 0 / 0

IDS Admin
Пишу на диски. Использую STDIO. Очень удобно. Вот, может пригодится кому:
Бекап
ontape -s -L 0 -t STDIO | gzip -1 > /back/full_backup.gz
gzip сжимает где-то в 10 раз. Процессора почти не ест (т.к. ключ -1).
Восстановление
zcat /back/full_backup.gz | ontape -r -t STDIO
И самое приятное, чтобы не прыгать с ленточкой по серверной, поднятие репликации по сети без файлов и лент:
На primary делаем скрипт /back/stdio_back.sh
# set IDS ENV
ontape -s -L 0 -t STDIO
На secondary запускаем
ssh primary “/back/stdio_back.sh" | gunzip | ontape -p -t STDIO
Ну и все, дальше onmode’ом переключаемся в primary/secondary. По сети перегоняется сжатый бекап. Одновременно работает как бекап так и восстановление, что положительно сказывается на времени работы.

Спасибо за конкретные примеры - дополню FAQ, а то он уже давненько не обновлялся на эту тему
IDS Admin
По-моему только в 11ом появилось STDIO.

начиная с версии IDS 10.00.xC3 утилита ontape может использовать Standard I/O

...

Рейтинг:

0 / 0

10.01.2010, 13:20

| Ответить | Цитировать | Написать

Подает HDR. Не могу понять причину.

#36402313

vasilis

Участник

Откуда: Украина, Киев

Сообщения: 2 212

Рейтинг: 0 / 0

victor16А можно поинтересоваться, почему Вы так привязались к контрольной точке. Ведь, начиная с версии 11 реализован неблокирующий механизм контрольных точек. И, судя по сообщениям топик-стартера, проблем с производительностью у него не было до тех пор, пока он не стал тюнинговать сервер:)
Если начать читать с первого сообщения ТС то можно увидеть, что начали обсуждать падения HDR , которые возникли при длинных КТ на первичке. Т.е. КТ все таки не совсем безобидные. А так проблем с производительностью, действительно не было, по крайней мере, их не озвучивали.

...

Рейтинг:

0 / 0

10.01.2010, 14:24

| Ответить | Цитировать | Написать

Подает HDR. Не могу понять причину.

#36403084

klepa

Гость

Производительность упала потому ИМХО, что грязные буфера сбрасываются на диск все время, а не только во время КТ.
Посмотреть можно:

onstat -F

...

Рейтинг:

0 / 0

11.01.2010, 10:58

| Ответить | Цитировать | Написать

Подает HDR. Не могу понять причину.

#36403139

Журавлев Денис

Участник

Откуда: St.John,NB,CA

Сообщения: 5 515

Рейтинг: 0 / 0

klepaПроизводительность упала потому ИМХО, что грязные буфера сбрасываются на диск все время, а не только во время КТ.
Посмотреть можно:

onstat -Fа как сброс влияет на производительность? Сессии не ждут записи на диск грязных буферов.

...

Рейтинг:

0 / 0

11.01.2010, 11:27

| Ответить | Цитировать | Написать

Подает HDR. Не могу понять причину.

#36403195

АнатоЛой

Участник

Откуда: Киев, Украина

Сообщения: 2 910

Рейтинг: 0 / 0

Журавлев ДенисklepaПроизводительность упала потому ИМХО, что грязные буфера сбрасываются на диск все время, а не только во время КТ.
Посмотреть можно:

onstat -Fа как сброс влияет на производительность? Сессии не ждут записи на диск грязных буферов.
Что влияет - однозначно: появляются дополнительная нагрузка на диск. Вопрос только в том, насколько большая нагрузка и как долго это длится.

...

Рейтинг:

0 / 0

11.01.2010, 11:52

| Ответить | Цитировать | Написать

Подает HDR. Не могу понять причину.

#36403204

Журавлев Денис

Участник

Откуда: St.John,NB,CA

Сообщения: 5 515

Рейтинг: 0 / 0

АнатоЛойЖуравлев ДенисklepaПроизводительность упала потому ИМХО, что грязные буфера сбрасываются на диск все время, а не только во время КТ.
Посмотреть можно:

onstat -Fа как сброс влияет на производительность? Сессии не ждут записи на диск грязных буферов.
Что влияет - однозначно: появляются дополнительная нагрузка на диск. Вопрос только в том, насколько большая нагрузка и как долго это длится.косвенно, копейки, получается просто запись размазанная во времени, и добавляются перезаписи которые исчезли бы объединением (но мало).

...

Рейтинг:

0 / 0

11.01.2010, 11:56

| Ответить | Цитировать | Написать

Подает HDR. Не могу понять причину.

#36403274

klepa

Гость

Журавлев ДенисАнатоЛойЖуравлев ДенисklepaПроизводительность упала потому ИМХО, что грязные буфера сбрасываются на диск все время, а не только во время КТ.
Посмотреть можно:

onstat -Fа как сброс влияет на производительность? Сессии не ждут записи на диск грязных буферов.
Что влияет - однозначно: появляются дополнительная нагрузка на диск. Вопрос только в том, насколько большая нагрузка и как долго это длится.косвенно, копейки, получается просто запись размазанная во времени, и добавляются перезаписи которые исчезли бы объединением (но мало).

Сколько копеек покажет onstat -F

Whether buffer flushing occurs as part of an LRU write or a Chunk Write should be based on the nature of the system. LRU writes do not block the system, but are random in nature. Chunk Writes block the system, but are sequential in nature and tend to be more efficient for large writes. It is therefore preferable to have LRU writes occuring in a production system for normal operations and Chunk Writes for loads.

...

Рейтинг:

0 / 0

11.01.2010, 12:33

| Ответить | Цитировать | Написать

Подает HDR. Не могу понять причину.

#36403285

Журавлев Денис

Участник

Откуда: St.John,NB,CA

Сообщения: 5 515

Рейтинг: 0 / 0

klepaСколько копеек покажет onstat -F

Whether buffer flushing occurs as part of an LRU write or a Chunk Write should be based on the nature of the system. LRU writes do not block the system, but are random in nature. Chunk Writes block the system, but are sequential in nature and tend to be more efficient for large writes. It is therefore preferable to have LRU writes occuring in a production system for normal operations and Chunk Writes for loads.Где тут про производительность? Пользователям по барабану насколько эффективно используется диск.

...

Рейтинг:

0 / 0

11.01.2010, 12:37

| Ответить | Цитировать | Написать

Подает HDR. Не могу понять причину.

#36431503

IDS Admin

Гость

Всем спасибо. Немного подытожу.

1) Причины падения репликации в самом начале топика выяснены: длительная (хоть и неблокирующая ) КТ, превышающая по длительности DRTIMEOUT.
2) Баг "OLD PAGES BACKUP" не проявился.
3) Настройка LRU CLEANERS на более "агрессивную" работу положительно сказалась на OLTP. Общая нагрузка на диск возросла незначительно (судя по sar -d за одинаковые периоды с равномерной нагрузкой), зато стала более "ровной".
4) В момент работы неблокирующей КТ никаких блокировок не происходит. Зато блокировка случается сразу после КТ :)
Блокируются все транзакции с момента окончания КТ на Primary до момента окончания КТ на Secondary при включенном async HDR.

Лучше я создам отдельный топик, т.к. сильно отошел от начальной темы.

...

Рейтинг:

0 / 0

26.01.2010, 14:38

| Ответить | Цитировать | Написать

Подает HDR. Не могу понять причину.

#36448016

victor16

Гость

Дайте еще вывод onstat -P (можно onstat -P|head; onstat -P|tail)
чтобы убедиться в целесообразности большого буферного пула.

С уважением,
Виктор

...

Рейтинг:

0 / 0

03.02.2010, 19:27

| Ответить | Цитировать | Написать

14 сообщений из 39, страница 2 из 2

все

Форумы / Informix [игнор отключен] [закрыт для гостей] / Подает HDR. Не могу понять причину.

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=44&msg=36400589&tid=1607639]:	0ms
get settings:	10ms
get forum list:	14ms
check forum access:	4ms
check topic access:	4ms
track hit:	165ms
get topic data:	12ms
get forum data:	3ms
get page messages:	50ms
get tp. blocked users:	1ms
others:	16ms

total:	279ms