|
Отставание реплики 9.6
|
|||
---|---|---|---|
#18+
Доброго дня. За последнюю неделю произошло два инцидента с отставанием реплики базы данных. База postgresql9.6.7 для 1С на Debian GNU/Linux 9.11 (stretch) В первом случае реплика стала отставать, не успевая примерять поступающие с мастера wal логи, что привело к полному исчерпанию свободного места и падению базы. Во второй раз отловили проблему раньше. Сервера физические, по 32 ЦПУ, но в этот момент работает только один процесс postgres загруженный на 100%. В оба раза перезагрузка базы не помогала для решения проблемы, а вот физический перезапуск сервера, позволяет базе начать быстрее применять полученные wal файлы и догнать мастер. Ранее таких проблем не наблюдали. Но сейчас количество баз прибавилось и нагрузка на мастере подросла. С одной стороны, увеличение версии напрашивается само собой, но и в текущей версии база может справляться, правда почему-то только после перезапуска. На реплике, в момент инцидента нет других грузящих систему процессов. Общая загрузка ЦПУ 4%. До и после инцидента, в момент нормально работы реплики вообще 1% Подскажите куда копать и какие попробовать варианты? ... |
|||
:
Нравится:
Не нравится:
|
|||
19.10.2021, 14:15 |
|
Отставание реплики 9.6
|
|||
---|---|---|---|
#18+
D0KX Доброго дня. За последнюю неделю произошло два инцидента с отставанием реплики базы данных. База postgresql9.6.7 для 1С на Debian GNU/Linux 9.11 (stretch) В первом случае реплика стала отставать, не успевая примерять поступающие с мастера wal логи, что привело к полному исчерпанию свободного места и падению базы. Во второй раз отловили проблему раньше. Сервера физические, по 32 ЦПУ, но в этот момент работает только один процесс postgres загруженный на 100%. В оба раза перезагрузка базы не помогала для решения проблемы, а вот физический перезапуск сервера, позволяет базе начать быстрее применять полученные wal файлы и догнать мастер. Ранее таких проблем не наблюдали. Но сейчас количество баз прибавилось и нагрузка на мастере подросла. С одной стороны, увеличение версии напрашивается само собой, но и в текущей версии база может справляться, правда почему-то только после перезапуска. На реплике, в момент инцидента нет других грузящих систему процессов. Общая загрузка ЦПУ 4%. До и после инцидента, в момент нормально работы реплики вообще 1% Подскажите куда копать и какие попробовать варианты? Учитывая имеющиеся симпомы есть у меня одна версия. А скажите сколько shared_buffers у вас на реплике выставлено? -- Maxim Boguk лучшая поддержка PostgreSQL: dataegret.ru ... |
|||
:
Нравится:
Не нравится:
|
|||
19.10.2021, 15:23 |
|
Отставание реплики 9.6
|
|||
---|---|---|---|
#18+
Maxim Boguk, 7Gb. Что на мастере, что на реплике. Всего на сервере 128Gb, но надо учитывать, что сама 1С так же стоит на этом же серваке. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.10.2021, 19:40 |
|
Отставание реплики 9.6
|
|||
---|---|---|---|
#18+
D0KX, Если ещё раз повторится попробуйте перезапустить реплику с shared_buffers='1GB'; МОЖЕТ быть поможет если проблема в том что я думаю. А именно активном drop/truncate таблиц на мастер базе... 1С такое дело очень любит... а репликация при больших shared_buffers наоборот очень НЕ любит. Симптомы именно такие что вы описали (в этот момент работает только один процесс postgres загруженный на 100% - это как раз replay процесс для wal потока с мастера). Cм например вот это обсуждение https://postgrespro.com/list/thread-id/2396325 -- Maxim Boguk лучшая поддержка PostgreSQL: dataegret.ru ... |
|||
:
Нравится:
Не нравится:
|
|||
19.10.2021, 19:47 |
|
Отставание реплики 9.6
|
|||
---|---|---|---|
#18+
Очень похожая ситуация, даже относительно наблюдения использования памяти. ... |
|||
:
Нравится:
Не нравится:
|
|||
20.10.2021, 06:32 |
|
Отставание реплики 9.6
|
|||
---|---|---|---|
#18+
Maxim Boguk, сегодня реплика опять начала отставать. Успела отстать уже на 50 минут. Поставил shared_buffers 1GB, ребутнул базу и она вернулась в нормальный ритм применения wal файлов. Через некоторое время синхронизировалась полностью. Конечно сразу на такой резерв не переключиться, придётся править конфиг обратно, но зато реплика актуальная. Спасибо за подсказку. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.10.2021, 14:30 |
|
|
start [/forum/topic.php?fid=53&msg=40105471&tid=1993815]: |
0ms |
get settings: |
12ms |
get forum list: |
15ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
384ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
50ms |
get tp. blocked users: |
2ms |
others: | 258ms |
total: | 743ms |
0 / 0 |