Гость
Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Отставание реплики 9.6 / 6 сообщений из 6, страница 1 из 1
19.10.2021, 14:15
    #40105406
D0KX
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Отставание реплики 9.6
Доброго дня.
За последнюю неделю произошло два инцидента с отставанием реплики базы данных.
База postgresql9.6.7 для 1С на Debian GNU/Linux 9.11 (stretch)
В первом случае реплика стала отставать, не успевая примерять поступающие с мастера wal логи, что привело к полному исчерпанию свободного места и падению базы.
Во второй раз отловили проблему раньше.
Сервера физические, по 32 ЦПУ, но в этот момент работает только один процесс postgres загруженный на 100%.
В оба раза перезагрузка базы не помогала для решения проблемы, а вот физический перезапуск сервера, позволяет базе начать быстрее применять полученные wal файлы и догнать мастер.
Ранее таких проблем не наблюдали. Но сейчас количество баз прибавилось и нагрузка на мастере подросла.

С одной стороны, увеличение версии напрашивается само собой, но и в текущей версии база может справляться, правда почему-то только после перезапуска.
На реплике, в момент инцидента нет других грузящих систему процессов. Общая загрузка ЦПУ 4%. До и после инцидента, в момент нормально работы реплики вообще 1%

Подскажите куда копать и какие попробовать варианты?
...
Рейтинг: 0 / 0
19.10.2021, 15:23
    #40105420
Maxim Boguk
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Отставание реплики 9.6
D0KX
Доброго дня.
За последнюю неделю произошло два инцидента с отставанием реплики базы данных.
База postgresql9.6.7 для 1С на Debian GNU/Linux 9.11 (stretch)
В первом случае реплика стала отставать, не успевая примерять поступающие с мастера wal логи, что привело к полному исчерпанию свободного места и падению базы.
Во второй раз отловили проблему раньше.
Сервера физические, по 32 ЦПУ, но в этот момент работает только один процесс postgres загруженный на 100%.
В оба раза перезагрузка базы не помогала для решения проблемы, а вот физический перезапуск сервера, позволяет базе начать быстрее применять полученные wal файлы и догнать мастер.
Ранее таких проблем не наблюдали. Но сейчас количество баз прибавилось и нагрузка на мастере подросла.

С одной стороны, увеличение версии напрашивается само собой, но и в текущей версии база может справляться, правда почему-то только после перезапуска.
На реплике, в момент инцидента нет других грузящих систему процессов. Общая загрузка ЦПУ 4%. До и после инцидента, в момент нормально работы реплики вообще 1%

Подскажите куда копать и какие попробовать варианты?


Учитывая имеющиеся симпомы есть у меня одна версия.
А скажите сколько shared_buffers у вас на реплике выставлено?

--
Maxim Boguk
лучшая поддержка PostgreSQL: dataegret.ru
...
Рейтинг: 0 / 0
19.10.2021, 19:40
    #40105470
D0KX
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Отставание реплики 9.6
Maxim Boguk, 7Gb. Что на мастере, что на реплике.
Всего на сервере 128Gb, но надо учитывать, что сама 1С так же стоит на этом же серваке.
...
Рейтинг: 0 / 0
19.10.2021, 19:47
    #40105471
Maxim Boguk
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Отставание реплики 9.6
D0KX,

Если ещё раз повторится попробуйте перезапустить реплику с shared_buffers='1GB';
МОЖЕТ быть поможет если проблема в том что я думаю.
А именно активном drop/truncate таблиц на мастер базе... 1С такое дело очень любит... а репликация при больших shared_buffers наоборот очень НЕ любит.

Симптомы именно такие что вы описали (в этот момент работает только один процесс postgres загруженный на 100% - это как раз replay процесс для wal потока с мастера).
Cм например вот это обсуждение https://postgrespro.com/list/thread-id/2396325

--
Maxim Boguk
лучшая поддержка PostgreSQL: dataegret.ru
...
Рейтинг: 0 / 0
20.10.2021, 06:32
    #40105493
D0KX
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Отставание реплики 9.6
Очень похожая ситуация, даже относительно наблюдения использования памяти.
...
Рейтинг: 0 / 0
22.10.2021, 14:30
    #40106149
D0KX
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Отставание реплики 9.6
Maxim Boguk,
сегодня реплика опять начала отставать. Успела отстать уже на 50 минут. Поставил shared_buffers 1GB, ребутнул базу и она вернулась в нормальный ритм применения wal файлов. Через некоторое время синхронизировалась полностью.
Конечно сразу на такой резерв не переключиться, придётся править конфиг обратно, но зато реплика актуальная.
Спасибо за подсказку.
...
Рейтинг: 0 / 0
Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Отставание реплики 9.6 / 6 сообщений из 6, страница 1 из 1
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]