|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
Добрый день. Утром обнаружилось что postgresql не работает, попытки запустить заканчиваются так: Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27.
При чем сервер коатковременно запускается 2-3 сек и падает. Быстрое гугление подсказало что сервер упал окончательно и нужно восстанавливать из резервной копии, но пока это не вариант. Ночью не происходило ни каких чп, т.е. сервер не выключался и не перезагружался. Так же ночью отработали бекапы баз данных. Есть подозрение что данную проблему можно решить без переустановки сервера и restore database. Прошу Вашей помощи ... ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2012, 10:34 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
Вроде помогло это http://wruslan.rubyclub.com.ua/blogs/tag/pg_resetxlog Сервер запустился. Подскажите а как можно выявить причину падения ? Или может как то проверить базу, может там есть ошибки и ситуция повторится завтра ... ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2012, 11:21 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
kharkov_maxПодскажите а как можно выявить причину падения ? Почти всегда причина в железе. Диски, память.. 1) В dmesg у вас ничего не было? 2) Каким было последнее сообщение от postgresql до падения? [/quot]Или может как то проверить базу, может там есть ошибки и ситуция повторится завтра ...[/quot] pg_dump -> pg_restore Если это проходит без ошибок, база исправна с точки зрения postgresql. На самом деле даже успешный pg_dump означает, что все ОК. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2012, 11:37 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
tadmin, После удаления индексов, 3 процесса postgresql грузят проц на 100%, но БД вроде работает. 3 процесса указано в конфиге как зарезервировано для админа, скорее всего это они... Я правильно понимаю что сервер сейчас что то делает ? Или это какой то косяк ? Уже час почти так висит ... ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2012, 12:05 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
Мда ... Дождался пока процессы postgresql перешли в нормальный режим и нагрузка на проц упала, до нормальной. Перегрузил хост, в результате получил аналогичную ошибку при запуске postgre. Пока опять удалил логи и запустил сервер. Вроде работает, но уверен что после перезагрузки ситуация повторится. Как дальше быть ? Как проверить в чем проблема ? Может что то в конфигах и т.д. Ошибка чисто логическая ... В железе 100% проблемы нет .... ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2012, 13:06 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
kharkov_max, А что делают эти три висящие процесса? (что выдает запрос: SELECT current_timestamp, current_timestamp - query_start, procpid, usename, current_query FROM pg_stat_activity WHERE current_query <> '<IDLE>'; -- это для 8 ) ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2012, 13:32 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
kharkov_max, ну Вам же пишут: FATAL: failed to re-find parent key in index "40361" for split pages 14342/14395 переиндексируйте индекс с OID 40361 у Вас наверное версия postgres с ошибкой приводящей к повреждению индекса. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2012, 14:18 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
bububukharkov_max, А что делают эти три висящие процесса? (что выдает запрос: SELECT current_timestamp, current_timestamp - query_start, procpid, usename, current_query FROM pg_stat_activity WHERE current_query <> '<IDLE>'; -- это для 8 ) Видно что то postgres делает после удаления индексов, через некоторое время ситуация стабилизируется ... Гостьkharkov_max, ну Вам же пишут: FATAL: failed to re-find parent key in index "40361" for split pages 14342/14395 переиндексируйте индекс с OID 40361 у Вас наверное версия postgres с ошибкой приводящей к повреждению индекса. Собственно не особый знатог postre. Подскажите как правильно "Переиндексировать индекс с OID 40361" Спасибо ... ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2012, 16:18 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
kharkov_max, Узнаете, что за объект с OID 40361: SELECT * FROM pg_class WHERE oid = 40361 Затем по полученному названию думаете что делать (drop или reindex) ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2012, 16:26 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
bububu, Выполнил запрос, ответ пустой ... ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2012, 16:41 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
kharkov_max, Версия postgresql какая?, OS FreeBSD я так понимаю ? ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2012, 17:13 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
хм, судя по исходникам 40361 в FATAL: failed to re-find parent key in index "40361" for split pages 14342/14395 это не OID, а name. kharkov_max, попробуйте: Код: sql 1.
... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2012, 17:18 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
Ёш, Тоже пусто ... Может потому что при втором падении индекс был уже другой ... Как проверить при работающем сервере какой индекс может быть поврежден ? ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2012, 17:27 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
kharkov_max, Пробуйте для начала VACUUM ANALYZE VERBOSE <tablename> ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2012, 17:36 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
bububu, Запускал проверку по базам в PGAdmin При проверке на одной из баз Код: sql 1. 2. 3. 4. 5. 6. 7. 8.
А на остальных базах все нормально ... ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2012, 18:01 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
kharkov_max, это из-за Вашего pg_resetxlog, не надо было его делать. ... |
|||
:
Нравится:
Не нравится:
|
|||
24.10.2012, 18:52 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
Ёшkharkov_max, это из-за Вашего pg_resetxlog, не надо было его делать. Возможно, но не уверен... И так продолжу. Не отработал ночной бекап баз. Оказалось что сервер опять лежит ... Специально проверил, ошибка аналогичная как в шапке темы. А как теперь сделать reindex индексу, ведь сервер не запускается? Как определить какой БД принадлежит этот индекс? Может сделаь restore только это БД ... Снова пока сделал resetxlog, но уверен что это не надолго ... ... |
|||
:
Нравится:
Не нравится:
|
|||
25.10.2012, 07:25 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
kharkov_max, Могу выложить ошибки pg_dump, может это как то поможет ... ... |
|||
:
Нравится:
Не нравится:
|
|||
25.10.2012, 07:33 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
kharkov_maxА как теперь сделать reindex индексу, ведь сервер не запускается? Как определить какой БД принадлежит этот индекс?Вам нужно прекратить ломать данные с помощью pg_resetxlog :) Дождаться этой ошибки (failed to re-find parent key), попробовать запустить сервер из консоли в однопользовательском режиме с отключенным использованием системных индексов (ключ -P) и найти в pg_class что это за индекс. ... |
|||
:
Нравится:
Не нравится:
|
|||
25.10.2012, 16:03 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
Ёш, Вообщем 2 дня ждал ошибку, postgre что то делал т.к. проц грузил. Несколько баз в это время работало, а несколько нет ... В результате удалил файлы сервера сделал initdb и откатился на целые бекапы ... ... |
|||
:
Нравится:
Не нравится:
|
|||
29.10.2012, 10:26 |
|
Нужна помощь, упал posgresql
|
|||
---|---|---|---|
#18+
Тормозим службу (если есть), срубаем процесс postgres (скорее всего есть). Выполняем Код: powershell 1.
Суть в том, что в xLog у него остались данные, которые он считает незафикшенными. И усиленно пытается их зафиксить. Иногда на это требуются годы.. Комада выше отсекает эти повисшие данные, что позволяет стартонуть сервер с имеющимися в БД данными. Может потерять часть незафикшенных данных, но БД заработает. ... |
|||
:
Нравится:
Не нравится:
|
|||
10.12.2019, 13:50 |
|
|
start [/forum/topic.php?fid=53&gotonew=1&tid=1994900]: |
0ms |
get settings: |
10ms |
get forum list: |
12ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
38ms |
get topic data: |
12ms |
get first new msg: |
7ms |
get forum data: |
2ms |
get page messages: |
57ms |
get tp. blocked users: |
2ms |
others: | 266ms |
total: | 414ms |
0 / 0 |