|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
Падает иногда, с такой ошибкой: Код: plsql 1. 2. 3. 4. 5. 6. 7. 8.
RMAN parameters: Код: plsql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21.
... |
|||
:
Нравится:
Не нравится:
|
|||
12.08.2021, 21:02 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
RAC скрипт выполняется на instance_01 скрипт один и тот-же, выполняется каждый час. Иногда падает с ошибкой о логине. command: Код: plsql 1.
из лога Код: plsql 1. 2. 3. 4. 5. 6. 7.
cmdfile : Код: plsql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
... |
|||
:
Нравится:
Не нравится:
|
|||
12.08.2021, 21:16 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
kapelan, 1) user/pass@MyDatabaseName Ко всем узлам подходит? Могут быть разные passwordfile 2) Попробуйте CONFIGURE CHANNEL 1 DEVICE TYPE DISK CLEAR; И запустите по новой ссылки: RMAN Commands Return: RMAN-03002 RMAN-12001 RMAN-10008 RMAN-10003 ORA-01017 (Doc ID 390395.1) RAC RMAN channel configuration RMAN-12001 RMAN-12001 RMAN-10008 RMAN-10003 ORA-01017 error ... |
|||
:
Нравится:
Не нравится:
|
|||
12.08.2021, 23:11 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
Vadim Lejnin kapelan, 1) user/pass@MyDatabaseName Ко всем узлам подходит? Могут быть разные passwordfile 2) Попробуйте CONFIGURE CHANNEL 1 DEVICE TYPE DISK CLEAR; И запустите по новой ссылки: RMAN Commands Return: RMAN-03002 RMAN-12001 RMAN-10008 RMAN-10003 ORA-01017 (Doc ID 390395.1) RAC RMAN channel configuration RMAN-12001 RMAN-12001 RMAN-10008 RMAN-10003 ORA-01017 error 1) коннект к таржет как sys ( sys/pass@MyDatabaseName) на всех инстансах: Код: plsql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34.
2) поставил: CONFIGURE CHANNEL 1 DEVICE TYPE DISK CLEAR; завтра посмотрим ... |
|||
:
Нравится:
Не нравится:
|
|||
12.08.2021, 23:57 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
CONFIGURE CHANNEL 1 DEVICE TYPE DISK CLEAR; - не помогло, прилетел exception ... |
|||
:
Нравится:
Не нравится:
|
|||
13.08.2021, 00:16 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
Vadim Lejnin kapelan, 1) user/pass@MyDatabaseName Ко всем узлам подходит? Могут быть разные passwordfile 2) Попробуйте CONFIGURE CHANNEL 1 DEVICE TYPE DISK CLEAR; И запустите по новой ссылки: RMAN Commands Return: RMAN-03002 RMAN-12001 RMAN-10008 RMAN-10003 ORA-01017 (Doc ID 390395.1) RAC RMAN channel configuration RMAN-12001 RMAN-12001 RMAN-10008 RMAN-10003 ORA-01017 error по #1 не совсем понятно. как могут быть разные пароли у одного и того -же юзера на разных нодах? ПС: пробовал другого узера (не sys) , результат тот-же - периодический exception ... |
|||
:
Нравится:
Не нравится:
|
|||
13.08.2021, 01:25 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
Пара идей и мыслей. Можно попробовать включить дебаг RMAN'а (просто слово debug при вызове, типа "$ORACLE_HOME/bin/rman target / debug trace=/tmp/rman.log"), чтобы отследить к какой ноде он подключается каждый раз (будет видно в образовавшемся файле "/tmp/rman.log"). Вдруг действительно есть один (или больше) узел, который "не пускает". А дальше уже разбираться, почему он так делает и почему так может быть. Или попробовать отследить коннекты от RMAN'а со стороны базы - сделать ONLOGON триггер, отфильтровывать только коннекты от rman бинарника, чтобы не засорять лог - и поймать куда он лезет, и почему получает отлуп. Еще можно вычислить, какой узел точно пускает - и "прибить" rman "гвоздями", чтобы работал только с этой нодой. Можно сделать отдельный TNS-Alias, который будет "смотреть" на нужную ноду (поле HOST=). А можно сделать TNS-Alias, который будет смотреть на весь кластер, как обычно (на SCAN адрес) - но создать отдельный Service, и уже его прибить к определённой ноде, так даже гибче и правильнее. И для тестов, чтобы не ждать каждую итерацию сутки, можно сделать отдельный бекап скрипт, который будет выполнять только BACKUP SPFILE - и гонять его, выполняться будет за пару секунд, очень удобно отлаживать и отлавливать вот такие вот непонятные ситуации. ... |
|||
:
Нравится:
Не нравится:
|
|||
13.08.2021, 10:41 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
kapelan, на всех узлах Код: plsql 1. 2. 3. 4. 5.
... |
|||
:
Нравится:
Не нравится:
|
|||
13.08.2021, 13:15 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
kapelan, или сразу srvctl config database и проверить что sp,pw files on shared storage ... |
|||
:
Нравится:
Не нравится:
|
|||
13.08.2021, 13:28 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
Если мне не изменяет память, каталог, куда льются бэкапы должен быть доступен с каждой ноды кластера М б на какой-то ноде это не так? ... |
|||
:
Нравится:
Не нравится:
|
|||
13.08.2021, 13:36 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
landy Если мне не изменяет память, каталог, куда льются бэкапы должен быть доступен с каждой ноды кластера М б на какой-то ноде это не так? Особенно, если user/pass@MyDatabaseName - кластерное соединение , и вполне может подключится к другому узлу. ... |
|||
:
Нравится:
Не нравится:
|
|||
13.08.2021, 13:55 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
Vadim Lejnin kapelan, на всех узлах Код: plsql 1. 2. 3. 4. 5.
Код: plsql 1. 2. 3. 4. 5. 6. 7.
что с этим делать? ... |
|||
:
Нравится:
Не нравится:
|
|||
13.08.2021, 16:48 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
kapelan, У Вас общий spfile, по идее, все должно работать Вам предложили потестировать backup spfile Если ошибки получится повторить, попробовать явно открыть канал с авторизацией для каждого узла Код: plsql Плюсом будет параллельный backup (если у Вас не SE) Я бы еще попробовал локальное подключение после Код: plsql 1. 2. 3. 4.
... |
|||
:
Нравится:
Не нравится:
|
|||
13.08.2021, 17:54 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
Причем здесь файл параметров? Тут главное, чтоб файл паролей был или общим или одинаковым ... |
|||
:
Нравится:
Не нравится:
|
|||
13.08.2021, 18:07 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
Вячеслав Любомудров Причем здесь файл параметров? Тут главное, чтоб файл паролей был или общим или одинаковым общий Код: plsql 1. 2. 3.
... |
|||
:
Нравится:
Не нравится:
|
|||
13.08.2021, 19:23 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
Я не спец в RAC, но на всякий бы проверил что именно этот файл паролей используется всеми экземплярами Типо srvctl config Ну и все-таки действительно, бэкапы лучше выполнять не с общего адреса, а с конкретной ноды (ну, естественно, можно задать порядок и приоритетность) ... |
|||
:
Нравится:
Не нравится:
|
|||
13.08.2021, 19:34 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
поставил дебаг на рман коннектится ко всем нодам и выполняется в основном нормально пока 2 раза упал на 3-м ноде, но есть также куча логов в усешным бакапом с 3-го нода. ... |
|||
:
Нравится:
Не нравится:
|
|||
13.08.2021, 23:49 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
kapelan RAC скрипт выполняется на instance_01 скрипт один и тот-же, выполняется каждый час. Иногда падает с ошибкой о логине. Код: plsql 1. 2.
Вопросы:
... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2021, 00:37 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
Вячеслав Любомудров Причем здесь файл параметров? Тут главное, чтоб файл паролей был или общим или одинаковым Заработался, конечно passwordfile ... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2021, 08:58 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
Вот товарищ описывает похожий случай - при коннекте периодические, ничем не обоснованные (пароль 100% верный) и абсолютно хаотичные ошибки ORA-01017 ("Invalid Username/Password"):
Код: plsql 1. 2.
Код: plsql 1. 2.
... |
|||
:
Нравится:
Не нравится:
|
|||
14.08.2021, 23:55 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
КМК, Тут ситуация интереснее RMAN - просто интерфейс к DBMS_BACKUP, то есть реальная сессия может быть запущена на любом узле, не обязательно на том к которому подключился, особенно, если открывается несколько каналов. Авторизация к дисковому каналу передается от подключившейся сессии. Судя по всему, тут и происходит проблема. Не рассматриваем вариант с разными passwordfile у узлов, это отлавливается на раз. Если используется BEQ, то там тоже все понятно, а вот при явной авторизации канала, особенно, если подключена расширенная авторизация например по kerberos или NTS возможны варианты, хотя вроде и не должны. Для того, чтобы не попадать в такую ситуацию, предлагают открывать каналы с явной авторизацией к каждому узлу. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.08.2021, 10:35 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
Vadim Lejnin КМК, Тут ситуация интереснее Я кстати пришёл к похожим вопросам, только немного с другой стороны: а как можно определить, штатными средствами, суть без ковыряния strace'ом и вычисления имён внутренних функций ядра и routines, отвечающих за ту или иную подсистему - какая аутентификация выполнялась (и дала отлуп) - через OS (тот самый BEQ), сверка пароля со словарём, с paswordfile, с Radius'ом, если External Auth, с Kerberos / LDAP (ака домен / Active Directory), с сертификатом (ака PKI / Wallet), SSL ещё бывает Vadim Lejnin RMAN - просто интерфейс к DBMS_BACKUP, то есть реальная сессия может быть запущена на любом узле, не обязательно на том к которому подключился, особенно, если открывается несколько каналов А это интересная мысль, не задумывался о таком поведении. Если её развить, если это действительно так - то RMAN бекап мог бы работать по типу DataPump'а - когда утилита expdp или impdp - просто интерфейс к пакету DBMS_DATAPUMP, и после старта экспорта или импорта, можно спокойно отключиться, и процесс продолжится на сервере (процессы DMnn и DWnn). На данный момент, IMHO, если убить процесс rman (клиентский) - может не сразу же, а когда закончится текущий longops шаг, но процесс бекапа отвалится, кажется даже уже созданные и недописанные бекапсеты исчезнут из файловой системы или из ASM (но не с лент) - но надо перепроверить, не помню. В общем, если действительно rman клиент это просто интерфейс к DBMS_BACKUP, и по сути процесс бекапа работает на сервере - то в какой-то из следующих версий базы, ака 22c, возможно, Oracle приведёт архитектуру к виду, похожую у на реализацию DataPump'а - и можно будет запускать бекап и отключаться/переподключаться к процессу бекапа, смотреть статус, менять параметры, приоритеты, параллельность и тд. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.08.2021, 15:46 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
Vadim Lejnin КМК, Тут ситуация интереснее RMAN - просто интерфейс к DBMS_BACKUP, то есть реальная сессия может быть запущена на любом узле, не обязательно на том к которому подключился , особенно, если открывается несколько каналов. Авторизация к дисковому каналу передается от подключившейся сессии. Судя по всему, тут и происходит проблема. Не рассматриваем вариант с разными passwordfile у узлов, это отлавливается на раз. Если используется BEQ, то там тоже все понятно, а вот при явной авторизации канала, особенно, если подключена расширенная авторизация например по kerberos или NTS возможны варианты, хотя вроде и не должны. Для того, чтобы не попадать в такую ситуацию, предлагают открывать каналы с явной авторизацией к каждому узлу. так и есть. Из дебага: 1. rman никогда не падает на коннекте тут: Код: plsql 1.
2. но перед Код: plsql 1. 2.
происходит новый коннект к какой-то случайной ноде - не обязательно к той самой Вот тут он и падает случайным образом. ... |
|||
:
Нравится:
Не нравится:
|
|||
16.08.2021, 16:29 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
kapelan происходит новый коннект к какой-то случайной ноде - не обязательно к той самой Вот тут он и падает случайным образом. Нет никакой случайности, ему нужен доступ к потоку redo всех нод, который в общем случае может быть доступен только конкретному экземляру. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.08.2021, 13:30 |
|
Периодически падает RMAN backup
|
|||
---|---|---|---|
#18+
Vivat!San kapelan происходит новый коннект к какой-то случайной ноде - не обязательно к той самой Вот тут он и падает случайным образом. Нет никакой случайности, ему нужен доступ к потоку redo всех нод, который в общем случае может быть доступен только конкретному экземляру. Да ну? А в случае падения узла, кто будет откатывать его транзакции для продолжения работы? ... |
|||
:
Нравится:
Не нравится:
|
|||
17.08.2021, 13:38 |
|
|
start [/forum/topic.php?fid=52&msg=40090547&tid=1879957]: |
0ms |
get settings: |
10ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
41ms |
get topic data: |
8ms |
get forum data: |
2ms |
get page messages: |
54ms |
get tp. blocked users: |
1ms |
others: | 15ms |
total: | 153ms |
0 / 0 |