powered by simpleCommunicator - 2.0.49     © 2025 Programmizd 02
Форумы / Oracle [игнор отключен] [закрыт для гостей] / Периодически падает RMAN backup
25 сообщений из 35, страница 1 из 2
Периодически падает RMAN backup
    #40090417
kapelan
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Падает иногда, с такой ошибкой:

Код: plsql
1.
2.
3.
4.
5.
6.
7.
8.
RMAN-00571: ===========================================================
RMAN-00569: =============== ERROR MESSAGE STACK FOLLOWS ===============
RMAN-00571: ===========================================================
RMAN-03002: failure of crosscheck command at 08/12/2021 13:02:25
RMAN-12001: could not open channel ORA_DISK_1
RMAN-10008: could not create channel context
RMAN-10003: unable to connect to target database
ORA-01017: invalid username/password; logon denied



RMAN parameters:
Код: plsql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
RMAN> show all;

RMAN configuration parameters for database with db_unique_name MyDatabaseName are:
CONFIGURE RETENTION POLICY TO RECOVERY WINDOW OF 8 DAYS;
CONFIGURE BACKUP OPTIMIZATION ON;
CONFIGURE DEFAULT DEVICE TYPE TO DISK;
CONFIGURE CONTROLFILE AUTOBACKUP ON;
CONFIGURE CONTROLFILE AUTOBACKUP FORMAT FOR DEVICE TYPE DISK TO '/NetworkLocation/orabkup/MyDatabaseName/%F';
CONFIGURE DEVICE TYPE DISK PARALLELISM 1 BACKUP TYPE TO BACKUPSET; # default
CONFIGURE DATAFILE BACKUP COPIES FOR DEVICE TYPE DISK TO 1; # default
CONFIGURE ARCHIVELOG BACKUP COPIES FOR DEVICE TYPE DISK TO 1; # default
CONFIGURE CHANNEL DEVICE TYPE DISK FORMAT   '/NetworkLocation/orabkup/MyDatabaseName/%U';
CONFIGURE MAXSETSIZE TO UNLIMITED; # default
CONFIGURE ENCRYPTION FOR DATABASE OFF; # default
CONFIGURE ENCRYPTION ALGORITHM 'AES128'; # default
CONFIGURE COMPRESSION ALGORITHM 'BASIC' AS OF RELEASE 'DEFAULT' OPTIMIZE FOR LOAD TRUE ; # default
CONFIGURE RMAN OUTPUT TO KEEP FOR 7 DAYS; # default
CONFIGURE ARCHIVELOG DELETION POLICY TO NONE; # default
CONFIGURE SNAPSHOT CONTROLFILE NAME TO '/NetworkLocation/orabkup/MyDatabaseName/snapcf_MyDatabaseName1.f';

RMAN> exit
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090420
kapelan
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
RAC
скрипт выполняется на instance_01
скрипт один и тот-же, выполняется каждый час.
Иногда падает с ошибкой о логине.

command:
Код: plsql
1.
/u01/app/oracle/product/19.0.0/dbhome_1/bin/rman target user/pass@MyDatabaseName catalog user/pass@MyCatalog cmdfile /tmp/rman21197.rcv msglog /tmp/rman21197.log



из лога

Код: plsql
1.
2.
3.
4.
5.
6.
7.
Recovery Manager: Release 19.0.0.0.0 - Production on Thu Aug 12 13:01:00 2021
Version 19.3.0.0.0

Copyright (c) 1982, 2019, Oracle and/or its affiliates.  All rights reserved.

connected to target database: MyDatabaseName(DBID=########)
connected to recovery catalog database



cmdfile :
Код: plsql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
CONFIGURE CONTROLFILE AUTOBACKUP ON;
CONFIGURE BACKUP OPTIMIZATION ON;
CONFIGURE RETENTION POLICY TO RECOVERY WINDOW OF 8 DAYS;
CONFIGURE DEFAULT DEVICE TYPE TO DISK;
CONFIGURE CONTROLFILE AUTOBACKUP FORMAT FOR DEVICE TYPE DISK TO '/NetworkLocation/orabkup/MyDatabaseName/%F';
CONFIGURE CHANNEL DEVICE TYPE DISK FORMAT '/NetworkLocation/orabkup/MyDatabaseName/%U';
CONFIGURE SNAPSHOT CONTROLFILE NAME TO '/NetworkLocation/orabkup/MyDatabaseName/snapcf_MyDatabaseName.f';
CROSSCHECK ARCHIVELOG ALL;
BACKUP AS COMPRESSED BACKUPSET  ARCHIVELOG ALL NOT BACKED UP 2 TIMES ;
DELETE COPY OF ARCHIVELOG ALL COMPLETED BEFORE 'SYSDATE - 3/24';
   EXIT;
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090446
Фотография Vadim Lejnin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kapelan,

1) user/pass@MyDatabaseName

Ко всем узлам подходит?
Могут быть разные passwordfile

2)

Попробуйте
CONFIGURE CHANNEL 1 DEVICE TYPE DISK CLEAR;
И запустите по новой

ссылки:
RMAN Commands Return: RMAN-03002 RMAN-12001 RMAN-10008 RMAN-10003 ORA-01017 (Doc ID 390395.1)

RAC RMAN channel configuration RMAN-12001 RMAN-12001 RMAN-10008 RMAN-10003 ORA-01017 error
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090452
kapelan
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Vadim Lejnin
kapelan,

1) user/pass@MyDatabaseName

Ко всем узлам подходит?
Могут быть разные passwordfile

2)

Попробуйте
CONFIGURE CHANNEL 1 DEVICE TYPE DISK CLEAR;
И запустите по новой

ссылки:
RMAN Commands Return: RMAN-03002 RMAN-12001 RMAN-10008 RMAN-10003 ORA-01017 (Doc ID 390395.1)

RAC RMAN channel configuration RMAN-12001 RMAN-12001 RMAN-10008 RMAN-10003 ORA-01017 error

1)
коннект к таржет как sys ( sys/pass@MyDatabaseName)
на всех инстансах:
Код: plsql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
Connected to:
Oracle Database 19c Enterprise Edition Release 19.0.0.0.0 - Production
Version 19.3.0.0.0

SQL> set pages 500
SQL> show parameter password;

NAME                                 TYPE        VALUE
------------------------------------ ----------- ------------------------------
remote_login_passwordfile            string      EXCLUSIVE
SQL> select * from v$pwfile_users;

USERNAME
--------------------------------------------------------------------------------
SYSDB SYSOP SYSAS SYSBA SYSDG SYSKM ACCOUNT_STATUS
----- ----- ----- ----- ----- ----- ------------------------------
PASSWORD_PROFILE
--------------------------------------------------------------------------------
LAST_LOGIN
---------------------------------------------------------------------------
LOCK_DATE EXPIRY_DA
--------- ---------
EXTERNAL_NAME
--------------------------------------------------------------------------------
AUTHENTI COM     CON_ID
-------- --- ----------
SYS
TRUE  TRUE  FALSE FALSE FALSE FALSE OPEN
PASSWORD NO           0
RMAN
TRUE  FALSE FALSE FALSE FALSE FALSE OPEN
PASSWORD NO           0

SQL>



2)
поставил: CONFIGURE CHANNEL 1 DEVICE TYPE DISK CLEAR;
завтра посмотрим
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090457
kapelan
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
CONFIGURE CHANNEL 1 DEVICE TYPE DISK CLEAR; - не помогло, прилетел exception
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090459
kapelan
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Vadim Lejnin
kapelan,

1) user/pass@MyDatabaseName

Ко всем узлам подходит?
Могут быть разные passwordfile

2)

Попробуйте
CONFIGURE CHANNEL 1 DEVICE TYPE DISK CLEAR;
И запустите по новой

ссылки:
RMAN Commands Return: RMAN-03002 RMAN-12001 RMAN-10008 RMAN-10003 ORA-01017 (Doc ID 390395.1)

RAC RMAN channel configuration RMAN-12001 RMAN-12001 RMAN-10008 RMAN-10003 ORA-01017 error

по #1 не совсем понятно.
как могут быть разные пароли у одного и того -же юзера на разных нодах?
ПС: пробовал другого узера (не sys) , результат тот-же - периодический exception
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090487
Фотография shane54
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Пара идей и мыслей. Можно попробовать включить дебаг RMAN'а (просто слово debug при вызове, типа "$ORACLE_HOME/bin/rman target / debug trace=/tmp/rman.log"), чтобы отследить к какой ноде он подключается каждый раз (будет видно в образовавшемся файле "/tmp/rman.log"). Вдруг действительно есть один (или больше) узел, который "не пускает". А дальше уже разбираться, почему он так делает и почему так может быть.
Или попробовать отследить коннекты от RMAN'а со стороны базы - сделать ONLOGON триггер, отфильтровывать только коннекты от rman бинарника, чтобы не засорять лог - и поймать куда он лезет, и почему получает отлуп.
Еще можно вычислить, какой узел точно пускает - и "прибить" rman "гвоздями", чтобы работал только с этой нодой. Можно сделать отдельный TNS-Alias, который будет "смотреть" на нужную ноду (поле HOST=). А можно сделать TNS-Alias, который будет смотреть на весь кластер, как обычно (на SCAN адрес) - но создать отдельный Service, и уже его прибить к определённой ноде, так даже гибче и правильнее.
И для тестов, чтобы не ждать каждую итерацию сутки, можно сделать отдельный бекап скрипт, который будет выполнять только BACKUP SPFILE - и гонять его, выполняться будет за пару секунд, очень удобно отлаживать и отлавливать вот такие вот непонятные ситуации.
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090547
Фотография Vadim Lejnin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kapelan,

на всех узлах
Код: plsql
1.
2.
3.
4.
5.
SQL> show parameters spfile

NAME                                 TYPE        VALUE
------------------------------------ ----------- ------------------------------
spfile                               string      /.../.../dbhome_1/dbs/spfileDROPME.ora
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090552
Фотография kinky cat
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kapelan,
или сразу srvctl config database и проверить что sp,pw files on shared storage
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090554
landy
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Если мне не изменяет память, каталог, куда льются бэкапы должен быть доступен с каждой ноды кластера
М б на какой-то ноде это не так?
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090560
Фотография Vadim Lejnin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
landy
Если мне не изменяет память, каталог, куда льются бэкапы должен быть доступен с каждой ноды кластера
М б на какой-то ноде это не так?


Особенно, если user/pass@MyDatabaseName - кластерное соединение
, и вполне может подключится к другому узлу.
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090602
kapelan
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Vadim Lejnin
kapelan,

на всех узлах
Код: plsql
1.
2.
3.
4.
5.
SQL> show parameters spfile

NAME                                 TYPE        VALUE
------------------------------------ ----------- ------------------------------
spfile                               string      /.../.../dbhome_1/dbs/spfileDROPME.ora



Код: plsql
1.
2.
3.
4.
5.
6.
7.
SQL> show parameters spfile;

NAME                                 TYPE        VALUE
------------------------------------ ----------- ------------------------------
spfile                               string      +DATA/MyDatabaseName/PARAMETERFILE/s
                                                 pfile.307.1055165019
SQL>


что с этим делать?
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090622
Фотография Vadim Lejnin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kapelan,

У Вас общий spfile, по идее, все должно работать
Вам предложили потестировать backup spfile

Если ошибки получится повторить,

попробовать явно открыть канал с авторизацией для каждого узла
Код: plsql
1.
2.
3.
CONFIGURE CHANNEL 1 DEVICE TYPE DISK CONNECT 'sys/pass@node1';
CONFIGURE CHANNEL 2 DEVICE TYPE DISK CONNECT 'sys/pass@node2';
...


Плюсом будет параллельный backup (если у Вас не SE)

Я бы еще попробовал локальное подключение после

Код: plsql
1.
2.
3.
4.
CONFIGURE CHANNEL 1 DEVICE TYPE DISK CLEAR;
target /
вместо
target user/pass@MyDatabaseName
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090624
Вячеслав Любомудров
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Причем здесь файл параметров?
Тут главное, чтоб файл паролей был или общим или одинаковым
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090652
kapelan
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вячеслав Любомудров
Причем здесь файл параметров?
Тут главное, чтоб файл паролей был или общим или одинаковым


общий
Код: plsql
1.
2.
3.
ASMCMD> ls DATA/MyDatabaseName/PASSWORD/
pwdMyDatabaseName.1091.1055164683
ASMCMD>
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090653
Вячеслав Любомудров
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Я не спец в RAC, но на всякий бы проверил что именно этот файл паролей используется всеми экземплярами
Типо srvctl config
Ну и все-таки действительно, бэкапы лучше выполнять не с общего адреса, а с конкретной ноды (ну, естественно, можно задать порядок и приоритетность)
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090685
kapelan
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
поставил дебаг на рман
коннектится ко всем нодам и выполняется в основном нормально
пока 2 раза упал на 3-м ноде, но есть также куча логов в усешным бакапом с 3-го нода.
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090688
flexgen
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
kapelan
RAC
скрипт выполняется на instance_01
скрипт один и тот-же, выполняется каждый час.
Иногда падает с ошибкой о логине.

Код: plsql
1.
2.





Вопросы:
  • Является ли база, в которой располагается каталог MyCatalog, кластерной?
  • Какова версия базы, используемой в качестве каталога?
  • На всех нодах кластера в tnsnames.ora алиас MyCatalog определен одинаково?
  • Подключение к базе-каталогу производится через сервис?
  • Как сконфигурирован сервис, определены ли preferred и available instances для сервиса?
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090701
Фотография Vadim Lejnin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вячеслав Любомудров
Причем здесь файл параметров?
Тут главное, чтоб файл паролей был или общим или одинаковым


Заработался, конечно passwordfile
...
Рейтинг: 0 / 0
Периодически падает RMAN backup
    #40090799
Фотография shane54
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вот товарищ описывает похожий случай - при коннекте периодические, ничем не обоснованные (пароль 100% верный) и абсолютно хаотичные ошибки ORA-01017 ("Invalid Username/Password"): https://blog.dbi-services.com/random-ora-01017-invalid-usernamepassword-in-12cr2/ Его описываемый случай, его окружение - точно не Ваш случай - у него там дохлый ноутбук используется для проведения лаб. Так же используется старый, desupported уже 7 лет как гипервизор (VirtualBox 4.3), и старая версия Oracle RDBMS, причём он показывает разницу (его пост именно об этом) в поведении между 12.1 и 12.2. У Вас то, судя по скрину 22358880 , версия 19.3. И в общем он докапался, что из-за дохлости ноутбука, вызов генератора случайных чисел (/dev/random или urandom) подвисает и несправляется, бо не успевает из-за хилости железа накопить необходимое количество энтропии, поэтому в конечном счёте проверка пароля падает. У Вас же явно не дохлая виртуалка я так понимаю (точнее - надеюсь, иначе зачем мы тут все время тратим) - у Вас самый что ни на есть Prod, к тому же RAC. P.S. Там в блог посте мне кажется опечатка - ну или я чего-то не понимаю - у него не коррелируют вывод 'ps' (номер PID процесса листенера) и дальше вызов 'straсe'. Но не суть, идея поста понятна. Так вот. Единственное ценное, что можно извлечь из опыта этого блог поста касательно Вашей ситуации - метод, подход как он решал проблему. Он прицепился с помощью strace к процессу листенера, и ловил момент генерации ошибки ORA-01017 - и дальше смотрел стек вызовов, что же произошло и "где оно упало". По-моему идея здравая и имеет право на быть попробованной! А что, есть другие идеи? Так что если Вы готовы погонять strace и поанализировать что он там наловит - вот пара идей как это все организовать. Прежде чем начинать глубоко копать эту всю волынку, думаю, нужно немного подготовиться:
  • для тестов (а в целом - и на будущее) сделать отдельного пользователя в базе, и гонять тесты через него
  • дать новому пользователю необходимые гранты (роль SYSBACKUP)
  • в общем, уйти от конннекта SYS AS SYSDBA
  • правда, появится AS SYSBACKUP
  • кстати, интересный момент: хоть в базе при создании и создаётся пользователь SYSBACKUP, с ролью SYSBACKUP - оказывается, рекомендация от Oracle - его не использовать, а создать нового пользователя, и уже ему выдать роль SYSBACKUP, и использовать его
  • раз уж мы выяснили, что падает только коннект к базе, которую нужно бекапить (ака Target DB) - а коннект к Backup Catalog вроде стабильный - думаю, для тестов можно все упростить и коннект к каталогу пока что выкинуть вовсе
  • также, можно все упростить ещё больше - раз уж мы выбросили команду бекапа всей базы или архивлогов - и решили вместо этого для тестов использовать BACKUP SPFILE - так если подумать, это тоже не нужно, достаточно оставить только попытки коннекта к базе из RMAN
  • таким образом, самым приемлемым вариантом будет - просто запустить rman, без соединения с базой (и без соединения с каталогом, как упоминалось выше)
  • и дальше напишите скрипт, и в нем просто тыщу раз повторите команду
Код: plsql
1.
2.

  • CONNECT <ваш_новый_user_с_ролью_SYSBACKUP>/<пароль>@TNS-Alias
    • ну или, как вариант - как предлагалось выше - делайте коннект к базе в форме создания канала, тоже самое - много-много раз, чтоб не дёргаться и перезапускать тест:
    Код: plsql
    1.
    2.
    
    CONFIGURE CHANNEL 1 DEVICE TYPE DISK 
  • CONNECT <ваш_новый_user_с_ролью_SYSBACKUP>/<пароль>@TNS-Alias
    • и дальше просто RMAN> start <Ваш_скрипт> или RMAN> @<Ваш_скрипт> как уже упоминалось несколько раз выше - полезно создать отдельный сервис (Service) - и настроить его соответствующие - либо через srvctl, либо через DBMS_SERVICE - приоритеты, preferred instances, failover-поведение и тд, вот это все и прописать его в TNS-Alias (создать новый алиас) - и из RMAN'а соединяться с ним
    Вдруг Вы таки поймаете какое-то падающее обращение к /dev/random, /dev/urandom - или ещё чего такого низкоуровнего, из этой серии. P.P..S. Я ещё думал Вам подкинуть мысль включить аудит на коннекты (ака AUDIT SESSION BY <Ваш_новый_Backup_акк>) - но подраскинув мозжечком, пришёл к выводу что сильно это делу не поможет, это тупиковый путь - потому что аудит не пишет, "кто" конкретно не дал залогиниться (какая подсистема или проверка или какой механизм). В аудит просто пишется факт неуспешного логина, суть факт ошибки ORA-01017 (надо бы перепроверить, под рукой нет баз сейчас, пишу все это "по-памяти").
    ...
    Рейтинг: 0 / 0
    Периодически падает RMAN backup
        #40090843
    Фотография Vadim Lejnin
    Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
    Участник
    КМК, Тут ситуация интереснее
    RMAN - просто интерфейс к DBMS_BACKUP, то есть реальная сессия может быть запущена на любом узле,
    не обязательно на том к которому подключился, особенно, если открывается несколько каналов.

    Авторизация к дисковому каналу передается от подключившейся сессии. Судя по всему, тут и происходит проблема.
    Не рассматриваем вариант с разными passwordfile у узлов, это отлавливается на раз.

    Если используется BEQ, то там тоже все понятно, а вот при явной авторизации канала, особенно,
    если подключена расширенная авторизация например по kerberos или NTS
    возможны варианты, хотя вроде и не должны.

    Для того, чтобы не попадать в такую ситуацию, предлагают открывать каналы с явной авторизацией к каждому узлу.
    ...
    Рейтинг: 0 / 0
    Периодически падает RMAN backup
        #40090886
    Фотография shane54
    Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
    Участник
    Vadim Lejnin
    КМК, Тут ситуация интереснее


    Я кстати пришёл к похожим вопросам, только немного с другой стороны: а как можно определить, штатными средствами, суть без ковыряния strace'ом и вычисления имён внутренних функций ядра и routines, отвечающих за ту или иную подсистему - какая аутентификация выполнялась (и дала отлуп) - через OS (тот самый BEQ), сверка пароля со словарём, с paswordfile, с Radius'ом, если External Auth, с Kerberos / LDAP (ака домен / Active Directory), с сертификатом (ака PKI / Wallet), SSL ещё бывает

    Vadim Lejnin
    RMAN - просто интерфейс к DBMS_BACKUP, то есть реальная сессия может быть запущена на любом узле,
    не обязательно на том к которому подключился, особенно, если открывается несколько каналов


    А это интересная мысль, не задумывался о таком поведении. Если её развить, если это действительно так - то RMAN бекап мог бы работать по типу DataPump'а - когда утилита expdp или impdp - просто интерфейс к пакету DBMS_DATAPUMP, и после старта экспорта или импорта, можно спокойно отключиться, и процесс продолжится на сервере (процессы DMnn и DWnn). На данный момент, IMHO, если убить процесс rman (клиентский) - может не сразу же, а когда закончится текущий longops шаг, но процесс бекапа отвалится, кажется даже уже созданные и недописанные бекапсеты исчезнут из файловой системы или из ASM (но не с лент) - но надо перепроверить, не помню.
    В общем, если действительно rman клиент это просто интерфейс к DBMS_BACKUP, и по сути процесс бекапа работает на сервере - то в какой-то из следующих версий базы, ака 22c, возможно, Oracle приведёт архитектуру к виду, похожую у на реализацию DataPump'а - и можно будет запускать бекап и отключаться/переподключаться к процессу бекапа, смотреть статус, менять параметры, приоритеты, параллельность и тд.
    ...
    Рейтинг: 0 / 0
    Периодически падает RMAN backup
        #40091050
    kapelan
    Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
    Участник
    Vadim Lejnin
    КМК, Тут ситуация интереснее
    RMAN - просто интерфейс к DBMS_BACKUP, то есть реальная сессия может быть запущена на любом узле,
    не обязательно на том к которому подключился
    , особенно, если открывается несколько каналов.

    Авторизация к дисковому каналу передается от подключившейся сессии. Судя по всему, тут и происходит проблема.
    Не рассматриваем вариант с разными passwordfile у узлов, это отлавливается на раз.

    Если используется BEQ, то там тоже все понятно, а вот при явной авторизации канала, особенно,
    если подключена расширенная авторизация например по kerberos или NTS
    возможны варианты, хотя вроде и не должны.

    Для того, чтобы не попадать в такую ситуацию, предлагают открывать каналы с явной авторизацией к каждому узлу.


    так и есть.
    Из дебага:
    1. rman никогда не падает на коннекте тут:
    Код: plsql
    1.
    /u01/app/oracle/product/19.0.0/dbhome_1/bin/rman target user/pass@MyDatabaseName catalog user/pass@MyCatalog cmdfile /tmp/rman21197.rcv msglog /tmp/rman21197.log
    



    2. но перед
    Код: plsql
    1.
    2.
    CROSSCHECK ARCHIVELOG ALL;
    BACKUP AS COMPRESSED BACKUPSET  ARCHIVELOG ALL NOT BACKED UP 2 TIMES ;
    


    происходит новый коннект к какой-то случайной ноде - не обязательно к той самой
    Вот тут он и падает случайным образом.
    ...
    Рейтинг: 0 / 0
    Периодически падает RMAN backup
        #40091196
    Фотография Vivat!San
    Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
    Участник
    kapelan

    происходит новый коннект к какой-то случайной ноде - не обязательно к той самой
    Вот тут он и падает случайным образом.


    Нет никакой случайности, ему нужен доступ к потоку redo всех нод, который в общем случае может быть доступен только конкретному экземляру.
    ...
    Рейтинг: 0 / 0
    Периодически падает RMAN backup
        #40091203
    Фотография Vadim Lejnin
    Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
    Участник
    Vivat!San
    kapelan

    происходит новый коннект к какой-то случайной ноде - не обязательно к той самой
    Вот тут он и падает случайным образом.


    Нет никакой случайности, ему нужен доступ к потоку redo всех нод, который в общем случае может быть доступен только конкретному экземляру.


    Да ну?
    А в случае падения узла, кто будет откатывать его транзакции для продолжения работы?
    ...
    Рейтинг: 0 / 0
    25 сообщений из 35, страница 1 из 2
    Форумы / Oracle [игнор отключен] [закрыт для гостей] / Периодически падает RMAN backup
    Целевая тема:
    Создать новую тему:
    Автор:
    Закрыть
    Цитировать
    Найденые пользователи ...
    Разблокировать пользователей ...
    Читали форум (0):
    Пользователи онлайн (0):
    x
    x
    Закрыть


    Просмотр
    0 / 0
    Close
    Debug Console [Select Text]