|
|
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
Добрый день, коллеги Имеется OracleFailSafe 4.1.1+Windows Server 2012R2 + Oracle Database 12.1.0.2 Проблема такая: Sample database создается и помещается в кластер нормально. Если помещать самостоятельно созданную на кластерных дисках базу, то возникают ошибки. Судя по логу, инстанс в группу помещается нормально и переводится в онлайн, но дальше ощущение такое что кластерные службы не могут стартовать базу. В алертлоге старта базы не фиксируется, только останов. В чем может быть проблема? В event-логе такое далее логи. Если что-то нужно дорассказать/показать дополнительно спрашивайте. У меня есть несколько кластеров версии 3(.4.1 и 4.2) с базами 10g и 11g - там таких проблем нет. Здесть мне нужен именно 12c кластер (пока для тестов). Oracle 12.2 и OFS 4.2 пробовал - там теже ошибки. База тестовая создана с нуля через dbca. Oracle Fail Safe resource tst failed to start. ORA-01034: ORACLE not available ORA-27101: shared memory realm does not exist Вот сам лог помещения базы в группу 27 сентября 2018 г. Versions Fail Safe Manager 4.1.1.0 Fail Safe API 4.1.1.0 Fail Safe Server 4.1.1.0 Nodes v98-tstn-04 Windows Server V6.2 v98-tstn-03 Windows Server V6.2 17:38:40 FS-10370: Adding the resource wgs to group TESTBASE 17:38:40 FS-10371: v98-tstn-04 : Performing initialization processing 17:38:41 FS-10371: v98-tstn-03 : Performing initialization processing 17:38:41 FS-10372: v98-tstn-04 : Gathering resource owner information 17:38:41 FS-10372: v98-tstn-03 : Gathering resource owner information 17:38:41 FS-10373: v98-tstn-04 : Determining owner node of resource wgs 17:38:41 FS-10374: v98-tstn-04 : Gathering cluster information needed to perform the specified operation 17:38:41 FS-10374: v98-tstn-03 : Gathering cluster information needed to perform the specified operation 17:38:41 FS-10375: v98-tstn-03 : Analyzing cluster information needed to perform the specified operation 17:38:41 FS-10652: v98-tstn-04 has Oracle Database version 12.1.0.2 installed in OraDB12Home1 17:38:41 FS-10652: v98-tstn-03 has Oracle Database version 12.1.0.2 installed in OraDB12Home1 17:38:41 FS-10376: v98-tstn-03 : Starting configuration of resource wgs 17:38:41 FS-10378: v98-tstn-03 : Preparing for configuration of resource wgs 17:38:42 FS-10341: Starting verification of database wgs 17:38:42 FS-10343: Starting verification of database instance information for database wgs 17:38:42 FS-10425: Querying the disks used by the database wgs 17:38:42 FS-10404: The database uses a nonclustered disk in one of the system parameters. Value of parameter is C:\ORACLE\ADMIN\tst\ADUMP 17:38:42 FS-10345: Verification of standalone database wgs completed successfully 17:38:42 FS-10380: v98-tstn-03 : Configuring virtual server information for resource wgs 17:38:42 FS-10490: Configuring the Oracle Net listener for wgs 17:38:42 FS-10600: Oracle Net configuration file updated: C:\oracle\product\12.1.0\dbhome_1\network\admin\listener.ora 17:38:42 FS-10600: Oracle Net configuration file updated: C:\oracle\product\12.1.0\dbhome_1\network\admin\tnsnames.ora 17:38:52 FS-10605: Oracle Net listener FslTESTBASE created 17:38:52 FS-10381: v98-tstn-03 : Creating the resource information for resource wgs 17:38:52 FS-10426: Adding the database resource wgs to group TESTBASE 17:38:52 FS-10382: v98-tstn-03 : Bringing resource wgs online 17:39:00 FS-10726: Resource wgs is in a failed state 17:39:00 FS-10012: Failed to bring the cluster resource wgs online. Check the Windows event log for messages 17:39:00 FS-10782: The Oracle Database resource provider failed to bring resource wgs online 17:39:00 FS-10890: Oracle Services for MSCS failed during the add operation 17:39:00 FS-10497: Starting clusterwide rollback of the operation 17:39:00 FS-10488: v98-tstn-03 : Starting rollback of operation 17:39:03 FS-10350: Starting database wgs 17:39:05 ORA-01034: ORACLE not availableORA-27101: shared memory realm does not exist 17:39:05 FS-10600: Oracle Net configuration file updated: C:\oracle\product\12.1.0\dbhome_1\network\admin\tnsnames.ora 17:39:06 FS-10604: Oracle Net listener FslTESTBASE deleted 17:39:06 FS-10999: An internal programming error has occurred 17:39:06 FS-10600: Oracle Net configuration file updated: C:\oracle\product\12.1.0\dbhome_1\network\admin\listener.ora 17:39:06 FS-10489: v98-tstn-03 : Completed rollback of operation 17:39:06 FS-10495: Clusterwide rollback of the operation has been completed 17:39:06 The clusterwide operation failed. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.09.2018, 16:31 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
nick348, Еще уточнение. Вне кластера база стартует и работает нормально. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.09.2018, 16:35 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
автор17:39:00 FS-10012: Failed to bring the cluster resource wgs online. Check the Windows event log for messages 17:39:00 FS-10782: The Oracle Database resource provider failed to bring resource wgs online 17:39:00 FS-10890: Oracle Services for MSCS failed during the add operation Никогда не поднимал кластер под win, но что-то оно как-то не дружит с MSCS. Возможно, все-таки стоит почитать eventlog? Применительно к БД смущает еще две вещи: 1. Попытка поднять отдельный именованный листенер, оно для зачем? И не конфликтует ли с уже имеющимся листенером по ресурсам (порт)? автор17:38:42 FS-10600: Oracle Net configuration file updated: C:\oracle\product\12.1.0\dbhome_1\network\admin\listener.ora 17:38:42 FS-10600: Oracle Net configuration file updated: C:\oracle\product\12.1.0\dbhome_1\network\admin\tnsnames.ora 17:38:52 FS-10605: Oracle Net listener FslTESTBASE created 2. Уверены, что на всех нодах присутствует указанный путь и этот путь доступен пользователю, от которого поднимается экземпляр, на всех нодах? автор17:38:42 FS-10404: The database uses a nonclustered disk in one of the system parameters. Value of parameter is C:\ORACLE\ADMIN\tst\ADUMP ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.09.2018, 16:55 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
andrey_anonymous, Спасибо за помощь, но... "Никогда не поднимал кластер под win, но что-то оно как-то не дружит с MSCS. Возможно, все-таки стоит почитать eventlog?" читал. там фейл при старте базы, который Я привел Oracle Fail Safe resource tst failed to start. ORA-01034: ORACLE not available ORA-27101: shared memory realm does not exist Листнер отключил - та же проблема. Если проблема в нем почему sample database садится в кластер нормально? По поводу adump - перенестраивал на кластерный диск - тоже не помогло. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.10.2018, 10:58 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
nick348 там фейл при старте базы, который Я привел Листнер отключил - та же проблема. Если проблема в нем почему sample database садится в кластер нормально? По поводу adump - перенестраивал на кластерный диск - тоже не помогло. 1. И все? что-то не верится. 2. Листенер не надо было "отключить", его надо было почитать на предмет конфликта ресурсов. А если отключать - то убедиться, что БД настроена на имеющийся листенер - авторегистрация однако. Теперь про "shared memory realm". Система такая: - под никсами первый же процесс экземпляра создает shared memory segment(ы), к которому(ым) при старте подключаются фоновые процессы. Поэтому под никс новый сервис (экземпляр) БД элементарно поднимается из sqlplus - под win все немного иначе. Все процессы oracle реализованы как threads общего процесса oracle.exe, а shared memory - просто кусок памяти в пределах одного процесса. Поэтому этот самый процесс необходимо запустить. Можно даже лапками, но принято - сервисом win. Соответственно, получение "shared memory realm" при старте сервиса win означает, что что-то идет не так именно при запуске сервиса WIN, еще до того, как oracle начнет создавать свои фоновые процессы. Потому и чтить надо виндовый event.log, а не оракловый alert.log Может привилегий каких пользователю не хватает (к примеру, юзер system не имеет привилегий на работу с сетью), может памяти, может UAC протестует... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.10.2018, 15:54 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
andrey_anonymous, 1. И все? что-то не верится. В Станиславского играть будем? Нет ничего там. Я бы привел конечно логи, но там реально нет критичных событий кроме этого, а мусорить пост не хочется. 2. Листенер не надо было "отключить", его надо было почитать на предмет конфликта ресурсов. А если отключать - то убедиться, что БД настроена на имеющийся листенер - авторегистрация однако. Если он не запущен то какие конфликты? Таки да, если при отключенном листненере оно бы поднялось - дело в конфликте, но нет. Еще раз говорю - это не первый мой кластер, да и с ораклом не вчера столкнулся. Интересует как раз сталкивался ли кто с версией 4.1.1 и с 3.4 и в чем разница в поведении. Теперь про "shared memory realm". Система такая: - под никсами первый же процесс экземпляра создает shared memory segment(ы), к которому(ым) при старте подключаются фоновые процессы. Поэтому под никс новый сервис (экземпляр) БД элементарно поднимается из sqlplus - под win все немного иначе. Все процессы oracle реализованы как threads общего процесса oracle.exe, а shared memory - просто кусок памяти в пределах одного процесса. Поэтому этот самый процесс необходимо запустить. Можно даже лапками, но принято - сервисом win. Соответственно, получение "shared memory realm" при старте сервиса win означает, что что-то идет не так именно при запуске сервиса WIN, еще до того, как oracle начнет создавать свои фоновые процессы. Потому и чтить надо виндовый event.log, а не оракловый alert.log Может привилегий каких пользователю не хватает (к примеру, юзер system не имеет привилегий на работу с сетью), может памяти, может UAC протестует... Спасибо, кэп, как работает оракл Я знаю, азы мне обьяснять не надо. Служба как раз запускается нормально и от system. UAC отключен. Пользователь администратор кластера в группе ora_dba (и system тоже). Отдельностоящая база запускается нормально. Значит дело в кластере >sc query oracleservicetest3 SERVICE_NAME: oracleservicetest3 TYPE : 10 WIN32_OWN_PROCESS STATE : 4 RUNNING (STOPPABLE, PAUSABLE, ACCEPTS_SHUTDOWN) WIN32_EXIT_CODE : 0 (0x0) SERVICE_EXIT_CODE : 0 (0x0) CHECKPOINT : 0x0 WAIT_HINT : 0x0 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.10.2018, 14:36 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
А Oracle support молчит ? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.10.2018, 15:09 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
Dr. SYS, Техподдержки нет, так как Оракл куплен давно, а техподдержкой не заморачивались (обычная мне думается ситуация). Я бы с радостью и металинк бы почитал тоже... но, как говорится, за неимением гербовой бумаги пишем на туалетной.. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.10.2018, 15:28 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
nick348>sc query oracleservicetest3 SERVICE_NAME: oracleservicetest3 TYPE : 10 WIN32_OWN_PROCESS STATE : 4 RUNNING (STOPPABLE, PAUSABLE, ACCEPTS_SHUTDOWN) WIN32_EXIT_CODE : 0 (0x0) SERVICE_EXIT_CODE : 0 (0x0) CHECKPOINT : 0x0 WAIT_HINT : 0x0 А если в этом состоянии подключиться локально плюсом к экземпляру "test3" - что будет? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.10.2018, 16:27 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
andrey_anonymous, Connected to an idle instance. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.10.2018, 17:12 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
andrey_anonymous, Еще заметил что если после этого делать startup то SQL> startup ORA-01078: failure in processing system parameters ORA-01565: error in identifying file 'g:\oradata\test3\SPFILETEST3.ORA' ORA-27046: file size is not a multiple of logical block size OSD-04012: file size mismatch (OS 73) и spfile сам портится. там остается только параметр связанный с листнером и вверху странный символ. C" local_listener="(ADDRESS=(PROTOCOL=TCP)(HOST=<ip ноды на которой база изначально>)(PORT=1521))" ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.10.2018, 17:29 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
andrey_anonymous, Это я понял. Вопрос в том почему он портится. Потому что при каждом заведении в кластер это происходит. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.10.2018, 08:51 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
nick348и вверху странный символ. Рискну напомнить, что spfile - бинарный . Т.е. сам по себе - скорее всего нормальный, надо права проконтролировать и убедиться, что он не на nfs-е каком лежит. nick348Вопрос в том почему он портится. Потому что при каждом заведении в кластер это происходит. Ссылку не почитали? Я тогда дошел до того, что на локальном диске ноды spfile размещать вообще не следует. Только pfile со ссылкой на shared spfile для старта экземпляра. Посмотрите на pfile и spfile Sample database (которая успешно размещается), в чем разница (наличие, размещение, контент, привилегии) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 03.10.2018, 10:13 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
andrey_anonymous, Cсылку почитал. Не очень понял причину. У меня хранилка iSCSI и портится только spfile. Понятно что бинарный. Лежит на кластерном диске как и должен. У той что помещается вообще в pfile только ссылка на spfile. Если так сделать на самодельной базе, то такого не получается - начинает ругаться что не хватает параметров. Нормальный spfile у standalone базы по контенту другой совсем - он больше по размеру и т.д. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2018, 11:08 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
почему resource tst, база wgs, а инстанс test ? с названиями что-то напутали ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2018, 11:24 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
DВА, Несколько раз с разными именами переделывал. ошибка одна и та же. В листинги да, мог напутать. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2018, 11:49 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
nick348Понятно что бинарный. Лежит на кластерном диске как и должен. У той что помещается вообще в pfile только ссылка на spfile. Если так сделать на самодельной базе, то такого не получается - начинает ругаться что не хватает параметров. Нормальный spfile у standalone базы по контенту другой совсем - он больше по размеру и т.д. 1. g:\oradata\test3\ - кластерный? 2. По ссылке я тогда пришел к рабочей схеме "локальный нодовый pfile со ссылкой на кластерный spfile", локальных нодовых spfile быть не должно - экземпляр предпочитает их pfile-лу и может путаться в винегрете из локальных и нодовых spfile. 3. Содержимое (s|p)file - не очень понятно, что мешает создать кластерный spfile с требуемым контентом. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2018, 12:09 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
andrey_anonymous, 1. Кластерный диск g:. Физически он на хранилке iSCSI 2. Так и есть. pfile локальный в %ORA_HOME%\database (ОС windows) с параметрами (листинг ниже), в том числе с параметром spfile. Сам spfile лежит по кластерному пути. Сделан через create spfile='g:\oradata\test3\spfiletest3.ora' from pfile; test3.__db_cache_size=3506438144 test3.__java_pool_size=16777216 test3.__large_pool_size=33554432 test3.__oracle_base='C:\oracle'#ORACLE_BASE set from environment test3.__pga_aggregate_target=3087007744 test3.__sga_target=4630511616 test3.__shared_io_pool_size=234881024 test3.__shared_pool_size=822083584 test3.__streams_pool_size=0 *.audit_file_dest='g:\oradata\test3\adump' *.audit_trail='db' *.compatible='12.1.0.2.0' *.control_files='g:\oradata\test3\control01.ctl','g:\oradata\test3\control02.ctl' *.db_block_size=8192 *.db_domain='' *.db_name='test3' *.db_recovery_file_dest='G:\WGS_BCK' *.db_recovery_file_dest_size=6420m *.diagnostic_dest='C:\oracle' *.dispatchers='(PROTOCOL=TCP)' *.local_listener='LISTENER_TEST3' *.log_archive_format='ARC%S_%R.%T' *.memory_target=7360m *.nls_language='RUSSIAN' *.nls_territory='RUSSIA' *.open_cursors=300 *.processes=300 *.remote_login_passwordfile='EXCLUSIVE' *.undo_tablespace='UNDOTBS1' SPFILE=g:\oradata\test3\SPFILETEST3.ORA 3. Вот как раз что мешает и непонятно, так как командой в п2 создается нормальный бинарный spfile (листинг ниже) с которым инстанс прекрасно запускается, база открывается и к ней есть доступ, но он ВНЕЗАПНО портится при помещении в кластер. C" C« фрл: C C" E test3.__data_transfer_cache_size=0 test3.__db_cache_size=3388997632 test3.__java_pool_size=16777216 test3.__large_pool_size=150994944 test3.__oracle_base='C:\oracle'#ORACLE_BASE set from environment test3.__pga_aggregate_target=3087007744 test3.__sga_target=4630511616 test3.__shared_io_pool_size=234881024 test3.__shared_pool_size=822083584 test3.__streams_pool_size=0 *.audit_file_dest='g:\oradata\test3\adump' *.audit_trail='db' *.compatible='12.1.0.2.0' *.control_files='g:\oradata\teC C" st3\control01.ctl','g:\oradata\test3\control02.ctl' *.db_block_size=8192 *.db_domain='' *.db_name='test3' *.db_recovery_file_dest='G:\WGS_BCK' *.db_recovery_file_dest_size=6420m *.diagnostic_dest='C:\oracle' *.dispatchers='(PROTOCOL=TCP)' *.local_listener='(ADDRESS=(PROTOCOL=IPC)(KEY=REGISTER_FslTESTBASE))'#03.10.2018 10:46:12 by Oracle Fail Safe *.log_archive_format='ARC%S_%R.%T' *.memory_target=7360m *.nls_language='RUSSIAN' *.nls_territory='RUSSIA' *.open_cursors=300 *.processes=3C C" ~W 00 *.remote_login_passwordfile='EXCLUSIVE' *.undo_tablespace='UNDOTBS1' C C" Fe C C" Ee C C" De C ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2018, 12:52 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
nick348andrey_anonymous, 1. Кластерный диск g:. Физически он на хранилке iSCSI 2. Так и есть. pfile локальный в %ORA_HOME%\database (ОС windows) с параметрами (листинг ниже), в том числе с параметром spfile. Сам spfile лежит по кластерному пути. Сделан через create spfile='g:\oradata\test3\spfiletest3.ora' from pfile; test3.__db_cache_size=3506438144 ... *.audit_file_dest='g:\oradata\test3\adump' ... SPFILE=g:\oradata\test3\SPFILETEST3.ORA ИМХО: 1. Почему __db_cache_size=3506438144 и прочие указаны только для одной ноды кластера? Если они одинаковые для всех нод, то *.__db_cache_size=3506438144, если разные - то "звездочный" параметр все равно лучше завести. 2. "шаблонный" pfile (используемый для создания spfile) не должен содержать ссылки на spfile (по этой ссылке выходит, что итоговый spfile должен сослаться ссылается сам на себя - индусы могли не предусмотреть). 3. "стартовый" pfile (который лежит в dbs и используется для старта экземпляра без явного указания) не должен содержать ничего кроме SPFILE=g:\oradata\test3\SPFILETEST3.ORA 4. в dbs, где лежит pfile (3), физически не должно быть spfile ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2018, 17:33 |
|
||
|
Oracle FailSafe 4.1.1
|
|||
|---|---|---|---|
|
#18+
andrey_anonymous, 1. учту 2. сделал 3.сделал. не помогло 4. так и есть там нет никаких spfile ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.10.2018, 17:58 |
|
||
|
|

start [/forum/topic.php?fid=52&msg=39712862&tid=1883260]: |
0ms |
get settings: |
8ms |
get forum list: |
14ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
168ms |
get topic data: |
7ms |
get forum data: |
2ms |
get page messages: |
40ms |
get tp. blocked users: |
1ms |
| others: | 230ms |
| total: | 476ms |

| 0 / 0 |
