Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Oracle [игнор отключен] [закрыт для гостей] / Oracle FailSafe 4.1.1 / 22 сообщений из 22, страница 1 из 1
28.09.2018, 16:31
    #39709980
nick348
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
Добрый день, коллеги

Имеется OracleFailSafe 4.1.1+Windows Server 2012R2 + Oracle Database 12.1.0.2

Проблема такая:

Sample database создается и помещается в кластер нормально.
Если помещать самостоятельно созданную на кластерных дисках базу, то возникают ошибки. Судя по логу, инстанс в группу помещается нормально и переводится в онлайн, но дальше ощущение такое что кластерные службы не могут стартовать базу. В алертлоге старта базы не фиксируется, только останов. В чем может быть проблема? В event-логе такое

далее логи. Если что-то нужно дорассказать/показать дополнительно спрашивайте.
У меня есть несколько кластеров версии 3(.4.1 и 4.2) с базами 10g и 11g - там таких проблем нет. Здесть мне нужен именно 12c кластер (пока для тестов). Oracle 12.2 и OFS 4.2 пробовал - там теже ошибки.
База тестовая создана с нуля через dbca.

Oracle Fail Safe resource tst failed to start.
ORA-01034: ORACLE not available
ORA-27101: shared memory realm does not exist

Вот сам лог помещения базы в группу

27 сентября 2018 г.

Versions
Fail Safe Manager 4.1.1.0
Fail Safe API 4.1.1.0
Fail Safe Server 4.1.1.0

Nodes
v98-tstn-04 Windows Server V6.2
v98-tstn-03 Windows Server V6.2

17:38:40 FS-10370: Adding the resource wgs to group TESTBASE
17:38:40 FS-10371: v98-tstn-04 : Performing initialization processing
17:38:41 FS-10371: v98-tstn-03 : Performing initialization processing
17:38:41 FS-10372: v98-tstn-04 : Gathering resource owner information
17:38:41 FS-10372: v98-tstn-03 : Gathering resource owner information
17:38:41 FS-10373: v98-tstn-04 : Determining owner node of resource wgs
17:38:41 FS-10374: v98-tstn-04 : Gathering cluster information needed to perform the specified operation
17:38:41 FS-10374: v98-tstn-03 : Gathering cluster information needed to perform the specified operation
17:38:41 FS-10375: v98-tstn-03 : Analyzing cluster information needed to perform the specified operation
17:38:41 FS-10652: v98-tstn-04 has Oracle Database version 12.1.0.2 installed in OraDB12Home1
17:38:41 FS-10652: v98-tstn-03 has Oracle Database version 12.1.0.2 installed in OraDB12Home1
17:38:41 FS-10376: v98-tstn-03 : Starting configuration of resource wgs
17:38:41 FS-10378: v98-tstn-03 : Preparing for configuration of resource wgs
17:38:42 FS-10341: Starting verification of database wgs
17:38:42 FS-10343: Starting verification of database instance information for database wgs
17:38:42 FS-10425: Querying the disks used by the database wgs
17:38:42 FS-10404: The database uses a nonclustered disk in one of the system parameters. Value of parameter is C:\ORACLE\ADMIN\tst\ADUMP
17:38:42 FS-10345: Verification of standalone database wgs completed successfully
17:38:42 FS-10380: v98-tstn-03 : Configuring virtual server information for resource wgs
17:38:42 FS-10490: Configuring the Oracle Net listener for wgs
17:38:42 FS-10600: Oracle Net configuration file updated: C:\oracle\product\12.1.0\dbhome_1\network\admin\listener.ora
17:38:42 FS-10600: Oracle Net configuration file updated: C:\oracle\product\12.1.0\dbhome_1\network\admin\tnsnames.ora
17:38:52 FS-10605: Oracle Net listener FslTESTBASE created
17:38:52 FS-10381: v98-tstn-03 : Creating the resource information for resource wgs
17:38:52 FS-10426: Adding the database resource wgs to group TESTBASE
17:38:52 FS-10382: v98-tstn-03 : Bringing resource wgs online
17:39:00 FS-10726: Resource wgs is in a failed state
17:39:00 FS-10012: Failed to bring the cluster resource wgs online. Check the Windows event log for messages
17:39:00 FS-10782: The Oracle Database resource provider failed to bring resource wgs online
17:39:00 FS-10890: Oracle Services for MSCS failed during the add operation
17:39:00 FS-10497: Starting clusterwide rollback of the operation
17:39:00 FS-10488: v98-tstn-03 : Starting rollback of operation
17:39:03 FS-10350: Starting database wgs
17:39:05 ORA-01034: ORACLE not availableORA-27101: shared memory realm does not exist
17:39:05 FS-10600: Oracle Net configuration file updated: C:\oracle\product\12.1.0\dbhome_1\network\admin\tnsnames.ora
17:39:06 FS-10604: Oracle Net listener FslTESTBASE deleted
17:39:06 FS-10999: An internal programming error has occurred
17:39:06 FS-10600: Oracle Net configuration file updated: C:\oracle\product\12.1.0\dbhome_1\network\admin\listener.ora
17:39:06 FS-10489: v98-tstn-03 : Completed rollback of operation
17:39:06 FS-10495: Clusterwide rollback of the operation has been completed
17:39:06 The clusterwide operation failed.
...
Рейтинг: 0 / 0
28.09.2018, 16:35
    #39709983
nick348
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
nick348,

Еще уточнение. Вне кластера база стартует и работает нормально.
...
Рейтинг: 0 / 0
28.09.2018, 16:55
    #39710006
andrey_anonymous
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
автор17:39:00 FS-10012: Failed to bring the cluster resource wgs online. Check the Windows event log for messages
17:39:00 FS-10782: The Oracle Database resource provider failed to bring resource wgs online
17:39:00 FS-10890: Oracle Services for MSCS failed during the add operation


Никогда не поднимал кластер под win, но что-то оно как-то не дружит с MSCS.
Возможно, все-таки стоит почитать eventlog?

Применительно к БД смущает еще две вещи:
1. Попытка поднять отдельный именованный листенер, оно для зачем? И не конфликтует ли с уже имеющимся листенером по ресурсам (порт)?
автор17:38:42 FS-10600: Oracle Net configuration file updated: C:\oracle\product\12.1.0\dbhome_1\network\admin\listener.ora
17:38:42 FS-10600: Oracle Net configuration file updated: C:\oracle\product\12.1.0\dbhome_1\network\admin\tnsnames.ora
17:38:52 FS-10605: Oracle Net listener FslTESTBASE created

2. Уверены, что на всех нодах присутствует указанный путь и этот путь доступен пользователю, от которого поднимается экземпляр, на всех нодах?
автор17:38:42 FS-10404: The database uses a nonclustered disk in one of the system parameters. Value of parameter is C:\ORACLE\ADMIN\tst\ADUMP
...
Рейтинг: 0 / 0
01.10.2018, 10:58
    #39710802
nick348
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
andrey_anonymous,

Спасибо за помощь, но...

"Никогда не поднимал кластер под win, но что-то оно как-то не дружит с MSCS.
Возможно, все-таки стоит почитать eventlog?"

читал. там фейл при старте базы, который Я привел

Oracle Fail Safe resource tst failed to start.
ORA-01034: ORACLE not available
ORA-27101: shared memory realm does not exist

Листнер отключил - та же проблема. Если проблема в нем почему sample database садится в кластер нормально?

По поводу adump - перенестраивал на кластерный диск - тоже не помогло.
...
Рейтинг: 0 / 0
01.10.2018, 15:54
    #39711019
andrey_anonymous
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
nick348 там фейл при старте базы, который Я привел

Листнер отключил - та же проблема. Если проблема в нем почему sample database садится в кластер нормально?

По поводу adump - перенестраивал на кластерный диск - тоже не помогло.
1. И все? что-то не верится.
2. Листенер не надо было "отключить", его надо было почитать на предмет конфликта ресурсов.
А если отключать - то убедиться, что БД настроена на имеющийся листенер - авторегистрация однако.

Теперь про "shared memory realm".
Система такая:
- под никсами первый же процесс экземпляра создает shared memory segment(ы), к которому(ым) при старте подключаются фоновые процессы. Поэтому под никс новый сервис (экземпляр) БД элементарно поднимается из sqlplus
- под win все немного иначе. Все процессы oracle реализованы как threads общего процесса oracle.exe, а shared memory - просто кусок памяти в пределах одного процесса.
Поэтому этот самый процесс необходимо запустить.
Можно даже лапками, но принято - сервисом win.
Соответственно, получение "shared memory realm" при старте сервиса win означает, что что-то идет не так именно при запуске сервиса WIN, еще до того, как oracle начнет создавать свои фоновые процессы.
Потому и чтить надо виндовый event.log, а не оракловый alert.log
Может привилегий каких пользователю не хватает (к примеру, юзер system не имеет привилегий на работу с сетью), может памяти, может UAC протестует...
...
Рейтинг: 0 / 0
02.10.2018, 14:36
    #39711704
nick348
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
andrey_anonymous,


1. И все? что-то не верится.

В Станиславского играть будем? Нет ничего там. Я бы привел конечно логи, но там реально нет критичных событий кроме этого, а мусорить пост не хочется.

2. Листенер не надо было "отключить", его надо было почитать на предмет конфликта ресурсов.
А если отключать - то убедиться, что БД настроена на имеющийся листенер - авторегистрация однако.

Если он не запущен то какие конфликты? Таки да, если при отключенном листненере оно бы поднялось - дело в конфликте, но нет.
Еще раз говорю - это не первый мой кластер, да и с ораклом не вчера столкнулся. Интересует как раз сталкивался ли кто с версией 4.1.1 и с 3.4 и в чем разница в поведении.

Теперь про "shared memory realm".
Система такая:
- под никсами первый же процесс экземпляра создает shared memory segment(ы), к которому(ым) при старте подключаются фоновые процессы. Поэтому под никс новый сервис (экземпляр) БД элементарно поднимается из sqlplus
- под win все немного иначе. Все процессы oracle реализованы как threads общего процесса oracle.exe, а shared memory - просто кусок памяти в пределах одного процесса.
Поэтому этот самый процесс необходимо запустить.
Можно даже лапками, но принято - сервисом win.
Соответственно, получение "shared memory realm" при старте сервиса win означает, что что-то идет не так именно при запуске сервиса WIN, еще до того, как oracle начнет создавать свои фоновые процессы.
Потому и чтить надо виндовый event.log, а не оракловый alert.log
Может привилегий каких пользователю не хватает (к примеру, юзер system не имеет привилегий на работу с сетью), может памяти, может UAC протестует...

Спасибо, кэп, как работает оракл Я знаю, азы мне обьяснять не надо.
Служба как раз запускается нормально и от system. UAC отключен. Пользователь администратор кластера в группе ora_dba (и system тоже). Отдельностоящая база запускается нормально. Значит дело в кластере

>sc query oracleservicetest3

SERVICE_NAME: oracleservicetest3
TYPE : 10 WIN32_OWN_PROCESS
STATE : 4 RUNNING
(STOPPABLE, PAUSABLE, ACCEPTS_SHUTDOWN)
WIN32_EXIT_CODE : 0 (0x0)
SERVICE_EXIT_CODE : 0 (0x0)
CHECKPOINT : 0x0
WAIT_HINT : 0x0
...
Рейтинг: 0 / 0
02.10.2018, 15:09
    #39711740
Dr. SYS
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
А Oracle support молчит ?
...
Рейтинг: 0 / 0
02.10.2018, 15:28
    #39711756
nick348
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
Dr. SYS,

Техподдержки нет, так как Оракл куплен давно, а техподдержкой не заморачивались (обычная мне думается ситуация). Я бы с радостью и металинк бы почитал тоже... но, как говорится, за неимением гербовой бумаги пишем на туалетной..
...
Рейтинг: 0 / 0
02.10.2018, 16:27
    #39711817
andrey_anonymous
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
nick348>sc query oracleservicetest3

SERVICE_NAME: oracleservicetest3
TYPE : 10 WIN32_OWN_PROCESS
STATE : 4 RUNNING
(STOPPABLE, PAUSABLE, ACCEPTS_SHUTDOWN)
WIN32_EXIT_CODE : 0 (0x0)
SERVICE_EXIT_CODE : 0 (0x0)
CHECKPOINT : 0x0
WAIT_HINT : 0x0
А если в этом состоянии подключиться локально плюсом к экземпляру "test3" - что будет?
...
Рейтинг: 0 / 0
02.10.2018, 17:12
    #39711852
nick348
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
andrey_anonymous,

Connected to an idle instance.
...
Рейтинг: 0 / 0
02.10.2018, 17:29
    #39711867
nick348
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
andrey_anonymous,

Еще заметил что если после этого делать startup то

SQL> startup
ORA-01078: failure in processing system parameters
ORA-01565: error in identifying file 'g:\oradata\test3\SPFILETEST3.ORA'
ORA-27046: file size is not a multiple of logical block size
OSD-04012: file size mismatch (OS 73)

и spfile сам портится. там остается только параметр связанный с листнером и вверху странный символ.

C"
local_listener="(ADDRESS=(PROTOCOL=TCP)(HOST=<ip ноды на которой база изначально>)(PORT=1521))"
...
Рейтинг: 0 / 0
02.10.2018, 17:58
    #39711899
andrey_anonymous
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
Ну вот и причина - spfile кривой :)
Было как-то нечто отдаленно похожее:
ORA-32000
...
Рейтинг: 0 / 0
03.10.2018, 08:51
    #39712217
nick348
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
andrey_anonymous,

Это я понял. Вопрос в том почему он портится. Потому что при каждом заведении в кластер это происходит.
...
Рейтинг: 0 / 0
03.10.2018, 10:13
    #39712269
andrey_anonymous
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
nick348и вверху странный символ.
Рискну напомнить, что spfile - бинарный .
Т.е. сам по себе - скорее всего нормальный, надо права проконтролировать и убедиться, что он не на nfs-е каком лежит.

nick348Вопрос в том почему он портится. Потому что при каждом заведении в кластер это происходит.
Ссылку не почитали?
Я тогда дошел до того, что на локальном диске ноды spfile размещать вообще не следует.
Только pfile со ссылкой на shared spfile для старта экземпляра.
Посмотрите на pfile и spfile Sample database (которая успешно размещается), в чем разница (наличие, размещение, контент, привилегии)
...
Рейтинг: 0 / 0
04.10.2018, 11:08
    #39712862
nick348
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
andrey_anonymous,

Cсылку почитал. Не очень понял причину. У меня хранилка iSCSI и портится только spfile.
Понятно что бинарный.
Лежит на кластерном диске как и должен.
У той что помещается вообще в pfile только ссылка на spfile.
Если так сделать на самодельной базе, то такого не получается - начинает ругаться что не хватает параметров.
Нормальный spfile у standalone базы по контенту другой совсем - он больше по размеру и т.д.
...
Рейтинг: 0 / 0
04.10.2018, 11:24
    #39712878
DВА
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
почему resource tst, база wgs, а инстанс test ?
с названиями что-то напутали
...
Рейтинг: 0 / 0
04.10.2018, 11:49
    #39712897
nick348
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
DВА,

Несколько раз с разными именами переделывал. ошибка одна и та же. В листинги да, мог напутать.
...
Рейтинг: 0 / 0
04.10.2018, 12:09
    #39712912
andrey_anonymous
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
nick348Понятно что бинарный.
Лежит на кластерном диске как и должен.
У той что помещается вообще в pfile только ссылка на spfile.
Если так сделать на самодельной базе, то такого не получается - начинает ругаться что не хватает параметров.
Нормальный spfile у standalone базы по контенту другой совсем - он больше по размеру и т.д.
1. g:\oradata\test3\ - кластерный?
2. По ссылке я тогда пришел к рабочей схеме "локальный нодовый pfile со ссылкой на кластерный spfile", локальных нодовых spfile быть не должно - экземпляр предпочитает их pfile-лу и может путаться в винегрете из локальных и нодовых spfile.
3. Содержимое (s|p)file - не очень понятно, что мешает создать кластерный spfile с требуемым контентом.
...
Рейтинг: 0 / 0
04.10.2018, 12:52
    #39712947
nick348
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
andrey_anonymous,

1. Кластерный диск g:. Физически он на хранилке iSCSI
2. Так и есть. pfile локальный в %ORA_HOME%\database (ОС windows) с параметрами (листинг ниже), в том числе с параметром spfile. Сам spfile лежит по кластерному пути. Сделан через
create spfile='g:\oradata\test3\spfiletest3.ora' from pfile;

test3.__db_cache_size=3506438144
test3.__java_pool_size=16777216
test3.__large_pool_size=33554432
test3.__oracle_base='C:\oracle'#ORACLE_BASE set from environment
test3.__pga_aggregate_target=3087007744
test3.__sga_target=4630511616
test3.__shared_io_pool_size=234881024
test3.__shared_pool_size=822083584
test3.__streams_pool_size=0
*.audit_file_dest='g:\oradata\test3\adump'
*.audit_trail='db'
*.compatible='12.1.0.2.0'
*.control_files='g:\oradata\test3\control01.ctl','g:\oradata\test3\control02.ctl'
*.db_block_size=8192
*.db_domain=''
*.db_name='test3'
*.db_recovery_file_dest='G:\WGS_BCK'
*.db_recovery_file_dest_size=6420m
*.diagnostic_dest='C:\oracle'
*.dispatchers='(PROTOCOL=TCP)'
*.local_listener='LISTENER_TEST3'
*.log_archive_format='ARC%S_%R.%T'
*.memory_target=7360m
*.nls_language='RUSSIAN'
*.nls_territory='RUSSIA'
*.open_cursors=300
*.processes=300
*.remote_login_passwordfile='EXCLUSIVE'
*.undo_tablespace='UNDOTBS1'
SPFILE=g:\oradata\test3\SPFILETEST3.ORA

3. Вот как раз что мешает и непонятно, так как командой в п2 создается нормальный бинарный spfile (листинг ниже) с которым инстанс прекрасно запускается, база открывается и к ней есть доступ, но он ВНЕЗАПНО портится при помещении в кластер.

C" C« фрл: C C" E test3.__data_transfer_cache_size=0
test3.__db_cache_size=3388997632
test3.__java_pool_size=16777216
test3.__large_pool_size=150994944
test3.__oracle_base='C:\oracle'#ORACLE_BASE set from environment
test3.__pga_aggregate_target=3087007744
test3.__sga_target=4630511616
test3.__shared_io_pool_size=234881024
test3.__shared_pool_size=822083584
test3.__streams_pool_size=0
*.audit_file_dest='g:\oradata\test3\adump'
*.audit_trail='db'
*.compatible='12.1.0.2.0'
*.control_files='g:\oradata\teC C" st3\control01.ctl','g:\oradata\test3\control02.ctl'
*.db_block_size=8192
*.db_domain=''
*.db_name='test3'
*.db_recovery_file_dest='G:\WGS_BCK'
*.db_recovery_file_dest_size=6420m
*.diagnostic_dest='C:\oracle'
*.dispatchers='(PROTOCOL=TCP)'
*.local_listener='(ADDRESS=(PROTOCOL=IPC)(KEY=REGISTER_FslTESTBASE))'#03.10.2018 10:46:12 by Oracle Fail Safe
*.log_archive_format='ARC%S_%R.%T'
*.memory_target=7360m
*.nls_language='RUSSIAN'
*.nls_territory='RUSSIA'
*.open_cursors=300
*.processes=3C C" ~W 00
*.remote_login_passwordfile='EXCLUSIVE'
*.undo_tablespace='UNDOTBS1'
C C" Fe C C" Ee C C" De C
...
Рейтинг: 0 / 0
04.10.2018, 17:33
    #39713155
andrey_anonymous
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
nick348andrey_anonymous,

1. Кластерный диск g:. Физически он на хранилке iSCSI
2. Так и есть. pfile локальный в %ORA_HOME%\database (ОС windows) с параметрами (листинг ниже), в том числе с параметром spfile. Сам spfile лежит по кластерному пути. Сделан через
create spfile='g:\oradata\test3\spfiletest3.ora' from pfile;

test3.__db_cache_size=3506438144
...
*.audit_file_dest='g:\oradata\test3\adump'
...
SPFILE=g:\oradata\test3\SPFILETEST3.ORA

ИМХО:
1. Почему __db_cache_size=3506438144 и прочие указаны только для одной ноды кластера?
Если они одинаковые для всех нод, то *.__db_cache_size=3506438144, если разные - то "звездочный" параметр все равно лучше завести.
2. "шаблонный" pfile (используемый для создания spfile) не должен содержать ссылки на spfile (по этой ссылке выходит, что итоговый spfile должен сослаться ссылается сам на себя - индусы могли не предусмотреть).
3. "стартовый" pfile (который лежит в dbs и используется для старта экземпляра без явного указания) не должен содержать ничего кроме SPFILE=g:\oradata\test3\SPFILETEST3.ORA
4. в dbs, где лежит pfile (3), физически не должно быть spfile
...
Рейтинг: 0 / 0
04.10.2018, 17:58
    #39713178
nick348
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
andrey_anonymous,

1. учту
2. сделал
3.сделал. не помогло
4. так и есть там нет никаких spfile
...
Рейтинг: 0 / 0
01.11.2018, 15:50
    #39726681
nick348
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Oracle FailSafe 4.1.1
nick348,

Все оказалось проще кому еще интересно - Я оказывается вместо pfile при помещении в кластер подсовывал spfile потому он и портился.
...
Рейтинг: 0 / 0
Форумы / Oracle [игнор отключен] [закрыт для гостей] / Oracle FailSafe 4.1.1 / 22 сообщений из 22, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]