powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / IBM DB2, WebSphere, IMS, U2 [игнор отключен] [закрыт для гостей] / OS ERROR 121: Semaphore timeout period has expired в db2diag.log
10 сообщений из 10, страница 1 из 1
OS ERROR 121: Semaphore timeout period has expired в db2diag.log
    #36470565
sokolenotchek
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Доброго дня!
Подскажите, если кто сталкивался, как попробовать решить такую проблему:
У нас периодически "падает" DB2. По db2diag.log "падение" сопровождается следующими сообщениями:

2010-02-04-15.56.25.046000+180 E10627539F447 LEVEL: Error (OS)
PID : 476 TID : 3328 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-909 APPID: GA4061AB.F50D.116684105603
FUNCTION: DB2 UDB, oper system services, sqloReadFileInterrupt, probe:4
CALLED : OS, -, unspecified_system_function
OSERR : 121 "The semaphore timeout period has expired."

2010-02-04-15.56.25.578000+180 I10627988F464 LEVEL: Error
PID : 476 TID : 5396 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1074 APPID: GA17FA4B.G113.127304124215
FUNCTION: DB2 UDB, common communication, sqlcctcptest, probe:11
MESSAGE : Detected client termination
DATA #1 : Hexdump, 2 bytes
0x00000007734B89B8 : 3600 6.


Про Semaphore написано - что чаще всего проблемы сети - все перепроверили, никаких ни ошибок, ни сбоев не было...
После этих двух эрроров еще диаг много всего отписывает, но начало именно с них (если надо могу и продолжение скинуть).
Если кто-нибудь встречался, помогите - второй месяц бьемся. Причем сам момент на чем же именно падает отловить не можем - уже постфактум видим, когда приложение перестает отвечать.
...
Рейтинг: 0 / 0
OS ERROR 121: Semaphore timeout period has expired в db2diag.log
    #36470700
Mark Barinstein
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Здравствуйте.

db2 внутри sqloReadFileInterrupt вызывает виндовую tcpRecv и получает ошибку 121.
Advanced network adapter troubleshooting for Windows workstations
...
Рейтинг: 0 / 0
OS ERROR 121: Semaphore timeout period has expired в db2diag.log
    #36470814
sokolenotchek,


На всякий случай, методика получения IP-адреса и порта клиента, с которым произошел разрыв соединения.
appl_id - Application ID monitor element
GA4061AB.F50D.116684105603 -> 0A4061AB:F50D -> 10.64.97.171:62733
GA17FA4B.G113.127304124215 -> 0A17FA4B:0113 -> 10.23.250.75:275

А как именно "падает"? Сам по себе разрыв сетевого соединения фатальным являться не должен.

В общем случае проверить уровень ОС на сервере и клиенте (по возможности установить сервиспаки и хотфиксы), номер версии и фикспак клиента и сервера (по возможности обновить до актуального уровня), проверить "свежесть" драйверов на сетевое оборудование (по возможности обновить) и корректность сетевых настроек.
В некоторых случаях помогает явное выставление размера MTU для TCP/IP с обоих сторон. А вообще анализ проблем СПД - это отдельная и очень большая тема.
...
Рейтинг: 0 / 0
OS ERROR 121: Semaphore timeout period has expired в db2diag.log
    #36471742
sokolenotchek
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Mark Barinstein,
Евгений Хабаров,

На самом деле с сетью уже мучались и это было первое с чего начали, начитавшись инфы от МелкоМягких... Полностью переставили драйвера на все адаптеры (сервера HP DL 380-5), переставляли карты, добавляли в сервер отдельные сетевые карты, правили маршрутизацию, создали идеальные сетевые условия - с минимальными перебросками по железкам до клиентской сети, сервера базы и сервер приложений повесили на одну железку (комутатор), причем к комутатору больше ничего не подключено, выставили на серверах жесткие скорости... Семафорит как и было раньше... На комутаторе есть возможность просмотра ошибок - так ошибок трансфера нету...

Как "падает".
Видим что недоступна база по серверу приложений - на самой БД поймать момент не удалось (по логам - в секунды...) Достучаться до базы не можем. В трее значок показывает что база остановлена. Но команда db2start говорит что запустить не могу, т.к. менеджре баз данных уже запущен. Команда db2stop force - говорит что асинхронная команда уже выполняется....По логам после тех эрроров которые я уже писала, лезет куча дампов. Ждать, сколько времени она будет выполняться не можем (простой более 5-ти минут - срыв работы....). Спасаемся перезагрузкой машины.
Версия БД - 8,1,18,980
ОС - Windows Server 2003 SP1 x64


Я тут кусочек вчерашнего лога вставила - может что-то еще подскажите...
...
Рейтинг: 0 / 0
OS ERROR 121: Semaphore timeout period has expired в db2diag.log
    #36472055
sokolenotchek
Я тут кусочек вчерашнего лога вставила - может что-то еще подскажите...
Лога не видно.
...
Рейтинг: 0 / 0
OS ERROR 121: Semaphore timeout period has expired в db2diag.log
    #36472204
sokolenotchek
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Евгений Хабаров,

Точно...сорри...А

FUNCTION: DB2 UDB, common communication, sqlcctcptest, probe:11
MESSAGE : Detected client termination
DATA #1 : Hexdump, 2 bytes
0x000000077EEA8F68 : 3600 6.

2010-02-15-09.59.26.772000+180 I10889418F446 LEVEL: Error
PID : 2060 TID : 3320 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1078 APPID: GA17FA4B.L504.12B6C4195807
FUNCTION: DB2 UDB, common communication, sqlcctest, probe:50
MESSAGE : sqlcctest RC
DATA #1 : Hexdump, 2 bytes
0x000000077EEA8FC0 : 3600 6.

2010-02-15-09.59.26.772000+180 I10889866F446 LEVEL: Error
PID : 2060 TID : 3320 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1078 APPID: GA17FA4B.L504.12B6C4195807
FUNCTION: DB2 UDB, base sys utilities, sqleqint, probe:10
MESSAGE : sqleqint2 iRC
DATA #1 : Hexdump, 4 bytes
0x000000077EEA90D0 : 3600 0000 6...

2010-02-15-09.59.26.804000+180 I10890314F475 LEVEL: Severe
PID : 2060 TID : 3320 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1078 APPID: GA17FA4B.L504.12B6C4195807
FUNCTION: DB2 UDB, routine_infrastructure, sqlerReturnFmpToPool, probe:900
MESSAGE : marking fmp as unstable:
DATA #1 : Hexdump, 4 bytes
0x00000007594DEEC0 : 501F 0000 P...

2010-02-15-09.59.26.819000+180 I10890791F475 LEVEL: Severe
PID : 2060 TID : 3320 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1078 APPID: GA17FA4B.L504.12B6C4195807
FUNCTION: DB2 UDB, routine_infrastructure, sqlerReturnFmpToPool, probe:901
MESSAGE : marking fmp as unstable:
DATA #1 : Hexdump, 4 bytes
0x00000007594DEFB0 : 0000 0000 ....

2010-02-15-09.59.26.819000+180 I10891268F2367 LEVEL: Severe
PID : 2060 TID : 3320 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1078 APPID: GA17FA4B.L504.12B6C4195807
FUNCTION: DB2 UDB, routine_infrastructure, sqlerReturnFmpToPool, probe:902
MESSAGE : marking fmp as unstable:
DATA #1 : Hexdump, 376 bytes
0x00000007594DEEC0 : 501F 0000 0000 7B01 0000 7C01 0000 0000 P.....{...|.....
0x00000007594DEED0 : 0000 0000 0000 0000 0000 0000 0000 0000 ................
0x00000007594DEEE0 : 0000 0000 0000 0000 0000 0000 0000 0000 ................
0x00000007594DEEF0 : 0000 0000 0000 0000 0000 0000 0000 0000 ................
0x00000007594DEF00 : 0000 0000 0000 0000 0000 0000 0000 0000 ................
0x00000007594DEF10 : 0000 0000 0000 0000 0000 0000 0000 0000 ................
0x00000007594DEF20 : 0000 0000 0000 0000 0000 0000 0000 0000 ................
0x00000007594DEF30 : 0000 0000 0000 0000 0000 0000 0000 0000 ................
0x00000007594DEF40 : 0000 0000 0000 0000 0000 0000 0000 0000 ................
0x00000007594DEF50 : 0000 0000 0000 0000 0000 0000 0000 0000 ................
0x00000007594DEF60 : 0000 0000 0000 0000 0000 0000 0000 0000 ................
0x00000007594DEF70 : 0000 0000 0000 0000 0000 0000 0000 0000 ................
0x00000007594DEF80 : 609D 9DB4 0700 0000 5000 1257 0700 0000 `.......P..W....
0x00000007594DEF90 : 50F0 1257 0700 0000 00F0 0000 0000 0000 P..W............
0x00000007594DEFA0 : 0000 0000 022A 0000 2A02 0000 0000 0000 .....*..*.......
0x00000007594DEFB0 : 0000 0000 0000 0000 0000 0000 0000 0000 ................
0x00000007594DEFC0 : 0000 0000 0000 0000 404A 9691 0700 0000 ........@J......
0x00000007594DEFD0 : C0EE 4D59 0700 0000 E0ED 4D59 0700 0000 ..MY......MY....
0x00000007594DEFE0 : 0100 0000 0100 0000 0000 0000 0000 0000 ................
0x00000007594DEFF0 : 0000 0000 0000 0000 0000 0000 0000 0000 ................
0x00000007594DF000 : 0000 0000 0000 0000 00EC 4D59 0700 0000 ..........MY....
0x00000007594DF010 : 80F1 4D59 0700 0000 60F0 4D59 0700 0000 ..MY....`.MY....
0x00000007594DF020 : 1000 0000 0100 0000 0000 0000 0000 0100 ................
0x00000007594DF030 : 0100 0000 0000 0000 ........

2010-02-15-09.59.26.819000+180 E10893637F603 LEVEL: Severe
PID : 2060 TID : 3320 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1078 APPID: GA17FA4B.L504.12B6C4195807
FUNCTION: DB2 UDB, routine_infrastructure, sqlerReturnFmpToPool, probe:903
DATA #1 : String, 20 bytes
removeFromPool flag:
DATA #2 : Boolean, 1 bytes
true
DATA #3 : String, 20 bytes
Fmp entry use count:
DATA #4 : unsigned integer, 4 bytes
1
DATA #5 : String, 18 bytes
Fmp row use count:
DATA #6 : unsigned integer, 2 bytes

2010-02-15-09.59.26.835000+180 E10895225F519 LEVEL: Warning
PID : 2060 TID : 3320 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1078 APPID: GA17FA4B.L504.12B6C4195807
FUNCTION: DB2 UDB, routine_infrastructure, sqlerReturnFmpToPool, probe:1001
DATA #1 : String, 4 bytes
PID:
DATA #2 : SQLO_PID, PD_TYPE_PARAM_SQLO_PID, 4 bytes
8016
DATA #3 : String, 10 bytes
stateFlags
DATA #4 : Hex integer, 4 bytes
0x00000010

2010-02-15-09.59.28.585000+180 I10895746F491 LEVEL: Error
PID : 2060 TID : 3320 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1078 APPID: GA17FA4B.L504.12B6C4195807
FUNCTION: DB2 UDB, base sys utilities, sqleagnt_sigsegvh, probe:1
MESSAGE : Error in agent servicing application with coor_node:
DATA #1 : Hexdump, 2 bytes
0x000000077EEA71F2 : 0000 ..

2010-02-15-09.59.28.585000+180 I10896239F498 LEVEL: Error
PID : 2060 TID : 3320 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1078 APPID: GA17FA4B.L504.12B6C4195807
FUNCTION: DB2 UDB, base sys utilities, sqleagnt_sigsegvh, probe:2
MESSAGE : Error in agent servicing application with coor_agent_index:
DATA #1 : Hexdump, 2 bytes
0x000000077EEA71F0 : 3604 6.

2010-02-15-09.59.28.585000+180 I10896739F494 LEVEL: Error
PID : 2060 TID : 3320 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1078 APPID: GA17FA4B.L504.12B6C4195807
FUNCTION: DB2 UDB, base sys utilities, sqleagnt_sigsegvh, probe:3
MESSAGE : Error in agent servicing application with CLIENT PID:
DATA #1 : Hexdump, 4 bytes
0x000000077EEA71C0 : 3535 3536 5556

2010-02-15-09.59.28.601000+180 I10897235F595 LEVEL: Error
PID : 2060 TID : 3320 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1078 APPID: GA17FA4B.L504.12B6C4195807
FUNCTION: DB2 UDB, base sys utilities, sqleagnt_sigsegvh, probe:4
MESSAGE : Error in agent servicing application with INBOUND APPLICATION ID:
DATA #1 : Hexdump, 26 bytes
0x00000007B7854DB3 : 4741 3137 4641 3442 2E4C 3530 342E 3132 GA17FA4B.L504.12
0x00000007B7854DC3 : 4236 4334 3139 3538 3037 B6C4195807

2010-02-15-09.59.28.601000+180 I10897832F505 LEVEL: Error
PID : 2060 TID : 3320 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1078 APPID: GA17FA4B.L504.12B6C4195807
FUNCTION: DB2 UDB, base sys utilities, sqleagnt_sigsegvh, probe:5
MESSAGE : Error in agent servicing application with INBOUND SEQUENCE NUMBER:
DATA #1 : Hexdump, 2 bytes
0x00000007B7854DD4 : E119 ..

2010-02-15-09.59.28.601000+180 I10898339F409 LEVEL: Error
PID : 2060 TID : 3320 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1078 APPID: GA17FA4B.L504.12B6C4195807
FUNCTION: DB2 UDB, base sys utilities, sqleagnt_sigsegvh, probe:6
MESSAGE : Error in agent servicing application with OUTBOUND APPLICATION ID:

2010-02-15-09.59.28.616000+180 I10898750F410 LEVEL: Error
PID : 2060 TID : 3320 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1078 APPID: GA17FA4B.L504.12B6C4195807
FUNCTION: DB2 UDB, base sys utilities, sqleagnt_sigsegvh, probe:7
MESSAGE : Error in agent servicing application with OUTBOUND SEQUENCE NUMBER:

2010-02-15-09.59.28.616000+180 I10899162F594 LEVEL: Error
PID : 2060 TID : 3320 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1078 APPID: GA17FA4B.L504.12B6C4195807
FUNCTION: DB2 UDB, base sys utilities, sqleagnt_sigsegvh, probe:8
MESSAGE : Error in agent servicing application with AUTHORIZATION ID:
DATA #1 : Hexdump, 31 bytes
0x0000000756B2D2A3 : 4442 3241 444D 494E 0000 0000 0000 0000 DB2ADMIN........
0x0000000756B2D2B3 : 0000 0000 0000 0000 0000 0000 0000 00 ...............

2010-02-15-09.59.28.616000+180 I10899758F505 LEVEL: Error
PID : 2060 TID : 3320 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1078 APPID: GA17FA4B.L504.12B6C4195807
FUNCTION: DB2 UDB, base sys utilities, sqleagnt_sigsegvh, probe:9
MESSAGE : Error in agent servicing application with PRODUCT SIGNATURE:
DATA #1 : Hexdump, 8 bytes
0x0000000756B2DA3C : 5351 4C30 3830 3239 SQL08029

2010-02-15-09.59.28.616000+180 I10900265F504 LEVEL: Error
PID : 2060 TID : 3320 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1078 APPID: GA17FA4B.L504.12B6C4195807
FUNCTION: DB2 UDB, base sys utilities, sqleagnt_sigsegvh, probe:10
MESSAGE : Error in agent servicing application with APPLICATION NAME:
DATA #1 : Hexdump, 7 bytes
0x0000000756B2DA12 : 5461 782E 6578 65 Tax.exe

2010-02-15-09.59.30.069000+180 I10900771F420 LEVEL: Severe
PID : 2060 TID : 3320 PROC : db2syscs.exe
INSTANCE: DB2 NODE : 000 DB : MM17
APPHDL : 0-1078 APPID: GA17FA4B.L504.12B6C4195807
FUNCTION: DB2 UDB, DRDA Application Server, sqljsSignalHandler, probe:10
MESSAGE : DIA0505I Execution of a component signal handling function has begun.

<----------->
дальше куча сообщений типа DUMP FILE
...
Рейтинг: 0 / 0
OS ERROR 121: Semaphore timeout period has expired в db2diag.log
    #36474207
sokolenotchek,


Вопросы:
1. Какие события на время падения есть в Windows Event Log (System, Application)?
2. База сразу создавалась в 64-бит режиме, или ее туда мигрировали?
3. После установки последнего фикспака были выполнены все действия по апгрейду базы(db2updv8, ребинд пакетов) ?
4. Есть ли в базе "нестандартные" процедуры и функции? В первую очередь внешние, откомпилированные в режиме 32-бит адресации. Пользуется ли приложение (напрямую или опосредованно) этими процедурами и функциями ?
5. Само приложение насколько я понимаю работает через клиента. Фикспак клиента совпадает с фикспаком сервера?


Предложения:
Попробовать поставить клиента версии 9.1 с актуальным фикспаком. И приложение запустить через этого клиента.
Попробовать запустить приложение на той же системе, где и сервер DB2, если это возможно.
...
Рейтинг: 0 / 0
OS ERROR 121: Semaphore timeout period has expired в db2diag.log
    #36474632
volganik
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
На данный момент есть предположение, что падение было из-за того, что используемый народом драйвер db2java был устаревший.
На промышленной базе была как-то одно время ситуация, когда форс Jboss-oвских процессов валил базу. И эта ситуация ушла именно после обновления драйверов жава.
Вобщем, сейчас драйвера обновили у народа и посмотрим, поможет или нет.
...
Рейтинг: 0 / 0
OS ERROR 121: Semaphore timeout period has expired в db2diag.log
    #36474877
volganik,

Понятно. Может быть и такое.

В кусочке диаглога увидел только приложение с именем Tax.exe, и то что агент этого приложения получил Segmentation Fault (SIGSEGV) sqleagnt_sigsegvh.
Может конечно этот процесс был "последней каплей", но желательно проверить версию и фикс клиента, через которого работает это приложение. IP-адрес в диаглоге определить можно.
...
Рейтинг: 0 / 0
Период между сообщениями больше года.
OS ERROR 121: Semaphore timeout period has expired в db2diag.log
    #37693989
Сессия клиента DB2 к серверу рвется через 45 мин (по умолчанию, если клиент не активен).
Проблему может решить следующее.
Создайте параметр KeepALiveTime dword 300000 в ветке реестра
HKey_Local_Machine\System\CurrentControlSet\Service\Tcpip\Parameters

У меня проблема ушла.
...
Рейтинг: 0 / 0
10 сообщений из 10, страница 1 из 1
Форумы / IBM DB2, WebSphere, IMS, U2 [игнор отключен] [закрыт для гостей] / OS ERROR 121: Semaphore timeout period has expired в db2diag.log
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]