|
|
|
Странно падает JBOSS
|
|||
|---|---|---|---|
|
#18+
Привет, подскажите по такому вопросу. В наследство достался проект под JBOSS. И происходит такая ерунда: примерно каждые три недели (не ровно) после 00:00 по МСК, приложение перестает работать. Просто отдается белая страница. Процесс java висит. В логах тишина. Помогает ожить проект: - убить процесс java - удалить папку с jboss - скопировать из другой папки точно такой же jboss (уже настроенный) - запустить его - задеплоить приложение под него В этом случае все начинает прекрасно работать. Не помогает 1.: - убить процесс java - запустить снова jboss Не помогает 2.: - андеплоить приложение - убить процесс java - запустить jboss - задеплоить приложение В последних случаях все равно приложение выдает белую страницу. Т.е. для успеха нужно удалить папку с JBOSS-ом и на его место скопировать точно такой же из дистрибутива. Что может быть? Может быть JBOSS как-то учитывает время создания своих файлов и что-то еще дополнительно перезапускает? Используется jboss-as-7.1.0.Final Заранее спасибо! ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2013, 10:54 |
|
||
|
Странно падает JBOSS
|
|||
|---|---|---|---|
|
#18+
Логи JBoss не пробовали читать? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2013, 11:51 |
|
||
|
Странно падает JBOSS
|
|||
|---|---|---|---|
|
#18+
Blazkowicz, да, пробовал, но до этого видел там абракадабру непонятную. Приложение написано "талантливым" программистом, которого, видимо, не смущало, что в штатном режиме приложение срет в лог ексепшенами, которые, в общем-то, можно было и не писать туда. Но сегодня рыскал там, и увидел, что все началось с этого: 00:04:48,695 ERROR [org.apache.tomcat.util.net.JIoEndpoint] (http--0.0.0.0-80-Acceptor-0) Socket accept failed: java.net.SocketException: Слишком много открытых файлов at java.net.PlainSocketImpl.socketAccept(Native Method) [rt.jar:1.7.0_03] at java.net.AbstractPlainSocketImpl.accept(AbstractPlainSocketImpl.java:398) [rt.jar:1.7.0_03] at java.net.ServerSocket.implAccept(ServerSocket.java:522) [rt.jar:1.7.0_03] at java.net.ServerSocket.accept(ServerSocket.java:490) [rt.jar:1.7.0_03] at org.apache.tomcat.util.net.DefaultServerSocketFactory.acceptSocket(DefaultServerSocketFactory.java:61) [jbossweb-7.0.10.Final.jar:] at org.apache.tomcat.util.net.JIoEndpoint$Acceptor.run(JIoEndpoint.java:321) [jbossweb-7.0.10.Final.jar:] at java.lang.Thread.run(Thread.java:722) [rt.jar:1.7.0_03] Ну и дальше, уже и проблемы с коннектами к базе и т.д. Пока не понял, где и почему заканчивается лимит открытых файлов, буду искать. Но, все-таки, интересно, как влияет удаление и копирование нового jboss-а :) Жаль, не сохранилось старых логов. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2013, 14:04 |
|
||
|
Странно падает JBOSS
|
|||
|---|---|---|---|
|
#18+
steevy, Что-то не догнал. Поде "вендой" это всё дело? Или у вас линух по-русски уже ругается? У линуха это традиционная болячка. Лечиться настройками. Возможно там много временных файлов создано, и они тоже влияют на утечку хэндлеров... Попробуйте вместе с редеплоем все его temp-ы чистить. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2013, 14:21 |
|
||
|
Странно падает JBOSS
|
|||
|---|---|---|---|
|
#18+
Было похожее. У нас jboss, а на фронте tomcat. Причина на самом деле была в пуле БД: когда коннекты заканчивались, запросы начинали уходить в долгое ожидание, фронт начинал долбиться об сервер приложений и открывать новые сокеты, пока она не заканчивались с именно такими сообщениями в логе. Всё решилось подбором размера пула БД + тестирование соединения с базой раз в минуту ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2013, 14:35 |
|
||
|
Странно падает JBOSS
|
|||
|---|---|---|---|
|
#18+
хотя, взаимодействие с фронтом тут наверно не причина, раз не помогает перезапуск, только копирование дистрибутива. Думаю, ответ надо искать в рабочих папках, например, standalone/tmp, standalone/data ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2013, 14:40 |
|
||
|
Странно падает JBOSS
|
|||
|---|---|---|---|
|
#18+
Blazkowicz, На сервере CentOS, причем, видимо, из коробки. Потому что ulimit -n показывает 1024. Я не спец в серверах, но мне кажется, это мало для "боевого" сервера. Но зато знает русский :) ivanra, да, это вариант, из-за базы могут быть проблемы, потому что всего к базе открыто 10 коннектов, которых часто может не хватать. Т.е. база начинает тупить, а ДЖБОС начинает всех ожидающих ставить в очередь. (какая она у него пока не знаю)... В итоге все упирается в этот маленький лимит... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2013, 15:19 |
|
||
|
Странно падает JBOSS
|
|||
|---|---|---|---|
|
#18+
Для боевого сервера пул на 10 коннектов - маловато. Поставьте хотя бы 50 и через месяц напишите. В jmx консоли можно посмотреть фактически достигнутый максимум, и если после определенного периода эксплуатации захотите уменьшить пул - ориентируйтесь на этот максимум ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2013, 15:26 |
|
||
|
Странно падает JBOSS
|
|||
|---|---|---|---|
|
#18+
steevy, Кроме ulimit там могут быть и другие настройки, в том числе разные для разных версий Linux. Попросите вашего админа провести ревизию этого вопроса. А что у вас происходит в районе 00:00 MCK? Пиковая активность, или наоборот простой? Может база рубает соединения в пуле? И это в какой-то момент приводит к скачку открытых хэндлеров. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2013, 15:34 |
|
||
|
Странно падает JBOSS
|
|||
|---|---|---|---|
|
#18+
Blazkowicz, Приложение - система сбора статистики, и я подозреваю, что после 00 МСК куча клиентов лезет посмотреть свою статистику "за вчера". А статистика считается тяжело. Но логов нет, поэтому только догадки. Других пока идей нет. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2013, 16:06 |
|
||
|
Странно падает JBOSS
|
|||
|---|---|---|---|
|
#18+
- Дык, логи надо смотреть, чтобы не гадать. - Статистику стоит хранить и обновлять во время обновления данными, а не пересчитывать полностью. Тогда она перестанет быть тяжелой. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2013, 16:09 |
|
||
|
Странно падает JBOSS
|
|||
|---|---|---|---|
|
#18+
Сравните какой-нибудь тулзой количество файлов в чистом JBoss и проработавшем уже пару недель. Я так понимаю ulimit влияет как на файлы так и на сокеты. Вероятно JBoss где-то плодит ещё и большое количество файлов. Возможно сессии персистит? Тоже стоит разобраться. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2013, 16:12 |
|
||
|
Странно падает JBOSS
|
|||
|---|---|---|---|
|
#18+
steevyНе помогает 1.: - убить процесс java - запустить снова jboss А если после убийства почистить временные все файлы? Возможно, что в темпах лежит всякая гадость, которая при рестарте снова забирает все ресурсы. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2013, 16:33 |
|
||
|
Странно падает JBOSS
|
|||
|---|---|---|---|
|
#18+
Alexey Tomin, Я проверил все tmp папки "умерших" ранее jboss-ов. Там есть файлы, но их не так много, т.е. какого-то большого мусора не заметил. Но все равно, если еще раз упадет (тьфу-тьфу), попробую все почистить. В итоге пока увеличил ulimit до 16к, завтра утром увеличу размер пула до 50, надеюсь, праздники переживет :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2013, 19:27 |
|
||
|
Странно падает JBOSS
|
|||
|---|---|---|---|
|
#18+
steevyВ итоге пока увеличил ulimit до 16к, завтра утром увеличу размер пула до 50, надеюсь, праздники переживет :) Не надейтесь. 1го января после 00:00 МСК юзеры ломануться смотреть всю статистику за год, которая считается ещё дольше чем статистика за неделю. Тут то серверу и DDoS. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2013, 19:30 |
|
||
|
Странно падает JBOSS
|
|||
|---|---|---|---|
|
#18+
steevyЯ проверил все tmp папки "умерших" ранее jboss-ов. Там есть файлы, но их не так много, т.е. какого-то большого мусора не заметил. Но все равно, если еще раз упадет (тьфу-тьфу), попробую все почистить. Я не сталкивался с JBoss с 4й версии. Но там в server/{configuration}/tmp разворачивалось всё что только можно включая и само приложение. Файлов должно быть как грязи. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.12.2013, 19:36 |
|
||
|
|

start [/forum/topic.php?fid=59&msg=38513144&tid=2127899]: |
0ms |
get settings: |
9ms |
get forum list: |
15ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
182ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
62ms |
get tp. blocked users: |
1ms |
| others: | 214ms |
| total: | 500ms |

| 0 / 0 |
