|
Memory Leak?
|
|||
---|---|---|---|
#18+
Всем доброго дня! Прошу помощи в идентификации проблемы. Dev-сервер Wildfly 11, деплоятся несколько инстансов одного EAR-приложения. Редеплои случаются часто только для сборки из ветки master, сновной ветки разработки. Параметры памяти: Код: sql 1.
Хипдамп имеется, загрузил в MAT и ничего не понимаю... В отчете Dominator tree 3 основных строчки: Код: plaintext 1. 2. 3. 4. 5. 6.
Код: plaintext 1. 2. 3. 4. 5. 6.
... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 13:06 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
С группировкой по классам ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 13:20 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
WGA...Редеплои случаются часто... AFAIK N1 полно багов с редеплоем, из-за которых память не чистится. Но AFAIK тогда обычно утекает Perm Gen, а не Heap AFAIK N2 Ты смотрешь root объект который имеет ссылку верхнего уровня на не освобожденные объекты. Возможно из-за редиплоя потоки корректно не останавливаются, т.е. см. п. 1. Ну и смотреть, где и как порождаются потоки и как останавливаются ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 13:26 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
Leonid KudryavtsevWGA...Редеплои случаются часто... AFAIK N1 полно багов с редеплоем, из-за которых память не чистится. Но AFAIK тогда обычно утекает Perm Gen, а не HeapДа, утечки PermGen - штука известная. Сам удивлен. В Java 8 не PermGen, а MetaSpace, но вряд ли это имеет отношение к сути проблемы. Интересное наблюдение. Просматривая отчет Leak Suspects, обнаружил такую проблему. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9.
Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9.
... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 14:06 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
Осталось посмотреть кто держит этот массив Код: plaintext
... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 14:11 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
ivanraОсталось посмотреть кто держит этот массив Код: plaintext
Код: plaintext 1. 2. 3. 4. 5.
Понять бы, что это за объекты. Вот что выводит outgoing references для ArrayList Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11.
... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 14:22 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
Очень похоже на сериализованные объекты доменных классов. И похоже, что они остаются в памяти только при редеплое, иначе бы прод бы падал с завидной регулярностью, чего нет в действительности. И у нас не используется кэш 2-го уровня. Откуда же эта зараза берется?.. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 14:37 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
WGA, вы можете по отчоту где лежат 1,170,884,208 объектов кликнуть мышкой и посмотреть какой бизнесовый экзепляр там лежит? ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 14:41 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
maytonWGA, вы можете по отчоту где лежат 1,170,884,208 объектов кликнуть мышкой и посмотреть какой бизнесовый экзепляр там лежит?Могу и уже сделал. Только не все древо развернул. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33.
... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 14:49 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
WGA, авторТак понимаю, <Java Local> - это thread local треда "default task-4 Thread". Нет, эта таблица хранится в переменной threadLocals, можно посмотреть в jdk. Советую для начала понять, что это за поток. Вызвать для него контекстное меню Java Basics - Thread Details, там будет стек, по которому уже можно догадаться, чем поток занимается ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 14:49 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
ivanraWGA, авторТак понимаю, <Java Local> - это thread local треда "default task-4 Thread". Нет, эта таблица хранится в переменной threadLocals, можно посмотреть в jdk. Если недостаточно понятно - наименования полей всегда видно, именно такие же, как в исходном коде jdk. Если же мы видим <Java Local> - то это переменная, объявленная в методе, а не поле. Этот метод почему-то никак не может закончиться и освободить переменную. Поэтому смотрим в стек и догадываемся, что метод делает ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 14:58 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
Мне кажется этот зубчатый (jagged) массив порождает не код программиста а какой-то фреймворк. Что за фреймворки у вас используются? ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 15:00 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
ivanraWGA, авторТак понимаю, <Java Local> - это thread local треда "default task-4 Thread". Нет, эта таблица хранится в переменной threadLocals, можно посмотреть в jdk. Советую для начала понять, что это за поток. Вызвать для него контекстное меню Java Basics - Thread Details, там будет стек, по которому уже можно догадаться, чем поток занимаетсяДа, действительно, threadLocals - это отдельное поле. Вот стектрейс треда: Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56.
Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16.
4. Java Local: All local variables (parameters, objects or methods in thread stacks)Это просто локальные переменные. Все интереснее и интереснее... ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 15:02 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
maytonМне кажется этот зубчатый (jagged) массив порождает не код программиста а какой-то фреймворк. Что за фреймворки у вас используются?JEE7, реализация - Wildfly 11. Используемые технологии из спецификации: 1. JPA - под капотом Hibernate 5.1.10.Final. 2. JMS - ActiveMQ. 3. JAX RS - ReastEasy Но по всем видать, дело в JPA. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 15:06 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
Код: java 1.
Интересно. Строки сериализованы в байты для экономии. В ASCIIZ. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 15:12 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
WGA, Вот, а теперь смотрим исходники своих методов, которые попали в этот стек, начиная с авторru.septagon.recs.rs.view.CompanyFullView$InnerCashRegisterView.of Судя по всему, там мега запросы к базе. Возможно, во время выполнения произошел редеплой. Как там работает в таких случаях хибернейт не знаю, но к запросам лучше приглядеться ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 15:12 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
EhCache сбоку где-то прикручен? По eviction-policy еще не успел кеши зачистить и засрал весь хип. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 15:17 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
у нас дамп памяти вообще был замусорен byte[] массивами от Java JDBC был. Долго и нудно техподдерка Oracle предлагала JDBC проапгрейдить, потом выяснилось, что косяк в нашем коде. Не всегда statement.close вызывали, вот JDBC буфера в памяти и оставались. Самое веселое, что просмоторшики дампов данную память относили к категории "может быть очищена", в результате по версии просмоторшиков дампов вообще был бред 2 Gb heap, из них 1.8 Gb "может быть очищена", но упали с out of memory. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 15:20 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
Leonid Kudryavtsev, да, тут скорее всего ошибка в бизнес коде. Судя по названию метода CompanyFullView можно предположить, что происходил обход дерева подразделений, и что-то пошло не так. Например, цикл. Или проблема n+1 ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 15:26 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
WGA|- <Java Local> org.postgresql.core.v3.QueryExecutorImpl @ 0x6e27c97b8 | 200 | 1,154,864 |- contextClassLoader org.jboss.modules.ModuleClassLoader @ 0x6e56718d8 | 88 | 141,432 Из-за редеплоя "просрали" classloader, из-за просранного класслоадера не смогли почистить не закрытые сессии/статменты? как предположение ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 15:27 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
ivanraLeonid Kudryavtsev, да, тут скорее всего ошибка в бизнес коде. Судя по названию метода CompanyFullView можно предположить, что происходил обход дерева подразделений, и что-то пошло не так. Например, цикл. Или проблема n+1 Leonid Kudryavtsev|- contextClassLoader org.jboss.modules.ModuleClassLoader @ 0x6e56718d8 | 88 | 141,432 Если 88 это кол-во копий classLoader'а, то IMHO налицо классический bug с редиплоем Как-то класлоадеров многовато, на мой взгляд. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 15:29 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
+ где-то в коде не закрываются сессии/стайтменты одно наслоилось на другое, получилось 2 Gb мусора. Если бы открытых "жрущих" сессии/стайтментов не было бы, то рано или поздно уплали бы по классической out of perm gen (или метаспейс). А так, JDBC heap засисрает быстрее, чем классы perm gen IMHO ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 15:33 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
Leonid Kudryavtsev, кеш это обычно различные варианты HashMap-а, а тут ArrayList. Целый гиг данных, прочитанный из базы каким-то одним методом. Не так давно мы фильмы такого объема смотрели, для БД это многовато ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 15:42 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
ivanraкеш это обычно различные варианты HashMap-а, а тут ArrayList. Целый гиг данных, прочитанный из базы каким-то одним методом. Не так давно мы фильмы такого объема смотрели, для БД это многовато Не правда ваша. В наше время программистам 2 Гига засрать - как 2 пальца обосновать ))) Банальные буффера для обмена по сети, для Oracle JDBC thin драйвера по 32-64 MB - запросто! Даже для простейшего "select dummy from dual" - дабы не жалко (при нормальной работе они реиспользуются и очищаются). Здесь же видим 200 НЕ закрытых Statement'ов в 88 не до убитых копиях приложений (88 штук класслоадеров). ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 15:50 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
mayton Код: java 1.
Интересно. Строки сериализованы в байты для экономии. В ASCIIZ.Это дата/время создания или обновления, есть в каждой сущности. И поля соответствующие типа LocalDateTime, а не строка. maytonEhCache сбоку где-то прикручен? По eviction-policy еще не успел кеши зачистить и засрал весь хип.Нет, кэш второго уровня не подключен. Не дошло до этого. Leonid Kudryavtsevу нас дамп памяти вообще был замусорен byte[] массивами от Java JDBC был. Долго и нудно техподдерка Oracle предлагала JDBC проапгрейдить, потом выяснилось, что косяк в нашем коде. Не всегда statement.close вызывали, вот JDBC буфера в памяти и оставались. Самое веселое, что просмоторшики дампов данную память относили к категории "может быть очищена", в результате по версии просмоторшиков дампов вообще был бред 2 Gb heap, из них 1.8 Gb "может быть очищена", но упали с out of memory.Невысвобождение ресурсов - не наш случай. Почти везде container-managed transaction managment, руками ничего не высвбождается. Специально проверил все бины с ручным управлением - там не используется JPA. А где JDBC просмотрел - все закрывается.ivanraWGA, Вот, а теперь смотрим исходники своих методов, которые попали в этот стек, начиная с авторru.septagon.recs.rs.view.CompanyFullView$InnerCashRegisterView.of Судя по всему, там мега запросы к базе. Возможно, во время выполнения произошел редеплой. Как там работает в таких случаях хибернейт не знаю, но к запросам лучше приглядетьсяДа, очень похоже на мега-граф объектов, тянущихся с главной сущностью Company. А возможно еще и косяки с equals/hashCode имеются. Судя по куче разных объектов типа Currency с одним IDшником (тот самый RUB), возможно equals/hashCode работают некорректно и Hibernate не может понять, что это один и тот же объект и плодит их со страшной силой. Надо порядок в сущностях навести. В общем ушел пытаться воспроизвести проблему в своей песочнице. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 15:56 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
Если 88 это кол-во класслоадеров - то IMHO их как-то многовато. Оставание в памяти класслоадера == "классический баг с редиплоем" IMHO & AFAIK 1) поскольку он классический, читать доки из-за чего такое происходит и как этого избежать (он вроде как-то связан с не очень хорошими практиками в пользовательском коде) 2) возможно менять версию сервера (ставить патчи) или даже сам сервер на другой (как минимум в томкатах с ним боролись из версии к версии) 3) забить нано-болт и вместо редиплоя перегружать сервер ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 15:57 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
А 88 класслоадеров это много? Мне кажется зависит от. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 15:58 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
maytonА 88 класслоадеров это много? Мне кажется зависит от. Мне не очень понятно, что это за цифра 88 ((( если это байт - то тогда мало если кол-во в шутках - то тогда IMHO много ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 16:01 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
Leonid KudryavtsevmaytonА 88 класслоадеров это много? Мне кажется зависит от. Мне не очень понятно, что это за цифра 88 ((( если это байт - то тогда мало если кол-во в шутках - то тогда IMHO много В данном случае 88 - это Shallow Heap - количество байт, которое объект занимает в памяти сам по себе. Сколько там класслоадеров история умалчивает ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 16:04 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
Я думаю что нужно позвать программиста который знает этот бизнес-домен. И показать ему содержание зубчатого массива byte[461][] и спросить что єто за данные? И ответ придет очень быстро. От данных пойдем к коду который их продуцирует. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 16:07 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
maytonЯ думаю что нужно позвать программиста который знает этот бизнес-домен. И показать ему содержание зубчатого массива byte[461][] и спросить что єто за данные? И ответ придет очень быстро. От данных пойдем к коду который их продуцирует.Я знаю бизнес-домен и нашел, какой запрос выполняется, с каким параметром. Но не воспроизводится в "тепличных условиях", т.е. если просто дернуть REST-метод. Возможно, фактора редеплоя не хватает. Меня смущает этот огромный ArrayList, в котором лежат массивы байтов. Учитывая, что в нем лежат не java-объекты, а некое сериализованное представление доменных объектов, начинаю подозревать postgresql драйвер. Только не воспроизводится, зараза (( А можно ли как-нибудь из анализа heap dump определить, в какой точке стектрейса определена локальная переменная? ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 22:09 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
WGAА можно ли как-нибудь из анализа heap dump определить, в какой точке стектрейса определена локальная переменная?В смысле, в каком методе определена. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 22:26 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
WGAWGAА можно ли как-нибудь из анализа heap dump определить, в какой точке стектрейса определена локальная переменная?В смысле, в каком методе определена. Локальные переменные же создаются в стековой памяти, а не в куче. Они GC напрягать вроде как не могут. У тебя поля каких объектов, ссылки на которые так и остаются и могут быть собраны GC. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.09.2019, 22:34 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
Я нашел, где сжирается такое огромное количество памяти, посмотрев на исходники JDBC драйвера Postgresql . Код: java 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31.
Вот только для этой компании нет столько данных. И вообще данных немного. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.09.2019, 09:16 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
WGAWGAА можно ли как-нибудь из анализа heap dump определить, в какой точке стектрейса определена локальная переменная?В смысле, в каком методе определена.Насколько я знаю, переменная непримитивного типа - это ссылка. Сама переменная живет в стеке, а вот данные - в куче. С трудом представляю себе 1 гигабайт в стеке... В общем, источник OOM локализован, вопрос закрыт. Осталось понять, на каких данных все это происходит. Всем спасибо. ... |
|||
:
Нравится:
Не нравится:
|
|||
27.09.2019, 09:42 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
WGA, в этом цикле в исходниках драйвера Код: java 1.
посмотри где endQuery присваивается true и почему этого не происходит. И кроме того, можно посмотреть, что за запрос выполнялся. На потоке вызвать контекстное меню java basics - Thread overview and stacks - и там для каждой строки стека будут доступны локальные переменные. Найди в этом стеке SQL и проверь ... |
|||
:
Нравится:
Не нравится:
|
|||
27.09.2019, 10:20 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
ivanraWGA, в этом цикле в исходниках драйвера Код: java 1.
посмотри где endQuery присваивается true и почему этого не происходит. И кроме того, можно посмотреть, что за запрос выполнялся. На потоке вызвать контекстное меню java basics - Thread overview and stacks - и там для каждой строки стека будут доступны локальные переменные. Найди в этом стеке SQL и проверьПро endQuery верно подмечено, спасибо. Это локальная переменная, переключается в true на определенные коды-команд транспортного протокола. В это switch'е это Код: java 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33.
... |
|||
:
Нравится:
Не нравится:
|
|||
27.09.2019, 11:35 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
Если "....И похоже, что они остаются в памяти только при редеплое, иначе бы прод бы падал с завидной регулярностью, чего нет в действительности... " и "...при редеплое ссылки остаются и держат как heap, так и metaspace,..." правда, то смысла копаться в коде нет. Ну не работает редиплой и не работает. Честно говоря, мне проблема вообще не понятна, вместо редиплоя перегрузить сервер и не парится. Или читать доки по Вашему апп-серверу и патчить или брать нормальный app сервер. сколько программистов нужно. что бы починить редиплой - ни одного, it is a problem of system administrator IMHO & AFAIK p.s. в 10-ой версии точно баги были, гугля тут же нашел WFLY-7037 от 17 года. и в 8-ой версии были WFLY-6173 p.p.s. опен соурс, он и есть опен соурс ))) работа программистов видна: одни программисты баги чинят, другие программисты их обратно вносят ))) ... |
|||
:
Нравится:
Не нравится:
|
|||
27.09.2019, 15:04 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
Leonid KudryavtsevЕсли 88 это кол-во класслоадеров - то IMHO их как-то многовато. Оставание в памяти класслоадера == "классический баг с редиплоем" IMHO & AFAIK 1) поскольку он классический, читать доки из-за чего такое происходит и как этого избежать (он вроде как-то связан с не очень хорошими практиками в пользовательском коде) 2) возможно менять версию сервера (ставить патчи) или даже сам сервер на другой (как минимум в томкатах с ним боролись из версии к версии) 3) забить нано-болт и вместо редиплоя перегружать сервер где то читал что если делать постоянно редеплой, то сервер начинает дозабивать пермген до тех пор пока он не кончится. а потом да он кончается и всё. но вроде пермген убрали в 8+? не? ... |
|||
:
Нравится:
Не нравится:
|
|||
03.10.2019, 17:35 |
|
Memory Leak?
|
|||
---|---|---|---|
#18+
andreykaTLeonid KudryavtsevЕсли 88 это кол-во класслоадеров - то IMHO их как-то многовато. Оставание в памяти класслоадера == "классический баг с редиплоем" IMHO & AFAIK 1) поскольку он классический, читать доки из-за чего такое происходит и как этого избежать (он вроде как-то связан с не очень хорошими практиками в пользовательском коде) 2) возможно менять версию сервера (ставить патчи) или даже сам сервер на другой (как минимум в томкатах с ним боролись из версии к версии) 3) забить нано-болт и вместо редиплоя перегружать сервер где то читал что если делать постоянно редеплой, то сервер начинает дозабивать пермген до тех пор пока он не кончится. а потом да он кончается и всё. но вроде пермген убрали в 8+? не? Дело не в пермгене , если все правильно сделать то не будет никаких ликов ... |
|||
:
Нравится:
Не нравится:
|
|||
03.10.2019, 18:20 |
|
|
start [/forum/topic.php?all=1&fid=59&tid=2121084]: |
0ms |
get settings: |
26ms |
get forum list: |
15ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
115ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
759ms |
get tp. blocked users: |
2ms |
others: | 308ms |
total: | 1247ms |
0 / 0 |