|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
Здравствуйте, Уважаемые Время от времени сервер Firebird SC 2.5.1.26351 как бы "зависает". Выполнение запросов отстанавливается, попытки соединения зависают. При этом одно ядро процессора загружается полностью под 100% в диспетчере задач, остальные почти ноль. Через некоторое время, в среднем 5-6 минут, сервер "отвисает". Начинают работать все ядра, коннект устанавливается. В perfmon'е при "зависании" затыков не видно... Само зависание происходит 2-3 раза в день. Время разное, не похоже что из-за нагрузки. В firebird.log ничего подозрительного. Только ошибки "INET/inet_error: read errno = 10054", которые выскакивают регулярно и не зависят от зависаний. Подскажите плиз, что сделать, чтобы выявить и решить проблему? Процессоры Intel Xeon E5620 4 шт x 4 ядра. Памяти 48 Гб. Размер базы 3.5 Гб, пользователей 300-400. Если нужна доп. информация, готов предоставить. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2012, 09:55 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
В первую очередь смотреть статистику хидера базы, чтобы контролировать счетчики транзакций: NextTransaction,Oldest Active/Oldest Interesting/OldestSnapshot, а также знать величину SweepInterval оттуда же. Есть подозрение, что база постоянно уходит в sweep. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2012, 10:34 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
Но проще взять Process Explorer, подложить Firebird pdb-файлы и снять стэк с именами вызываемых процедур. Там будет видно что именно так усиленно работает. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2012, 10:45 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
Статистику базы посмотреть бы... на счетчики транзакций и на sweep-интервал. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2012, 10:47 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
Уборка выключена (SweepInterval =0). Сборка мусора делается по необходимости в течении дня. Каждую ночь бэкап и рестор производятся. Разница NextTransaction-OldestActive < 10 000. Слежу постоянно. Статистику могу выложить, если после описанного здесь она нужна. Тогда вопрос в какой/какие моменты ее снимать? Снимать только заголовок? ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2012, 11:41 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
Dimitry Sibiryakov, ProcessExplorer от SysInternals? ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2012, 11:43 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
Atanas - Вам сюда http://ibase.ru/techsupp.htm ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2012, 12:45 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
Alexey Kovyazin, это я так безнадежен или работа у вас такая? А по теме, со ссылкой знаком. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2012, 13:24 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
AtanasСборка мусора делается по необходимости в течении дня. Бред. AtanasКаждую ночь бэкап и рестор производятся. Онанизм. AtanasРазница NextTransaction-OldestActive < 10 000. Разработчикам приложения ухи пооткручивать, но это пох: важен разрыв OIT-OAT. AtanasProcessExplorer от SysInternals? Другого я не знаю. А ты?.. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2012, 13:24 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
AtanasРазница NextTransaction-OldestActive < 10 000. хреново. AtanasТогда вопрос в какой/какие моменты ее снимать? http://www.ibase.ru/devinfo/getstat.htm http://www.ibase.ru/devinfo/summary.htm ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2012, 13:24 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
Dimitry SibiryakovAtanasСборка мусора делается по необходимости в течении дня. Бред. AtanasКаждую ночь бэкап и рестор производятся. Онанизм. AtanasРазница NextTransaction-OldestActive < 10 000. Разработчикам приложения ухи пооткручивать, но это пох: важен разрыв OIT-OAT. AtanasProcessExplorer от SysInternals? Другого я не знаю. А ты?.. OIT-OAT =1 почти всегда. Иногда 1-2 раза в день и бывает разница больше, тогда запускаем сборку мусора. Про ProcessExplorer не знал, что его можно для debug'а использовать, в статях фигурировал DrWatson. Скачал его и pdb сборку Firebird тоже. Ночью попробую запустить вариант FB c pdb. На счет разработчиков, возможно. Не все реализовано через короткие write транзакции. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2012, 14:00 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
AtanasНочью попробую запустить вариант FB c pdb. PDB это простые файлы с данными, они в запуске не участвуют насколько мне известно. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2012, 14:06 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
kdv, Спасибо, прочитал. Завтра буду собирать. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.08.2012, 14:23 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
Atanas, Начало работы пользователей 8:30 Статистика: 10:00 Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24.
11:00 Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24.
12:00 Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24.
13:00 Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24.
... |
|||
:
Нравится:
Не нравится:
|
|||
09.08.2012, 11:24 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
3000 страниц кеша для SC - это много, тем более, что страница 16К. И почему в 13 часов кеш уже 4000 страниц ? PS Надеюсь, это 64-битная сборка ? ... |
|||
:
Нравится:
Не нравится:
|
|||
09.08.2012, 11:36 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
Atanas, Next - OAT стабильно на уровне 6-7 тысяч. OAT всё время около OIT - это означает что постоянно есть долгоиграющие тр-ции. Мониторинг\трейс в руки и пинать прикладных программистов. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.08.2012, 11:38 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
hvlad, Да, сборка 64-битная. 3000 плохо в смысле тормозов? Память то позволяет. 4000 стало, т.к. добавил в обед. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.08.2012, 11:39 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
Atanashvlad, Да, сборка 64-битная. 3000 плохо в смысле тормозов? Память то позволяет. 4000 стало, т.к. добавил в обед.И что - лучше стало ? Я сильно в этом сомневаюсь. Криминала в большом кеше нет, но и толку от него тоже не будет, ибо вся БД (3.5Г) помещается в память (48Г) многократно. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.08.2012, 11:42 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
hvladAtanashvlad, Да, сборка 64-битная. 3000 плохо в смысле тормозов? Память то позволяет. 4000 стало, т.к. добавил в обед.И что - лучше стало ? Я сильно в этом сомневаюсь. Криминала в большом кеше нет, но и толку от него тоже не будет, ибо вся БД (3.5Г) помещается в память (48Г) многократно. Вообще до вчерашнего дня работали с кэшем 4000 страниц, вчера уменьшил до 3000 (думал может на зависания повлияет в лучшую сторону). По субъективным оценкам пользователей вчера база работала медленней. Сегодня вернул как было. На счет толка не совсем понял. Кэш то в CS, SC раздельный, соответственно в нем будут лежать те страницы БД, которые конкретный пользователь (коннект) использует. Было бы классно конечно иметь общий кэш (SS не в счет, одно ядро всех пользователей не потянет), но на сколько я знаю только в 3-й версии это планируется? ... |
|||
:
Нравится:
Не нравится:
|
|||
09.08.2012, 11:57 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
hvlad вся БД (3.5Г) помещается в память (48Г) многократно Не понял арифметики может всё таки 48M или я что-то упустил? ... |
|||
:
Нравится:
Не нравится:
|
|||
09.08.2012, 12:04 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
я считаю, что на Суперклассик можно переходить только с Классика. В том смысле, что сразу прыгать на суперклассик не надо. По процессам в Классике можно понять, кто сколько жрет, и т.д. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.08.2012, 12:23 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
AtanasНа счет толка не совсем понял. Кэш то в CS, SC раздельный, соответственно в нем будут лежать те страницы БД, которые конкретный пользователь (коннект) использует. Кеши в коннектах раздельные, но БД - общая. Изменённые коннектом A страницы как попадут в кеши других коннектов ? Правильно - через диск. AtanasБыло бы классно конечно иметь общий кэшНу так общий кеш есть - это кеш файловой системы, просто он чуть дальше от "тела" лежит ... |
|||
:
Нравится:
Не нравится:
|
|||
09.08.2012, 12:29 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
Симонов Денисhvlad вся БД (3.5Г) помещается в память (48Г) многократно Не понял арифметики может всё таки 48M или я что-то упустил?Упустил. Поднимай :) ... |
|||
:
Нравится:
Не нравится:
|
|||
09.08.2012, 12:29 |
|
"Зависание" Firebird
|
|||
---|---|---|---|
#18+
hvladAtanas, Next - OAT стабильно на уровне 6-7 тысяч. OAT всё время около OIT - это означает что постоянно есть долгоиграющие тр-ции. Мониторинг\трейс в руки и пинать прикладных программистов. Займусь теперь трейсом... ... |
|||
:
Нравится:
Не нравится:
|
|||
09.08.2012, 15:20 |
|
|
start [/forum/topic.php?fid=40&msg=37908266&tid=1562093]: |
0ms |
get settings: |
10ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
39ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
56ms |
get tp. blocked users: |
1ms |
others: | 263ms |
total: | 402ms |
0 / 0 |