|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Фб 3.0.4 Суперсервер База большая, бэкап рестор в вс выполнен. Размер файла 170 гб На сервере 512 гб озу, 56 физических ядер Кэш настроен на 20 000 000 страниц по 8192 байт Одновременных подключений до 250 Все работало ок до вчерашнего дня. С сегодняшнено дня фб зависает, все процессы фб показывают 100% загрузку процессора. Подскажите, что это может быть? Сейчас попытаемся выполнить gfix на проверку файла. В темп папке все файлы сортировки имеют нулевую длину. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 12:04 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
sysdba22, FileSystemCacheThreshold менял? а TempCacheLimit? sysdba22С сегодняшнено дня фб зависает, все процессы фб показывают 100% загрузку процессора. и сколько таких процессов, откуда они? У тебя же SS ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 12:10 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
sysdba22Фб 3.0.4 Суперсервер ... С сегодняшнено дня фб зависает, все процессы фб показывают 100% загрузку процессора.Какие-таие процессы ? sysdba22Подскажите, что это может быть?Снять трассы стеков всех потоков - можете ? ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 12:25 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
hvlad, сорри, ошибся. там супер сервер, один процесс забивает 56 ядер под 100% параметры сейчас сюда скинут. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 12:39 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
hvladsysdba22Фб 3.0.4 Суперсервер ... С сегодняшнено дня фб зависает, все процессы фб показывают 100% загрузку процессора.Какие-таие процессы ? Один процесс FBServer... Суперсервер установлен sysdba22Подскажите, что это может быть?Снять трассы стеков всех потоков - можете ? Если подскажите как, попробуем.. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 12:39 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
FileSystemCacheThreshold = 21000000 ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 12:41 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
TempCacheLimit = 64G ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 12:42 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Mike_gs94FileSystemCacheThreshold = 21000000 А зачем? Написано же: File system caching is used if database cache size in pages (configured explicitly in database header or via DefaultDbCachePages setting) is less than FileSystemCacheThreshold value. To use file system cache always set FileSystemCacheThreshold to a large value. To bypass file system cache for all databases set FileSystemCacheThreshold to zero. Вам скорее всего лучше задать значение близкое к нулю. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 12:50 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
проблема в том, что с такими цифрами сервер отлично работал с марта прошлого года. без перезагрузок и даже без бэкап/рестора. зависание началось РЕЗКО с сегодняшнего дня. пока не можем сделать gfix. через пару часов появится возможность ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 12:53 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
31.01.2019 12:53, sysdba22 пишет: > зависание началось РЕЗКО с сегодняшнего дня. ОСь какая? Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 12:54 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
gstat.exe -h делали? ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 12:56 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Мимопроходящий, Windows Server 2016 ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 12:57 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
идея настройки сервера простая: 1) кэш фб, чтобы влезла ВСЯ база 2) 64 гб под буффер сортировки фб 3) ВКЛЮЧЕННЫЙ кэш ОС, чтобы сортировки, которые не влезли в буфер фб, кэшировались на уровне ОС. Благо для этого осиается еще 256 Гб ОЗУ. Еще раз повторюсь, до вчерашнего дня такая конфигурация отработала почти год. И работала шустро. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 12:59 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
31.01.2019 12:57, Mike_gs94 пишет: > Windows Server 2016 а почему-то так и думал... обновления не прилетали надысь? Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 13:00 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Database header page information: Flags 0 Generation 916594 System Change Number 15 Page size 8192 ODS version 12.0 Oldest transaction 128076 Oldest active 911455 Oldest snapshot 911455 Next transaction 927601 Sequence number 0 Next attachment ID 5898 Implementation HW=AMD/Intel/x64 little-endian OS=Windows CC=MSVC Shadow count 0 Page buffers 20000000 Next header page 0 Database dialect 3 Creation date Jan 26, 2019 20:55:31 Attributes force write Variable header data: Database backup GUID: {B8ED8F85-F7A1-4BA4-6788-B7924824A6E9} Sweep interval: 0 *END* Gstat completion time Thu Jan 31 13:00:28 2019 ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 13:01 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
sysdba223) ВКЛЮЧЕННЫЙ кэш ОС, чтобы сортировки, которые не влезли в буфер фб, кэшировались на уровне ОС FileSystemCacheThreshold влияет только на файл базы, временные файлы сортировки кешируются всегда ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 13:05 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Mike_gs94Если подскажите как, попробуем.. В этом мире ещё остались сисадмины, не умеющие пользоваться Process Explorer-ом?.. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 13:07 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
dimitr, будем знать. полезно было бы такую инфу закинуть в дефолтный firebird.conf. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 13:13 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
dimitrsysdba223) ВКЛЮЧЕННЫЙ кэш ОС, чтобы сортировки, которые не влезли в буфер фб, кэшировались на уровне ОС FileSystemCacheThreshold влияет только на файл базы, временные файлы сортировки кешируются всегда тогда да, можно ставить 0. чтение все равно всегда из кэша бд будет, а на запись там forced writes on. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 13:20 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
sysdba22тогда да, можно ставить 0. чтение все равно всегда из кэша бд будет может негативно повлиять на разогрев кеша БД ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 13:22 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Mike_gs94Page buffers 20000000 вот зачем это писать на уровне файла БД, когда прекрасно настраивается в databases.conf? ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 13:27 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Симонов Денис, так исторически сложилось с конца девяностых )) тогда не было еще databases.conf ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 13:33 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
sysdba22, в конце 90-х и 3.0 не было ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 13:34 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Mike_gs94hvladСнять трассы стеков всех потоков - можете ? Если подскажите как, попробуем..Установить WinDBG, если его ещё нет Скачать ту же самую сборку FB с debug info, .pdb файлы из неё положить рядом с соотв. exe, или можно кучкой в отдельный каталог (минимум: firebird.pdb, fbclient.pdb, engine12.pdb). Запустить WinDBG, приаттачиться к процессу firebird.exe, указать местоположение .pdb файлов (если они отдельно от .exe), в командном окне выполнить ~*kpn, получивщийся текст сохранить в файл и выложить куда-нибудь (кроме яндексов\мэйлру\подобного) ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 14:02 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Все прошло само собой. Т.е. пол дня через 10 минут после подлкючения где-то 50-60 пользоватлей (обычно работает около 200) сервер загружался до 100% и работать практически было не возможно. Причем загрузку показывал FBServer. Но в один прекрасный момент вдруг все прошло. Сейчас подключено 160 пользователей все работает нормально. Может кто-то сталкивался с такой ситуацией... Страшно, что может повториться ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 15:42 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Mike_gs94, сборка мусора? ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 15:47 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
31.01.2019 15:47, Симонов Денис пишет: > сборка мусора? на всех 56 ядрах? не верю. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 15:49 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
То же думали про сборку мусора, но на всех ядрах... ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 16:35 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Mike_gs94, ну может и бага где-то в сервере, но теперь уже ловить поздно. Ждите следующего раза ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 16:37 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
админа ищите, MCSE. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 16:55 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Итак, ситуация безрадостная. Лучше бы была явная ошибка, по крайней мере ясно было бы что исправлять. Диспозиция: 1. конфигурация техники и размер БД см. выше. 2. всё работало как часы с марта прошлого года. сервер был или 3.0.2 или 3.0.3 сейчас трудно установить. Что делали в последнее время: 1. в пятницу создали тригер на disconnect. триггер пишет в одну табличку и как потом выяснилось, при записи кидается ошибка нарушения первичного ключа. но она (ошибка) была не заметна. 2. в вс сделали бэкап/рестор бд. занимает весь процесс в районе 8 часов. 3. в среду могли обновить большое количество записей. точное количество трудно установить. возможно, до миллиона. До утра четверга система работала без нареканий. 1. Утром в четверг предприятие стало. База "зависла". На сервере в диспетчере задач процесс fbserver показывал 100% загрузку процессора (там два процессора по 28 ядер каждый, итого 56 ядер). 2. Местный сисадмин подождав некоторое время (20-30 минут) остановил процесс сервера (не срубил жестко, а именно остановил) и перегрузил сервер. По мере подключения пользователей к базе картина повторилась. 3. Опять остановили сервер и обновили до ФБ 3.0.4. Перегрузили. Не помогло. 4. обнаружили что при ресторе бд был выставлен кэш 2 000 000 страниц (16 Гб) вместо 20 000 000 (160 Гб). Остановили сервер и утилитой gfix увеличили кэш. Перезапустили. Не помогло. 5. Запретили пользователям входить в систему. Оставили только 20-30 самых критичных конектов для отгрузки продукции. С огромным трудом и паузами система ворочалась. На сервере по прежнему 100% загрузка. 6. обнаружили что тригер на дисконнект внутри кидает ошибку (см. выше). Удалили триггер и опять аккуратно перезагрузили сервер. Не помогло. 7. Начали искать в логах операционной системы, в логах RAID контроллера. Никакой подозрительной информации не обнаружено. 8. через несколько часов сисема самостоятельно пришла в нормальное состояние. Что это было? Сборка мусора? Но sweep interval в header page установлен в 0. Хотя mon$attachment и содержит информацию о сборщике. Массированные обновления происходили и раньше, но никогда не приводили к таким последствиям. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 18:29 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
31.01.2019 18:29, sysdba22 пишет: > 2. Местный сисадмин подождав некоторое время (20-30 минут) остановил процесс сервера > (не срубил жестко, а именно остановил) как именно останавливал? Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 18:48 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
sysdba22Сборка мусора? Но sweep interval в header page установлен в 0. Парень, я, конечно, понимаю, что вы крутая контора, гедымин, все дела, но теперь реально пришло время чтобы начать-таки изучать азы в области администрирования Firebird, Windows и программирования для них. Sweep interval никак со сборкой мусора не связан. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 18:51 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
1. Заходят в сервисы. Находят сервис Firebird. Вызывают для него команду остановить. 2. Disabling Automatic Sweeping If you set the sweep interval to zero then automatic sweeping will be disabled. This implies that there will be no automatic housekeeping done so your database performance will not suffer as a result of the processing requirements of the automatic sweep. If you disable sweeping you are advised to run a manual sweep at regular intervals when the database is quiet. Alternatively, simply make sure that you take regular backups of the database and as this is something you should be doing anyway, it shouldn't be a problem. я не говорю что знаю всё. я вообще знаю мало. объясните, буду рад узнать новую информацию. заранее спасибо. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 19:07 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
авторСборка мусора? Но sweep interval в header page установлен в 0. Хотя mon$attachment и содержит информацию о сборщике. Если был sweep, то в логе fb должна быть соответствующая информация. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 19:07 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Очень интересно, как вообще удалось загрузить все 56 ядер? :) А при обычной работе сколько ядер задействуется? Нафига их столько? ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 19:14 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
sysdba22я вообще знаю мало. объясните, буду рад узнать новую информацию. Читать букварь вслух и с выражением это к kdv, у меня дикция плохая. http://www.ibase.ru/transactions/ http://www.ibase.ru/performance/ Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 19:15 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
DmSerОчень интересно, как вообще удалось загрузить все 56 ядер? :) Для ответа на этот вопрос нужен админ, способный применить совет Влада или Process Explorer. Но у них такого нет. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 19:18 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
DmSerОчень интересно, как вообще удалось загрузить все 56 ядер? :) обычное количество одновременных пользователей ~250. На пике может и 300 быть. сервер FB SuperServer 3. так вот ядра и грузятся... ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 19:29 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Dimitry Sibiryakov Sweep interval никак со сборкой мусора не связан. несколько противоречит хотя бы этой странице: http://www.ibase.ru/garbage/ авторСамый известный момент сборки мусора – это sweep, автоматический (sweep interval > 0) или ручной (gfix -sweep db.gdb). ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 19:33 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
sysdba22несколько противоречит хотя бы этой странице "Каждый идиот - человек. Стало быть люди - идиоты." Твоя логика. Если sweep попутно собирает мусор, это вовсе не значит, что отключение sweep отключит сборку мусора. Иди уже читай http://www.ibase.ru/articles/ от корки до корки и не позорься. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 19:44 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
почему возникла тема свипа. потому что это был обычный день, с обычной работой пользователей. ничего не предвещало... одна из гипотез была, что при бэкапе/ресторе как-то установили sweep interval больше 0 и запустилась автоматическая сборка. почему ставим sweep 0? Это еще с девяностых тянется, с IB 5.6, с которого мы начинали. предпочитаем контролировать процессы вручную через бэкап/рестор. это вообще привычка выработанная годами. потому что только успешный бэкап/рестор на ранних версиях ib/yaffil/fb давал уверенность, что база целая и в ней не начало чего сыпаться. я вообще был в 600 км от этого предприятия и только с телефонной связью, так что дебагер оперативно запустить не мог, к сожалению. квалификация людей такая, какая она есть. я не думаю, что файреберду в нынешних условиях стоит щеголять требованием обязательного наличия системного программиста с++ высокого уровня в штате предприятия, да еще и с сертификатом MSCE. Как то это будет уж очень невыгодно, относительно конкурентов. знаю ли я что мусор убирается не только при свипе, но и при чтении записи, например? да знаю. но в момент "зависания" в mon$statements не было никаких подозрительных запросов на массовое чтение, которые можно было бы в чем-то подозревать. как, впрочем, и на массовое удаление или обновление. да, был на предприятии массовый update до этого. но такие апдейты там регулярно происходили и раньше, но не приводили к особым проблемам. по крайней мере таких "зависаний" вообще за 12 лет эксплуатации системы не было ни разу. не хочется, чтобы это была какая скрытая ошибка в фб. будем надеяться просто на неудачную сборку мусора. еще раз повторюсь, я был не на месте и не могу за всё ручаться. на будущее будем наблюдать, будем смотреть. огромное спасибо за помощь и советы. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 19:58 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
и остается еще маленькая наводка с тригером на дисконект от бд, в котором кидалась ошибка на вставку записи в таблицу. при его удалении проблема вроде как не решилась, но всё же. не может быть такого, что из-за ошибки в этом триггере дисконнект не происходил а оставался висеть в каком-то промежуточном состоянии? постепенно заматывая нитями ядра? ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 20:08 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
PPS: и остается еще прогнать gfix. вдруг эта вся канитель из-за битой базы. но это как у них получится отключить всех пользователей. на выходных, возможно. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 20:25 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
sysdba22, В 3-ке ошибки в триггере ON DISCONNECT пишутся в firebird.log ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 21:31 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
sysdba22я вообще был в 600 км от этого предприятия и только с телефонной связью, так что дебагер оперативно запустить не мог, к сожалению.Это не повод не учиться самому и не автоматизировать создание дампов\трассы стека. Это не сложно. Если сами не умеете и не хотите уметь - наймите тех, кто умеет, они есть. ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 21:33 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
sysdba22но в момент "зависания" в mon$statements не было никаких подозрительных запросов на массовое чтение 1) как быстро/долго выполнялись запросы к мониторингу в момент подвиса? В секундах. 2) на статистику mon$io_stats / mon$record_stats / mon$table_stats в разрезе времени никто не смотрел? sysdba22да, был на предприятии массовый update до этого не закончился ли он часом роллбеком, в отличие от предыдущих случаев? ... |
|||
:
Нравится:
Не нравится:
|
|||
31.01.2019, 21:52 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
dimitrsysdba22но в момент "зависания" в mon$statements не было никаких подозрительных запросов на массовое чтение 1) как быстро/долго выполнялись запросы к мониторингу в момент подвиса? В секундах. 2) на статистику mon$io_stats / mon$record_stats / mon$table_stats в разрезе времени никто не смотрел? sysdba22да, был на предприятии массовый update до этого не закончился ли он часом роллбеком, в отличие от предыдущих случаев? 1) Запросы к мониторингу выполнялись долго от 1 мин до 5 мин 2) К сожалению нет... 3) Нет UPDATE закончился COMMIT ... |
|||
:
Нравится:
Не нравится:
|
|||
01.02.2019, 06:39 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
sysdba22это вообще привычка выработанная годами."Мир меняется ..." (ц) "Братва и кольцо". Вырабатывая привычки, важно не забывать о своевременном обновлении оных. P.S. Если выделять на "предметные изучения" полчаса рабочего времени, то за двадцать лет ("с девяностых") набежит, примерно, 800 академических часов. Целый университет можно закончить. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.02.2019, 06:59 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
sysdba22... всё работало как часы с марта прошлого года... а все потому что ты усомнился в FB и посмотрел в сторону IB ))) ... |
|||
:
Нравится:
Не нравится:
|
|||
01.02.2019, 08:01 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Дрёму старого пня нарушил раздававшийся в лесу топор дровосека, под корой зашевелились воспоминания и даже, как это ни парадоксально, гипотезы... sysdba22одна из гипотез была, что при бэкапе/ресторе Освежилась статистика индексов и планы некоторых запросов вывернулись наизнанку с целью оптимизации, то есть, ускорения их выполнения. И даже вполне может быть, что эти запросы ускорились. Но потом sysdba22да, был на предприятии массовый update до этого. но такие апдейты там регулярно происходили и раньше, но не приводили к особым проблемам. по крайней мере таких "зависаний" вообще за 12 лет эксплуатации системы не было ни разу. Если апдейт был по индексированным полям, реальное содержимое этих индексов ушло от этой "свежей статистики" в неведомые дали, а статистика осталась. И планы некоторых из некоторых запросов стали из оптимальных неприемлемыми. Давным-давно, когда деревья были молодыми, а пень... мнэээ... дубом, перешёл он с IB4 Classic на IB5 Super. Зачем с 4 на 5 он уже не помнит, а на Super потому что в 5 Classic просто не было. И вскоре попал в обсуждаемую ситуацию. Ядра тогда были у орехов, а у сервера было 4 процессора. Которые дружно упирались в непрогнозируемый момент времени во что-то чрезвычайно с их точки зрения интересное и уходили на 100% в обсуждение между собой этого интересного практически навсегда. Вот так будущий пень и пришёл к Firebird 0.9 с чем-то - в поисках решения проблемы. И поставил, по совету друзей (С), то есть, kdv, опять Classic. Вскоре ситуация с зависом повторилась, но на одном процессоре. Выяснить что это был за запрос и почему он себя так ведёт было уже делом техники. После чего у пня и его отростков начался продолжительный период бурного явного планописательства. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.02.2019, 14:48 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Старый плюшевый мишкаИ планы некоторых из некоторых запросов стали из оптимальных неприемлемыми. Ну, чем хуже план - тем он "ближе к натуралу", скажем так. А при чтении/переборе сервер не только ведь проц грузить должен, а и диск. Понятно, что RAID, SSD, база в памяти и все дела, но прям чтоб на 100% ядро... Где-то какой-то косяк таки есть мне кажется, и надеюсь его поймают, если это так. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.02.2019, 18:20 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
01.02.2019 18:20, YuRock пишет: > Ну, чем хуже план - тем он "ближе к натуралу", скажем так. да щаззз! натуралом иногда спроворней. поелику "неправильные" индексные чтения обчас мешают зело сильно. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
01.02.2019, 18:26 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Мимопроходящийнатуралом иногда спроворнейНу это конечно. Я о случае, когда нужен план с индексом, а срабатывает без него или с неоптимально выбранным. Так или иначе, чтения/запись должны грузить не только проц, а грузится только проц (раз 100%). Другое дело, что, может, ТС лукавит и на самом деле не 100, а 70-90... ... |
|||
:
Нравится:
Не нравится:
|
|||
01.02.2019, 19:01 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
YuRockСтарый плюшевый мишкаИ планы некоторых из некоторых запросов стали из оптимальных неприемлемыми. Ну, чем хуже план - тем он "ближе к натуралу", скажем так. А при чтении/переборе сервер не только ведь проц грузить должен, а и диск. Понятно, что RAID, SSD, база в памяти и все дела, но прям чтоб на 100% ядро... Где-то какой-то косяк таки есть мне кажется, и надеюсь его поймают, если это так. Поставь острый натурный эксперимент. 1. На какой-нить табличке с несчастным мульёном записей сделай поле test int. 2. Проапдейть его, в смысле поле, в 0, целиком, всю таблицу. 3. В паре записей проапдейть на 1. 4. Сделай уникальный индекс (test, id). 5. Поселекть с where test=1. 6. Поселекть с where test+0=1. 7. Поселекть с where test=0. 8. Дальше у тебя будет два варианта: а) Воздать хвалу за оптимизацию оптимизатора, если он в п.7 индекс не подхватит (я не в курсе последних его улучшений). б) В противном случае - ахренеть. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.02.2019, 19:13 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
YuRockМимопроходящийнатуралом иногда спроворнейНу это конечно. Я о случае, когда нужен план с индексом, а срабатывает без него или с неоптимально выбранным. Так или иначе, чтения/запись должны грузить не только проц, а грузится только проц (раз 100%). Другое дело, что, может, ТС лукавит и на самом деле не 100, а 70-90... В случае вывернутого наизнанку относительно оптимального на существующих данных порядка перебора таблиц с использованием неподходящих индексов джойна чуть сложнее палки и верёвки 100 и будет. ... |
|||
:
Нравится:
Не нравится:
|
|||
01.02.2019, 19:16 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
ПВПа) Воздать хвалу за оптимизацию оптимизатора, если он в п.7 индекс не подхватит (я не в курсе последних его улучшений). гистограммы ещё не запилили ... |
|||
:
Нравится:
Не нравится:
|
|||
02.02.2019, 17:14 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Симонов Денис, В четверке вроде еще, еще сильно заране, что-то такое обещали. Однако, руки что ли так и не дошли? Ежели чо, то я не злопыхаю, а чисто информации для. ... |
|||
:
Нравится:
Не нравится:
|
|||
02.02.2019, 20:08 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Проверка gfix показала следующее: Summary of validation errors Number of record level warnings : 8 Number of index page warnings : 1757 Number of pointer page warnings : 623 Number of database page warnings : 5859 Насколько это опасно? Вроде как бы warnings не ошибки ... ... |
|||
:
Нравится:
Не нравится:
|
|||
03.02.2019, 16:20 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Mike_gs94, трудно сказать что тут имелось ввиду но скорее всего это orphan которые действительно не опасны, и вызваны нештатными обрывами подключений. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.02.2019, 16:28 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Mike_gs94Насколько это опасно? Вроде как бы warnings не ошибки ...Не опасно, потому и warnings. Кроме того, часть из них должна была быть исправлена. Если всё равно страшно - бекап\рестор ... |
|||
:
Нравится:
Не нравится:
|
|||
03.02.2019, 16:35 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
gfix с ключем -mend исправит такие страницы? пометит их как свободные? ... |
|||
:
Нравится:
Не нравится:
|
|||
03.02.2019, 22:09 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
sysdba22gfix с ключем -mend исправит такие страницы?Какие-такие страницы ? sysdba22пометит их как свободные?Кого ? Зачем ? Налицо полное непонимание процесса и результатов валидации :( Я даже не знаю как тут объяснить, чтобы роман не писать... PS быстрый поиск не дал мне ни одного источника, который бы говорил про то, что mend исправляет страницы. Помойки я не проверял, есс-но. PPS я могу сказать что значит конкрентное сообщение в логе, но не просите меня вытаскивать инф-цию из вас ... |
|||
:
Нравится:
Не нравится:
|
|||
03.02.2019, 22:33 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
страницы, на которые при проверке gfix выдал предупреждение. выше писалось, что это возможно orphan страницы, возникшие в результате принудительного завершения процесса сервера. вот я и спрашиваю, если это так, то gfix с ключем -mend не должен ли пометить такие страницы как свободные, чтобы при последующих запусках gfix уже никаких предупреждений не выдавалось. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.02.2019, 22:55 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
sysdba22страницы, на которые при проверке gfix выдал предупреждение.С какой стати их помечать, как свободные ??? Хотите кучу данных потерять ? sysdba22выше писалось, что это возможно orphan страницыКем писалось ? У вас в логе про каждую ошибку явно написано - что это такое. sysdba22gfix с ключем -mend не должен ли пометить такие страницы-mend никогда не помечает никакие страницы , никак. Я об этом выше написал. PS orphan'ы автоматически исправляются валидацией, но только если нет никаких других ошибок. Забудьте про mend, он тут вообще не при чём. ... |
|||
:
Нравится:
Не нравится:
|
|||
03.02.2019, 23:54 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
hvladsysdba22страницы, на которые при проверке gfix выдал предупреждение.С какой стати их помечать, как свободные ??? Хотите кучу данных потерять ? ... -mend никогда не помечает никакие страницы , никак. Я об этом выше написал. тогда надо или подробнее разъяснить это на странице официальной документации или вообще оттуда убрать. Потому что сейчас там написано ровно то, что я спросил: авторWhen a database is validated the following checks are made and corrected by default: Orphan pages are returned to free space. This updates the database. Pages that have been misallocated are reported. Corrupt data structures are reported. https://www.firebirdsql.org/pdfmanual/html/gfix-dbverify.html ... |
|||
:
Нравится:
Не нравится:
|
|||
04.02.2019, 11:41 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
И где в процитированном выше слово mend ?? Может надо полностью читать текст ? Recover a Corrupt Database The option required to fix a corrupted database is the gfix -m[end] command. However, it cannot fix all problems and may result in a loss of data. It all depends on the level of corruption detected. The command is: gfix -m[end] database_name This causes the corruptions in data records to be ignored. While this sounds like a good thing, it is not. Subsequent database actions (such as taking a backup) will not include the corrupted records, leading to data loss. ... |
|||
:
Нравится:
Не нравится:
|
|||
04.02.2019, 11:48 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
hvladPS orphan'ы автоматически исправляются валидацией, но только если нет никаких других ошибок.И вот когда я писал здесь об этом первый раз: 1061832 ... |
|||
:
Нравится:
Не нравится:
|
|||
04.02.2019, 15:49 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Спасибо. Будем знать. Получается, что безопаснее всегда если gfix выявил ошибки делать бэкап/рестор, а не gifx -mend, а затем уже бэкап/рестор. ... |
|||
:
Нравится:
Не нравится:
|
|||
04.02.2019, 18:38 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
sysdba22Спасибо. Будем знать. Получается, что безопаснее всегда если gfix выявил ошибки делать бэкап/рестор, а не gifx -mend, а затем уже бэкап/рестор. Скажем так: mend нужно делать только тогда и только тогда, когда не удалось сделать бакап. Именно это отложилось у меня в мозгу лет двадцать назад. ... |
|||
:
Нравится:
Не нравится:
|
|||
04.02.2019, 19:38 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
sysdba22Получается, что безопаснее всегда если gfix выявил ошибки делать бэкап/рестор, а не gifx -mend, а затем уже бэкап/рестор.Я не понимаю - откуда такие выводы ? Явно же сказано - warnings не влияют на работу БД. Потому они и warnings. Бекап\рестор сделать можно, но где требование всегда его делать ??? ... |
|||
:
Нравится:
Не нравится:
|
|||
04.02.2019, 19:52 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
pastormend нужно делать только тогда и только тогда, когда не удалось сделать бакапТут соглашусь. Но доп. файловая копия БД до mend - тоже не помешает. ... |
|||
:
Нравится:
Не нравится:
|
|||
04.02.2019, 19:53 |
|
Срочно нужна помощь
|
|||
---|---|---|---|
#18+
Ну, есть или нет ошибки при бэкапе - для этого можно и нужно заглядывать в лог планового бэкапа. И если бэкап перестал формироваться, плюс жалобы пользователей, то есть повод начинать прохождение квеста (в монопольном режиме, разумеется) "проверка-менд-бэкап-рестор-подмена базы-анализ на потери данных" ... |
|||
:
Нравится:
Не нравится:
|
|||
05.02.2019, 08:39 |
|
|
start [/forum/topic.php?all=1&fid=40&tid=1560820]: |
0ms |
get settings: |
10ms |
get forum list: |
14ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
156ms |
get topic data: |
12ms |
get forum data: |
2ms |
get page messages: |
107ms |
get tp. blocked users: |
2ms |
others: | 307ms |
total: | 616ms |
0 / 0 |