|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
Всем привет. Периодически начал отваливаться ночной джоб вот с такой ошибкой: авторTime-out occurred while waiting for buffer latch type 4 for page (1:1004593), database ID 5. Ниже прикрепил сообщения в логе и графики по данному диску. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 09:27 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
teCa, Диск ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 09:27 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
teCa, да у вас, на вскидку, 1) проблемы с дисковой подсистемой (I/O requests longer 15sec на диске Е), 2) прирост базы ADMIN занявший почти 1.5 минуты (диск Е) приложенная картинка с недельными данными не поможет понять что происходило в период 3:26 - 3:53 30 июля покажите print @@version ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 09:38 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
komrad teCa, да у вас, на вскидку, 1) проблемы с дисковой подсистемой (I/O requests longer 15sec на диске Е), 2) прирост базы ADMIN занявший почти 1.5 минуты (диск Е) приложенная картинка с недельными данными не поможет понять что происходило в период 3:26 - 3:53 30 июля покажите print @@version авторMicrosoft SQL Server 2017 (RTM-CU25) (KB5003830) - 14.0.3401.7 (X64) Jun 25 2021 14:02:48 Copyright (C) 2017 Microsoft Corporation Standard Edition (64-bit) on Windows Server 2012 R2 Standard 6.3 <X64> (Build 9600: ) (Hypervisor) Миграция диска на другой лун картины не изменило, админы говорят, что со стороны СХД ошибок по этим дискам никаких не замечено. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 09:50 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
teCa, ошибок нет, просто долго откликаются - смотрите максимальные задержки в секундах в конце сообщений. Например: SQL Server has encountered 1 occurrence(s) of I/O requests taking longer than 15 seconds to complete on file [T:\...\tempdb.mdf] in database id 2. The OS file handle is 0x0000000000001BD8. The offset of the latest long I/O is: 0x00001ec3a00000. The duration of the long I/O is: 23897 ms . а есть что-нибудь в sys.dm_server_memory_dumps ? ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 10:00 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
komrad, E:\SQLData\MSSQL12.SRVSQLNKC\MSSQL\LOG\SQLDump0037.mdmp 2021-07-07 04:36:39.1850257 +03:00 28123004E:\SQLData\MSSQL12.SRVSQLNKC\MSSQL\LOG\SQLDump0036.mdmp 2020-12-23 15:32:27.9577239 +03:00 22373400E:\SQLData\MSSQL12.SRVSQLNKC\MSSQL\LOG\SQLDump0035.mdmp 2020-12-23 15:32:17.7460836 +03:00 22909882E:\SQLData\MSSQL12.SRVSQLNKC\MSSQL\LOG\SQLDump0034.mdmp 2020-12-23 15:32:10.6136300 +03:00 23170626E:\SQLData\MSSQL12.SRVSQLNKC\MSSQL\LOG\SQLDump0033.mdmp 2020-12-23 15:31:24.0855856 +03:00 22069181 ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 10:11 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
teCa, а какой размер автоприращения для базы admin? ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 11:11 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
Владислав Колосов teCa, а какой размер автоприращения для базы admin? 10%, общий размер базы 14гб. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 11:14 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
teCa, приведите полный текст ошибки c time-out Код: sql 1.
... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 11:16 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
teCa Владислав Колосов teCa, а какой размер автоприращения для базы admin? 10%, общий размер базы 14гб. а что выдаст это? Код: sql 1.
... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 11:26 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
komrad, \sqlservr.exe" -sSRVSQLNKC Y\SQLAGENT.EXE" -i SRVSQLNKC N\fdlauncher.exe" -s MSSQL14.SRVSQLNKC N ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 11:33 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
teCa komrad, \sqlservr.exe" -sSRVSQLNKC Y\SQLAGENT.EXE" -i SRVSQLNKC N\fdlauncher.exe" -s MSSQL14.SRVSQLNKC N Условные 1.4ГБ за полторы минуты при включенном IFI - ну, не знаю, как-то медленно. Принимая во внимание задержки по I/O и такую скорость расширения файлов, я бы взял гайд по настройке виртуалок под сиквел и прошелся по всем его пунктам. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 11:45 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
teCa teCa, Диск Current пишется через 2 R ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 11:53 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
Проверьте кол-во, длительность и перекрытие событий time-out и автоприроста файлов БД скрипт Код: sql 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25.
... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 11:59 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
teCa Владислав Колосов teCa, а какой размер автоприращения для базы admin? 10%, общий размер базы 14гб. 10% от 14 ГБ = 1,4 ГБ, а смысл такими кусками приращивать? Если быстро растет - укажите фиксированный размер в МБ/ГБ, чтобы не так часто торчала. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 12:01 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
komrad, Моменты на скрине, где прирост длиться дольше обычного по времени совпадают с ошибками в логе такого типа: авторSQL Server has encountered 367 occurrence(s) of I/O requests taking longer than 15 seconds to complete on file [E:\SQLDatabases\bk_Matrix.mdf] in database id 5. The OS file handle is 0x0000000000000BA0. The offset of the latest long I/O is: 0x000026ff4d6000. The duration of the long I/O is: 56060 ms. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 12:14 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
teCa, в таком случае скорость записи составляет 16 мегабайт в секунду. Не находите, что это маловато для серверной системы? У вас не динамические диски, случайно? ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 12:18 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
Владислав Колосов, Не могу сказать, динамические или нет, в принципе, все инстансы работают на виртуалках с одной СХД, на этом экземпляре используется еще 2 диска, по ним проблем нет. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 12:21 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
komrad teCa, ошибок нет, просто долго откликаются - смотрите максимальные задержки в секундах в конце сообщений. Например: SQL Server has encountered 1 occurrence(s) of I/O requests taking longer than 15 seconds to complete on file [T:\...\tempdb.mdf] in database id 2. The OS file handle is 0x0000000000001BD8. The offset of the latest long I/O is: 0x00001ec3a00000. The duration of the long I/O is: 23897 ms . а есть что-нибудь в sys.dm_server_memory_dumps ? Если ЭТО регулярно повторяется, да еще "The offset" - где-то в одном месте - надо обращаться за ипотекой на новый диск. Надо бы еще, канешно, с дисковыми ошибками в журнале System ознакомиться... ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 12:42 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
teCa, каждые 10-15 секунд база ADMIN расширяется покажите столбец Filename - это лог растет или файлы данных? у вас на ней autoshrink случайно не включен? ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 12:44 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
komrad, Лог, база была в модели Full, смотрю журналы винды, в этих журналах ошибок никаких нет. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 13:00 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
teCa, у лога может быть другой размер автоприращения или его размер заметно меньше размера базы. В файле большие значения времени могут соответствовать приращению файла данных. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 13:18 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
Владислав Колосов teCa, в таком случае скорость записи составляет 16 мегабайт в секунду. Не находите, что это маловато для серверной системы? У вас не динамические диски, случайно? Предполагаю, что у них Perform Volume Tasks не выдано учетке, от которой SQLSERVER стартует. В этом случае оно еще и нулями заполняется при инициализации. Рекомендации стандартные: 1. Выдать perform volume maintenance tasks привелегию 2. Файлам дать фиксированное приращение - файлу БД 512 Мб, файлу лога - 64 Мб (он то как раз всегда зануляется, т.е. мгновенно не инициализируется) 3. Разнести логи и данные на разные диски, даже если они будут в пределах одного тома хоста. 4. Диски, разумеется, отформатировать в 64к NTFS 5. Отключить индексирование, генерацию 8.3 имен, проставление время последнего доступа на томе. 6. Внести mdf, ndf, ldf файлы в исключения антивируса. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 14:54 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
komrad teCa, каждые 10-15 секунд база ADMIN расширяется покажите столбец Filename - это лог растет или файлы данных? у вас на ней autoshrink случайно не включен? Ага, и auto close! ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 14:56 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
uaggster komrad teCa, каждые 10-15 секунд база ADMIN расширяется покажите столбец Filename - это лог растет или файлы данных? у вас на ней autoshrink случайно не включен? Ага, и auto close! Нет, autoshrink и auto close для баз отключены. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 15:04 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
uaggster Владислав Колосов teCa, в таком случае скорость записи составляет 16 мегабайт в секунду. Не находите, что это маловато для серверной системы? У вас не динамические диски, случайно? Предполагаю, что у них Perform Volume Tasks не выдано учетке, от которой SQLSERVER стартует. В этом случае оно еще и нулями заполняется при инициализации. выдано 22352946 ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 15:28 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
uaggster, даже при заполнении нулями 16 мб/с - это очень мало. Я бы проверил в первую очередь - что с виртуальными дисками. Best practices как раз предостерегают от использования виртуальных дисков в общем случае и рекомендуют для виртуальных машин подключение к физическим дискам. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 15:36 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
Владислав Колосов uaggster, даже при заполнении нулями 16 мб/с - это очень мало. Я бы проверил в первую очередь - что с виртуальными дисками. Best practices как раз предостерегают от использования виртуальных дисков в общем случае и рекомендуют для виртуальных машин подключение к физическим дискам. Ну, в общем то, конечно, да, Вы правы. Но, с другой стороны, кто знает, какая там полка? На нерлайн-сасах 7200, из 8 дисков в RAID6? Ну, тогда, более чем нормально, и даже очень хорошо. mdf файлы - это, в основном, случайное чтение/запись. Если всё это хозяйство лежит на диске (виртуальном, разумеется), отформатированном в 4k блоки, с неотключенным индексированием и прочими "сервисами файловой системы", включенном Касперским, и еще и с динамическим приращениям самого виртуального тома... на шпинделях ... нуууу... я б не сказал, что это плохо! ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 15:45 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
Владислав Колосов, Это были мои первые подозрения, поэтому первым делом мигрировали этот диск на другое хранилище, после миграции картинка на стороне сиквела не изменилась. Отключил пока аутогроу на базах, которые лежат на этом диске, базы перевел в простую модель восстановления. Днем эти диски работают идеально, никаких проблем или сообщений в логах, хотя основная нагрузка - это как раз ночной расчет. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 15:45 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
teCa Отключил пока аутогроу на базах, которые лежат на этом диске, базы перевел в простую модель восстановления. лихо! "Вижу цель, верю в себя, не замечаю препятствий!" (с)Чародеи ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 15:57 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
teCa, переключение на другое хранилище не имеет смысла, если настройки дисков те же самые. SQL запрашивает автоприрост, виртуалка начинает приращение виртуального объема, пока она его не выполнят - сиквел будет ждать освобождение дисков. Можно понаблюдать - через какое время начинается фактическая запись на диск после запроса запроса прироста. Это и будет простой. Или в логах виртуалки посмотреть приращения файла диска. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 16:08 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
komrad "Вижу цель, верю в себя, не замечаю препятствий!" (с)Чародеи Ну там всего пару баз, в обеих доставил достаточно места для данных, не думаю, что это поможет, но лишняя переменная из уравнения уйдет же. ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 16:20 |
|
Помогите проанализировать ошибку.
|
|||
---|---|---|---|
#18+
teCa komrad "Вижу цель, верю в себя, не замечаю препятствий!" (с)Чародеи Ну там всего пару баз, в обеих доставил достаточно места для данных, не думаю, что это поможет, но лишняя переменная из уравнения уйдет же. ну, если уверены, что не получите переполнение в период основной нагрузки (ночью) и если нет необходимости в point-in-time recovery, ок ... |
|||
:
Нравится:
Не нравится:
|
|||
30.07.2021, 16:32 |
|
|
start [/forum/topic.php?all=1&fid=46&tid=1684452]: |
0ms |
get settings: |
8ms |
get forum list: |
10ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
29ms |
get topic data: |
7ms |
get forum data: |
2ms |
get page messages: |
49ms |
get tp. blocked users: |
1ms |
others: | 9ms |
total: | 121ms |
0 / 0 |