Гость
Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Помогите проанализировать ошибку. / 25 сообщений из 34, страница 1 из 2
30.07.2021, 09:27
    #40087243
teCa
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
Всем привет. Периодически начал отваливаться ночной джоб вот с такой ошибкой:

авторTime-out occurred while waiting for buffer latch type 4 for page (1:1004593), database ID 5.

Ниже прикрепил сообщения в логе и графики по данному диску.
...
Рейтинг: 0 / 0
30.07.2021, 09:27
    #40087244
teCa
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
teCa,

Диск
...
Рейтинг: 0 / 0
30.07.2021, 09:38
    #40087248
komrad
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
teCa,

да у вас, на вскидку,
1) проблемы с дисковой подсистемой (I/O requests longer 15sec на диске Е),
2) прирост базы ADMIN занявший почти 1.5 минуты (диск Е)

приложенная картинка с недельными данными не поможет понять что происходило в период 3:26 - 3:53 30 июля

покажите
print @@version
...
Рейтинг: 0 / 0
30.07.2021, 09:50
    #40087251
teCa
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
komrad
teCa,

да у вас, на вскидку,
1) проблемы с дисковой подсистемой (I/O requests longer 15sec на диске Е),
2) прирост базы ADMIN занявший почти 1.5 минуты (диск Е)

приложенная картинка с недельными данными не поможет понять что происходило в период 3:26 - 3:53 30 июля

покажите
print @@version


авторMicrosoft SQL Server 2017 (RTM-CU25) (KB5003830) - 14.0.3401.7 (X64)
Jun 25 2021 14:02:48
Copyright (C) 2017 Microsoft Corporation
Standard Edition (64-bit) on Windows Server 2012 R2 Standard 6.3 <X64> (Build 9600: ) (Hypervisor)

Миграция диска на другой лун картины не изменило, админы говорят, что со стороны СХД ошибок по этим дискам никаких не замечено.
...
Рейтинг: 0 / 0
30.07.2021, 10:00
    #40087254
komrad
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
teCa,

ошибок нет, просто долго откликаются - смотрите максимальные задержки в секундах в конце сообщений.
Например:
SQL Server has encountered 1 occurrence(s) of I/O requests taking longer than 15 seconds to complete on file [T:\...\tempdb.mdf] in database id 2. The OS file handle is 0x0000000000001BD8. The offset of the latest long I/O is: 0x00001ec3a00000. The duration of the long I/O is: 23897 ms .


а есть что-нибудь в sys.dm_server_memory_dumps ?
...
Рейтинг: 0 / 0
30.07.2021, 10:11
    #40087256
teCa
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
komrad,

E:\SQLData\MSSQL12.SRVSQLNKC\MSSQL\LOG\SQLDump0037.mdmp 2021-07-07 04:36:39.1850257 +03:00 28123004E:\SQLData\MSSQL12.SRVSQLNKC\MSSQL\LOG\SQLDump0036.mdmp 2020-12-23 15:32:27.9577239 +03:00 22373400E:\SQLData\MSSQL12.SRVSQLNKC\MSSQL\LOG\SQLDump0035.mdmp 2020-12-23 15:32:17.7460836 +03:00 22909882E:\SQLData\MSSQL12.SRVSQLNKC\MSSQL\LOG\SQLDump0034.mdmp 2020-12-23 15:32:10.6136300 +03:00 23170626E:\SQLData\MSSQL12.SRVSQLNKC\MSSQL\LOG\SQLDump0033.mdmp 2020-12-23 15:31:24.0855856 +03:00 22069181
...
Рейтинг: 0 / 0
30.07.2021, 11:11
    #40087264
Владислав Колосов
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
teCa,

а какой размер автоприращения для базы admin?
...
Рейтинг: 0 / 0
30.07.2021, 11:14
    #40087265
teCa
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
Владислав Колосов
teCa,

а какой размер автоприращения для базы admin?

10%, общий размер базы 14гб.
...
Рейтинг: 0 / 0
30.07.2021, 11:16
    #40087267
komrad
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
teCa,

приведите полный текст ошибки c time-out
Код: sql
1.
exec xp_readerrorlog 0,1,N'time-out'
...
Рейтинг: 0 / 0
30.07.2021, 11:26
    #40087273
komrad
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
teCa
Владислав Колосов
teCa,

а какой размер автоприращения для базы admin?

10%, общий размер базы 14гб.


а что выдаст это?
Код: sql
1.
select stuff(filename,1,len(filename)-charindex('\',reverse(filename)),'') [service], instant_file_initialization_enabled [ifi] from sys.dm_server_services
...
Рейтинг: 0 / 0
30.07.2021, 11:33
    #40087276
teCa
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
komrad,

\sqlservr.exe" -sSRVSQLNKC Y\SQLAGENT.EXE" -i SRVSQLNKC N\fdlauncher.exe" -s MSSQL14.SRVSQLNKC N
...
Рейтинг: 0 / 0
30.07.2021, 11:45
    #40087278
komrad
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
teCa
komrad,

\sqlservr.exe" -sSRVSQLNKC Y\SQLAGENT.EXE" -i SRVSQLNKC N\fdlauncher.exe" -s MSSQL14.SRVSQLNKC N


Условные 1.4ГБ за полторы минуты при включенном IFI - ну, не знаю, как-то медленно.
Принимая во внимание задержки по I/O и такую скорость расширения файлов, я бы взял гайд по настройке виртуалок под сиквел и прошелся по всем его пунктам.
...
Рейтинг: 0 / 0
30.07.2021, 11:53
    #40087280
komrad
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
teCa
teCa,

Диск

Current пишется через 2 R
...
Рейтинг: 0 / 0
30.07.2021, 11:59
    #40087283
komrad
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
Проверьте кол-во, длительность и перекрытие событий time-out и автоприроста файлов БД

скрипт
Код: sql
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
SELECT	top 200
		te.name, 
		ft.SPID,
		ft.LoginName,
		ft.Hostname,
		ft.ClientProcessID,
		ft.DatabaseName, 
		ft.FileName, 
		ft.StartTime, 
		dateadd(ms,ft.Duration/1000,ft.StartTime) [FinishTime],
		ft.ApplicationName ,
		ft.ObjectID,
		ft.Duration/1000./1000 [Duration (s)],
	ft.TextData,
	ft.RoleName,
	ft.TargetUserName,
	ft.TargetLoginName
FROM sys.traces st CROSS Apply
	::fn_trace_gettable(left(st.path,len(st.path)-charindex('_',reverse(st.path)))+right(st.path,4), st.max_files) AS ft 
INNER JOIN sys.trace_events AS te ON ft.EventClass = te.trace_event_id 
WHERE 
	te.name LIKE '%Grow'  
	and st.is_default=1 
	and st.status=1
ORDER BY ft.StartTime desc;

...
Рейтинг: 0 / 0
30.07.2021, 12:01
    #40087284
Ролг Хупин
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
teCa
Владислав Колосов
teCa,

а какой размер автоприращения для базы admin?

10%, общий размер базы 14гб.


10% от 14 ГБ = 1,4 ГБ, а смысл такими кусками приращивать?
Если быстро растет - укажите фиксированный размер в МБ/ГБ, чтобы не так часто торчала.
...
Рейтинг: 0 / 0
30.07.2021, 12:14
    #40087291
teCa
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
komrad,

Моменты на скрине, где прирост длиться дольше обычного по времени совпадают с ошибками в логе такого типа:

авторSQL Server has encountered 367 occurrence(s) of I/O requests taking longer than 15 seconds to complete on file [E:\SQLDatabases\bk_Matrix.mdf] in database id 5. The OS file handle is 0x0000000000000BA0. The offset of the latest long I/O is: 0x000026ff4d6000. The duration of the long I/O is: 56060 ms.
...
Рейтинг: 0 / 0
30.07.2021, 12:18
    #40087294
Владислав Колосов
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
teCa,

в таком случае скорость записи составляет 16 мегабайт в секунду. Не находите, что это маловато для серверной системы? У вас не динамические диски, случайно?
...
Рейтинг: 0 / 0
30.07.2021, 12:21
    #40087297
teCa
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
Владислав Колосов,

Не могу сказать, динамические или нет, в принципе, все инстансы работают на виртуалках с одной СХД, на этом экземпляре используется еще 2 диска, по ним проблем нет.
...
Рейтинг: 0 / 0
30.07.2021, 12:42
    #40087306
aleks222
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
komrad
teCa,

ошибок нет, просто долго откликаются - смотрите максимальные задержки в секундах в конце сообщений.
Например:
SQL Server has encountered 1 occurrence(s) of I/O requests taking longer than 15 seconds to complete on file [T:\...\tempdb.mdf] in database id 2. The OS file handle is 0x0000000000001BD8. The offset of the latest long I/O is: 0x00001ec3a00000. The duration of the long I/O is: 23897 ms .


а есть что-нибудь в sys.dm_server_memory_dumps ?


Если ЭТО регулярно повторяется, да еще "The offset" - где-то в одном месте - надо обращаться за ипотекой на новый диск.

Надо бы еще, канешно, с дисковыми ошибками в журнале System ознакомиться...
...
Рейтинг: 0 / 0
30.07.2021, 12:44
    #40087307
komrad
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
teCa,

каждые 10-15 секунд база ADMIN расширяется
покажите столбец Filename - это лог растет или файлы данных?

у вас на ней autoshrink случайно не включен?
...
Рейтинг: 0 / 0
30.07.2021, 13:00
    #40087312
teCa
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
komrad,

Лог, база была в модели Full, смотрю журналы винды, в этих журналах ошибок никаких нет.
...
Рейтинг: 0 / 0
30.07.2021, 13:18
    #40087322
Владислав Колосов
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
teCa,

у лога может быть другой размер автоприращения или его размер заметно меньше размера базы. В файле большие значения времени могут соответствовать приращению файла данных.
...
Рейтинг: 0 / 0
30.07.2021, 14:54
    #40087349
uaggster
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
Владислав Колосов
teCa,

в таком случае скорость записи составляет 16 мегабайт в секунду. Не находите, что это маловато для серверной системы? У вас не динамические диски, случайно?

Предполагаю, что у них Perform Volume Tasks не выдано учетке, от которой SQLSERVER стартует.
В этом случае оно еще и нулями заполняется при инициализации.

Рекомендации стандартные:
1. Выдать perform volume maintenance tasks привелегию
2. Файлам дать фиксированное приращение - файлу БД 512 Мб, файлу лога - 64 Мб (он то как раз всегда зануляется, т.е. мгновенно не инициализируется)
3. Разнести логи и данные на разные диски, даже если они будут в пределах одного тома хоста.
4. Диски, разумеется, отформатировать в 64к NTFS
5. Отключить индексирование, генерацию 8.3 имен, проставление время последнего доступа на томе.
6. Внести mdf, ndf, ldf файлы в исключения антивируса.
...
Рейтинг: 0 / 0
30.07.2021, 14:56
    #40087350
uaggster
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
komrad
teCa,

каждые 10-15 секунд база ADMIN расширяется
покажите столбец Filename - это лог растет или файлы данных?

у вас на ней autoshrink случайно не включен?

Ага, и auto close!
...
Рейтинг: 0 / 0
30.07.2021, 15:04
    #40087351
teCa
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Помогите проанализировать ошибку.
uaggster
komrad
teCa,

каждые 10-15 секунд база ADMIN расширяется
покажите столбец Filename - это лог растет или файлы данных?

у вас на ней autoshrink случайно не включен?

Ага, и auto close!


Нет, autoshrink и auto close для баз отключены.
...
Рейтинг: 0 / 0
Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / Помогите проанализировать ошибку. / 25 сообщений из 34, страница 1 из 2
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]