|
|
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
И еще раз всем доброго времени суток! Возникла проблема, следующего характера: Есть некий сервер, на нем крутится БД MS SQL и ежедневно выполняется бекапирование по сети в датацентр по гигабитному каналу. Случилось так, что скорость бекапирования резко возросла. Всегда бекап длился примерно 17-18 часов (700ГБ данных), и вдруг время его выполнения увеличилось до 26-27 часов. Объем самого бекапа не вырос. У меня на руках есть показатели Perfmon'a за один из "хороших" дней мониторинга и два "плохих" дня. Я сильной принципиальной разницы не увидел, но возможно я что-то упускаю. Прошу опытных ребят взглянуть одним глазом, может проблема на поверхности. p.s. Базы находятся на диске D: (RAID 5, 6 HDD). Бекап идет по сети, сеть гигабитная, со стороны датацентра проблем с приемом нет. если нужны какие-нибудь дополнительные счетчики, дополнительные данные - напишите, озвучу. хороший perfmon: https://drive.google.com/open?id=12GnpuHjYN_cNtK3s-RbSs4ivkfZqkwsY плохой perfmion #1: https://drive.google.com/open?id=1GukCACicnq4IVC61A572suEibxHYfCOC плохой perfmoin #2: https://drive.google.com/open?id=1Zm1AE7RevXEzVuvgiT0-gafVPBDHGJ4F ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.12.2017, 12:59:11 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
Что-то у Вас с дисковой подсистемой случилось.. Посмотрите все ли нормально с массивами (нет ли ребилдов активных), состояние контроллера ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.12.2017, 13:20:30 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
нужно измерять ширину канала в конкретное время http://netwild.ru/iperf/ https://blogs.oracle.com/mandalika/measuring-network-bandwidth-using-iperf Measuring Network Bandwidth Using iperf ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.12.2017, 13:21:21 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
reamazЕсть некий сервер, на нем крутится БД MS SQL и ежедневно выполняется бекапирование по сети в датацентр по гигабитному каналу.А что там за пики раз в 4 часа? Бакап полный или какой то ещё? На первом перфмоне когда был бакап, от и до? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.12.2017, 14:16:40 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
reamazВсегда бекап длился примерно 17-18 часов (700ГБ данных), и вдруг время его выполнения увеличилось до 26-27 часов. Объем самого бекапа не вырос.Легко подсчитать, что для гигабитной сети (36 ГБ/час) 18 часов - это очень быстро. Какая то дополнительная нагрузка сети - и время увеличивается. rahzerЧто-то у Вас с дисковой подсистемой случилосьУж скорее с сетью, гигабит не так много. Впрочем, возможно всякое, может, рэйд деградировал? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.12.2017, 14:20:16 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
Спасибо всем поучавствовавшим! В ближайшее время постараюсь ответить на вопросы. "Легко подсчитать, что для гигабитной сети (36 ГБ/час) 18 часов - это очень быстро." Я может немного недопонимаю, но вроде 1Гбит/сек = 125Мб/сек ? итого 1 час = 125*60*60 = 450Гбайт/час ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.12.2017, 14:38:23 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
alexeyvg, автордля гигабитной сети (36 ГБ/час) а сколько у вас секунд в час? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.12.2017, 14:42:46 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
reamaz, к сожалению не могу посмлтреть Ваши картинки. Но проверьте, вдруг кто то поставил в плане обслуживания галочку "проверить бэкап". Это как раз и даст увеличение времени в 1,5 - 2 раза. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.12.2017, 14:47:25 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
Как вариант, может добавили или сместили какие-либо регламентные задания (проверка антивирусов, проверка дисковой подсистемы и т.п.), может кто-то свои данные так же стал бэкапить по тому же каналу.. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.12.2017, 14:58:45 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
alexeyvg, "А что там за пики раз в 4 часа?" Бекапы логов (~100GB) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.12.2017, 15:01:21 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
TaPaKalexeyvg, автордля гигабитной сети (36 ГБ/час) а сколько у вас секунд в час?3600, я землянин. А что? 3600 гигабит = 360 гигабайт Мда, ошибся :-( Что то медленно тогда Тогда диски тормозят, 10 мбайт/сек, получается? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.12.2017, 17:20:33 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
2rahzer - проверил рейд и контроллер - все в состоянии ОК Сейчас уточнил - есть дни, в которые этот бекап выполняется по 40+ часов. Вроде бы 700ГБ - не настолько много. Один нюанс: в течение дня делается полный бекап (о котором мы сейчас говорим), дополнительно, каждые 4 часа делаются бекапы журналов. Не могут эти два бекапа мешать выполнению друг друга? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.12.2017, 17:23:56 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
reamazНе могут эти два бекапа мешать выполнению друг друга? им друг на друга вообще наплевать. единственное, когда идет полный/дифф бэкап, параллельно идущий бэкап лога не сможет транкейтить лог. но это уже разница для самого лога, а не для его бэкапа ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.12.2017, 17:34:15 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
reamaz2rahzer - проверил рейд и контроллер - все в состоянии ОКА ресурс монитор что показывает, какие очереди у дисков бакапа и базы, какая ожидания и скорость записи в файл бакапов, ожидания и чтения из файлов базы? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.12.2017, 18:19:09 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
reamaz, а галка "проверить бэкап" в плане обслуживания установлена? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 15.12.2017, 18:27:52 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
Alexander Us , Пользуемся скриптами, вручную загнанными в Job. Кусок скрипта, отвечающий за бекап: Код: sql 1. 2. 3. 4. Собственно, никаких проверок нет. alexeyvg , Только сейчас подключаем в perfmon счетчики SQL. Не подскажите, в каких разделах находятся указанные счетчики? SQLServer:Databases? Ну и, собственно, какие показатели Performance monitor лучше подключить в нашем случае? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.12.2017, 13:58:04 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
reamaz alexeyvg , Только сейчас подключаем в perfmon счетчики SQL. Не подскажите, в каких разделах находятся указанные счетчики? SQLServer:Databases? Ну и, собственно, какие показатели Performance monitor лучше подключить в нашем случае?Не, я говорил про ресурс монитор. Там сразу одним взглядом видна ситуация - очереди, задержки, см вкладку "Диск". ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 19.12.2017, 15:53:00 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
Выявилась проблема с дисковой подсистемой. При тесте КристалМарком выявились сильные тормоза при создании файла для теста (к примеру, выбираем тест 8ГБ файлом, и он создается 8,5 минут). Сейчас копаемся в настройках рейда, пока безуспешно. Не совсем понятно, является ли это корнем нашей проблемы, ведь при бекапе нужна не запись, а чтение. В связи с этим, уточнение: При бекапе базы "по сети" - каким образом SQL-сервер отправляет данные? Сначала ложит их куда то в кэш на диск или отправляет напрямую (из RAM, например)? Если создается временный файл на диске - тогда понятно, что нас тормозит. Если нет простого ответа - дайте, плз статьи, подучу немного (гугл сходу не помог). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.12.2017, 12:37:59 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
https://docs.microsoft.com/en-us/sysinternals/downloads/procmon Process Monitor is an advanced monitoring tool for Windows that shows real-time file system , Registry and process/thread activity . ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.12.2017, 12:49:37 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
reamazтогда понятно, что нас тормозит.Что вы всё гадаете, посмотрите уже, есть проблемы с дисковой системой или нет. Какой таймаут операции? Какая очередь к дискам? Есть пики, или оно присутствует постоянно? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.12.2017, 12:51:52 |
|
||
|
Performance monitor
|
|||
|---|---|---|---|
|
#18+
Если у вас используется тиринг или SSD кэширование, то посмотрите, м.б данные переползли на более медленные диски или SSD кэш отключили.. Вобщем, надо сравнить та ли конфигурация железа до проблем и во время их возникновения. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 20.12.2017, 12:56:17 |
|
||
|
|

start [/forum/topic.php?fid=46&msg=39570272&tid=1690640]: |
0ms |
get settings: |
8ms |
get forum list: |
10ms |
check forum access: |
2ms |
check topic access: |
2ms |
track hit: |
182ms |
get topic data: |
12ms |
get forum data: |
2ms |
get page messages: |
57ms |
get tp. blocked users: |
1ms |
| others: | 190ms |
| total: | 466ms |

| 0 / 0 |
