powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Unix-системы [игнор отключен] [закрыт для гостей] / Какой сторидж подключен к серверу ?
26 сообщений из 26, показаны все 2 страниц
Какой сторидж подключен к серверу ?
    #38789534
joiner_plus
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
centos5, есть root пароль. подскажите как выяснить, что за SAN storage подключен на /dev/mapper/vgdata-lvol0 ?
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38789580
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
vgdispay -v
lsscsi
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38789694
joiner_plus
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Журавлев Денисvgdispay -v
lsscsi

lsscsi нет такого, vgdisplay ничего интересного не сказал
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
# vgdisplay -v
    Finding all volume groups
    Finding volume group "vgdata"
  --- Volume group ---
  VG Name               vgdata
  System ID
  Format                lvm2
  Metadata Areas        1
  Metadata Sequence No  8
  VG Access             read/write
  VG Status             resizable
  MAX LV                0
  Cur LV                1
  Open LV               1
  Max PV                0
  Cur PV                1
  Act PV                1
  VG Size               1000.00 GB
  PE Size               4.00 MB
  Total PE              255999
  Alloc PE / Size       255999 / 1000.00 GB
  Free  PE / Size       0 / 0
  VG UUID               xxxx-xxx-xxx-xx-xxx-xxx-xxx

  --- Logical volume ---
  LV Name                /dev/vgdata/lvol0
  VG Name                vgdata
  LV UUID                xxxx-xxx-xxx-xx-xxx-xxx-xxx
  LV Write Access        read/write
  LV Status              available
  # open                 1
  LV Size                1000.00 GB
  Current LE             255999
  Segments               1
  Allocation             inherit
  Read ahead sectors     auto
  - currently set to     256
  Block device           253:1

  --- Physical volumes ---
  PV Name               /dev/dm-0
  PV UUID               xxxx-xxx-xxx-xx-xxx-xxx-xxx
  PV Status             allocatable
  Total PE / Free PE    255999 / 0

по косвенным уликам узнал, что это DELL Compellent

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
#cat /proc/scsi/scsi
Attached devices:
Host: scsi0 Channel: 00 Id: 00 Lun: 01
  Vendor: COMPELNT Model: Compellent Vol   Rev: 0505
  Type:   Direct-Access                    ANSI SCSI revision: 05
Host: scsi0 Channel: 00 Id: 01 Lun: 01
  Vendor: COMPELNT Model: Compellent Vol   Rev: 0505
  Type:   Direct-Access                    ANSI SCSI revision: 05
Host: scsi1 Channel: 00 Id: 00 Lun: 01
  Vendor: COMPELNT Model: Compellent Vol   Rev: 0505
  Type:   Direct-Access                    ANSI SCSI revision: 05
Host: scsi1 Channel: 00 Id: 01 Lun: 01
  Vendor: COMPELNT Model: Compellent Vol   Rev: 0505
  Type:   Direct-Access                    ANSI SCSI revision: 05

# multipath  -ll
mpath0 (21000d210001f230000000000000000c7) dm-0 COMPELNT,Compellent Vol
[size=1000G][features=1 queue_if_no_path][hwhandler=0][rw]
\_ round-robin 0 [prio=4][active]
 \_ 0:0:0:1 sda 8:0   [active][ready]
 \_ 0:0:1:1 sdb 8:16  [active][ready]
 \_ 1:0:0:1 sdc 8:32  [active][ready]
 \_ 1:0:1:1 sdd 8:48  [active][ready]

а что-то большее можно выудить, хотя бы, что за модель, может кол-во дисков или приоритет этой системы (сказали, что некий High Priority Tier) ?

еще вопрос, такие цифры, похожи на серьезный сторидж ?

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
$ vmstat 1
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu------
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 0  3 2698452  94712  20156 15956752    0    0 56672  1072 1825 5742  4  2 69 25  0
 0  4 2698840  91936  20116 15959528    0   28 63660  1296 1839 5603  3  2 75 20  0
 0  3 2698964  91464  20040 15961328    0   28 65616   764 1803 5531  3  1 77 19  0
 0  3 2698960  94212  20080 15958992    4    8 46372  2184 1718 5372  3  1 74 22  0
 0  2 2698960  96252  20132 15958316    0   20 62996   784 1759 4893  3  1 76 20  0
 0  2 2698960  93000  20076 15962892    0   56 61956   496 1725 5003  3  1 78 18  0
 0  2 2698972  95468  20048 15961996    0   12 58552   164 1586 4939  2  1 78 19  0
проблема в том, что админы рассказывают что-то установили для нас некий приоритет на сторидже, а мы, девелоперы, это особо не чувствуем. даже ухутшение видим.
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38790004
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
joiner_plusа что-то большее можно выудить, хотя бы, что за модель, может кол-во дисков или приоритет этой системы (сказали, что некий High Priority Tier) ?конечно нет, только в админке самомого стораджа

joiner_plusеще вопрос, такие цифры, похожи на серьезный сторидж ?
$ vmstat 1vmstat показывает память и cpu, вы может iostat хотели запустить?


joiner_plusпроблема в том, что админы рассказывают что-то установили для нас некий приоритет на сторидже, а мы, девелоперы, это особо не чувствуем. даже ухутшение видим.да нефиг девелоперам вообще рутом ходить. Придумайте свой попугайный тест, например инсертите два миллиарда записей в таблицу а потом создавайте индекс и дергайте их миллиардом селектов, меряйте время, и деградацию показывайте админам.
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38790314
joiner_plus
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Журавлев Денисvmstat показывает память и cpu, вы может iostat хотели запустить?

нет, я хотел показать именно, что не справляется io, предпоследняя колонка показывает огромные очереди к дискам, на фоне не столь уж больших цифр bi/bo.

Журавлев Денисда нефиг девелоперам вообще рутом ходить. Придумайте свой попугайный тест, например инсертите два миллиарда записей в таблицу а потом создавайте индекс и дергайте их миллиардом селектов, меряйте время, и деградацию показывайте админам.
если у девелоперов на порядок больше знаний, кому как не им. тест есть, но он показывает каждый раз разное время, а нам это объясняют, что сторидж шарится с другими системами и все дело в приоритетах.
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38790353
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
joiner_plusнет, я хотел показать именно, что не справляется io, предпоследняя колонка показывает огромные очереди к дискам, на фоне не столь уж больших цифр bi/bo.wa Time spent waiting for IO. При проблемах там будут постоянные 100, 25 это вообще ни о чем, и не понятно к какому диску, может у вас там журналирование у сервера приложений локальный диск на сервере грузит, кто знает. Значение bi и bo в секторах это во первых, во вторых бывает рандомный, а бывает последовательный доступ и сата шпиндель выдающий 150МБ/c на последовательном чтении, выдает максимум 1,5МБ/c на рандомном, поэтому "маленькие" числа bi и bo могут оказаться просто гиганскими.

joiner_plusесли у девелоперов на порядок больше знаний, кому как не им. тест есть, но он показывает каждый раз разное время, а нам это объясняют, что сторидж шарится с другими системами и все дело в приоритетах.Хотите мое знание? Любые рейд-карточки и дисковые массивы говно. Нормальные дисковые массивы стоят от 500килобаксов, до этой суммы софт-рейд с нормальной hba карточкой порвет всех по производительности и надежности.
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38790384
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
sar -d и iostat показывают


запускайте sar -d 1 100 и смотрите
avgrq-sz
The average size (in sectors) of the requests that were issued to the device.

avgqu-sz
The average queue length of the requests that were issued to the device.

await
The average time (in milliseconds) for I/O requests issued to the device to be served. This includes the time spent by the requests in queue and the time spent servicing them.

svctm
The average service time (in milliseconds) for I/O requests that were issued to the device.
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38790872
joiner_plus
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Журавлев Денисwa Time spent waiting for IO. При проблемах там будут постоянные 100, 25 это вообще ни о чем, и не понятно к какому диску, может у вас там журналирование у сервера приложений локальный диск на сервере грузит, кто знает.

не знаю, может это на крутых сториджах 25 ни о чем, а на локальном SAS (25к) диске с 10 уже чувствуется, что запросы идут в разы медленее. wa 25 катастрофа. примерно тот же расклад на локальном raid 10.
база оракловая, без арклогов (dev server), redo и остальные датафайлы на этом сторидже

Журавлев ДенисЗначение bi и bo в секторах это во первых, во вторых бывает рандомный, а бывает последовательный доступ и сата шпиндель выдающий 150МБ/c на последовательном чтении, выдает максимум 1,5МБ/c на рандомном, поэтому "маленькие" числа bi и bo могут оказаться просто гиганскими.

это я в курсе, потому обычно на IOPS ориентируюсь.

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
01:37:01 PM       DEV       tps  rd_sec/s  wr_sec/s  avgrq-sz  avgqu-sz     await     svctm     %util
01:37:02 PM  dev104-0     92.00      0.00   2416.00     26.26      0.07      0.80      0.03      0.30
01:37:02 PM  dev104-1      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
01:37:02 PM  dev104-2      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
01:37:02 PM  dev104-3      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
01:37:02 PM  dev104-4      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
01:37:02 PM  dev104-5      2.00      0.00     32.00     16.00      0.00      0.00      0.00      0.00
01:37:02 PM  dev104-6      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
01:37:02 PM  dev104-7      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
01:37:02 PM  dev104-8     11.00      0.00    416.00     37.82      0.00      0.09      0.09      0.10
01:37:02 PM  dev104-9     79.00      0.00   1968.00     24.91      0.07      0.92      0.03      0.20
01:37:02 PM    dev8-0     69.00   5056.00    448.00     79.77      0.54      7.80      5.80     40.00
01:37:02 PM   dev8-16     31.00   1696.00    792.00     80.26      0.12      3.81      3.23     10.00
01:37:02 PM   dev8-32     31.00   2704.00    272.00     96.00      0.34     11.06      8.26     25.60
01:37:02 PM   dev8-48     53.00   2488.00    408.00     54.64      0.36      7.00      4.62     24.50
01:37:02 PM  dev253-0    418.00  11944.00   1920.00     33.17      2.64      6.32      2.32     97.10
01:37:02 PM  dev253-1    418.00  11944.00   1920.00     33.17      2.64      6.32      2.32     97.10

01:37:02 PM       DEV       tps  rd_sec/s  wr_sec/s  avgrq-sz  avgqu-sz     await     svctm     %util
01:37:03 PM  dev104-0      1.00      8.00      0.00      8.00      0.01      5.00      5.00      0.50
01:37:03 PM  dev104-1      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
01:37:03 PM  dev104-2      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
01:37:03 PM  dev104-3      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
01:37:03 PM  dev104-4      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
01:37:03 PM  dev104-5      1.00      8.00      0.00      8.00      0.01      5.00      5.00      0.50
01:37:03 PM  dev104-6      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
01:37:03 PM  dev104-7      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
01:37:03 PM  dev104-8      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
01:37:03 PM  dev104-9      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
01:37:03 PM    dev8-0     29.00   1312.00    312.00     56.00      0.20      6.90      5.97     17.30
01:37:03 PM   dev8-16     27.00   1296.00    328.00     60.15      0.19      7.04      5.56     15.00
01:37:03 PM   dev8-32     87.00   4808.00    256.00     58.21      0.62      6.95      4.70     40.90
01:37:03 PM   dev8-48     43.00   2416.00    136.00     59.35      0.40      9.26      5.98     25.70
01:37:03 PM  dev253-0    316.00  10152.00   1032.00     35.39      2.11      6.63      3.09     97.60
01:37:03 PM  dev253-1    316.00  10152.00   1032.00     35.39      2.11      6.64      3.09     97.80

а что такое "in sectors ? pages по 4к ?
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38791037
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
что с ожиданиями в оракле? кто в top5 ? Что тормозит, комиты (log file sync)?

01:37:02 PM dev8-0 69.00 5056.00 448.00 79.77 0.54 7.80 5.80 40.00
01:37:02 PM dev8-16 31.00 1696.00 792.00 80.26 0.12 3.81 3.23 10.00
01:37:02 PM dev8-32 31.00 2704.00 272.00 96.00 0.34 11.06 8.26 25.60
01:37:02 PM dev8-48 53.00 2488.00 408.00 54.64 0.36 7.00 4.62 24.50
01:37:02 PM dev253-0 418.00 11944.00 1920.00 33.17 2.64 6.32 2.32 97.10
01:37:02 PM dev253-1 418.00 11944.00 1920.00 33.17 2.64 6.32 2.32 97.10

Цифры нормальные на мой взгляд, avait 2ms как раз один seek на шпинделе, очередь тоже нормальная.

Можно попробовать переключить мультипафинг с раунд робина на один путь, может лун между контроллерами прыгает и на этом тормозит.

noop в шедулеры sda - sdd


>а что такое "in sectors ? pages по 4к ?
512байт
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38792277
netwind
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Журавлев Денисчто с ожиданиями в оракле? кто в top5 ? Что тормозит, комиты (log file sync)?

01:37:02 PM dev8-0 69.00 5056.00 448.00 79.77 0.54 7.80 5.80 40.00
01:37:02 PM dev8-16 31.00 1696.00 792.00 80.26 0.12 3.81 3.23 10.00
01:37:02 PM dev8-32 31.00 2704.00 272.00 96.00 0.34 11.06 8.26 25.60
01:37:02 PM dev8-48 53.00 2488.00 408.00 54.64 0.36 7.00 4.62 24.50
01:37:02 PM dev253-0 418.00 11944.00 1920.00 33.17 2.64 6.32 2.32 97.10
01:37:02 PM dev253-1 418.00 11944.00 1920.00 33.17 2.64 6.32 2.32 97.10


Цифры нормальные на мой взгляд, avait 2ms как раз один seek на шпинделе, очередь тоже нормальная.

util% - относительный фактор и 97.10% подразумевает что все плохо. вне зависимости от других цифр.
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38793309
Мутаген
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
%util ничего не значит. Просто какой процент времени в очереди были запросы I/O.
Когда он равен 100, то можно запросто поддать ещё нагрузки и будет работать.

Вообще, непонятная дискуссия. У автора есть желание стать администратором сети хранения? Если нет, то надо просто сообщить нужные требования по I/O руководству и на этом остановится. Пускай проблемы менеджмента решают менеджеры - они за это зарплату получают.
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38793321
netwind
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А как же ее поддать, если очередь заполнена всегда и любые попытки запустить еще процессов и подать запросов только приведут к блокировке этих процессов ?

Ну разве что только если в справедливо разделяемых ресурсах хранилища "отожрать" еще большую запросов от других пользователей.
Наверное, не дадут это сделать ТС.

Я к тому говорю, что в существующей конфигурации, похоже, все возможности исчерпаны.
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38793596
joiner_plus
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Мутаген%util ничего не значит. Просто какой процент времени в очереди были запросы I/O.
Когда он равен 100, то можно запросто поддать ещё нагрузки и будет работать.

Вообще, непонятная дискуссия. У автора есть желание стать администратором сети хранения? Если нет, то надо просто сообщить нужные требования по I/O руководству и на этом остановится. Пускай проблемы менеджмента решают менеджеры - они за это зарплату получают.
вам в России хорошо, а на западе с этим делом совсем грустно. я сообщил, начальство дало команду, админы подключили сторидж. все довольны, все получили зарплату, все хорошо. только вот датафайлы где лежали, там и лежат. я сообщил, начальство дало команду, админы перенесли часть файлов на SAN, все довольны, все получили зарплату, все хорошо. только перенесли лишь часть файлов, даже undo, redo остались на прежнем месте. устраивать скандал с админами тоже не хочется, мы от них зависим, проще выходит самому разобраться. ну и главное, если я не понимаю как работает система, как я напишу нормальный софт ? у нас тут куча миграций, перекачиваются сотни гб. мне нужно понимать как я могу выстроить проект, могу ли я в 21 веке перекачивать данные параллельно или как мои предки, все операции строго последовательно.

в общем сейчас ситуация такая, дома i7 с сата диском и виндовым ораклом выполняет тестовый скрипт за 55 минут, на работе 4h. обе базы в noarhivelog, в скрипте один и тот же SQL с зашитыми хинтами fullscan и выполняется с одинковым планом. каждый 1М записей коммит. вобщем тестит именно ио.

возник вопрос, а что показывает iostat в разделе devices ? у меня там cciss/c0d0*, sda(b,c ..), dm-0(1), что это ? мня смущает, что iostat показывает писанину везде. sda(b,c ..) это ведь локальные диски ? если у меня все хоз-во базы данных на SAN, там не должно быть активности на мой взгляд.
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38793635
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
joiner_plusв общем сейчас ситуация такая, дома i7 с сата диском и виндовым ораклом выполняет тестовый скрипт за 55 минут, на работе 4h.Может у вас дома процессор в 4 раза быстрее, это не шутка.

joiner_plus обе базы в noarhivelog, эта сентенция выдает полнейшего профана в оракле, noarhivelog почти не влияет на производительность, если вы считаете что так выключаете журналирование, то это не так. Всего лишь нет архивирования, кто вообще сказал что за 4 часа у вас там журналы хоть раз щелкают. Аркайвер работает асинхронно, комит конечно ждет сброса буфера журнала в текущий редолог, но чаще всего арклоги и редологи разносят по разным дискам, иначе бекап окажется там-же где и данные, и сброс буфера скорее всего идет в кешрейда. Может быть ситуация что свободные редо группы кончились и аркайвер протормозил, но тут настраивать можно и количество и размер групп.
Трассируйте 10046, смотрите ожидания в трассе, смотрите top5 за эти 4 часа.

joiner_plusв скрипте один и тот же SQL с зашитыми хинтами fullscan и выполняется с одинковым планом. каждый 1М записей коммит. вобщем тестит именно ио. Дома вставьте ssd и прогоните тест, посмотрите время.
Такие инсерты можно ускорить и append-м c nologging и другими трюками с журналом. Но без 10046 это пальцем в небо, возможно тормозят индексы из-за слабого проца, возможно plsql в триггерах (я такое реально видел).

joiner_plusвозник вопрос, а что показывает iostat в разделе devices ? у меня там cciss/c0d0*, sda(b,c ..), dm-0(1), что это ? мня смущает, что iostat показывает писанину везде. sda(b,c ..) это ведь локальные диски ? если у меня все хоз-во базы данных на SAN, там не должно быть активности на мой взгляд.cciss это hp smartarray, рейд карточка с локальными дисками, в древних ядрах линукса (3-4 года назад) со старым модулем рейда, они выглядели вот такими странными устройствами, сейчас они обычные sda sdb.

sda это скази устройство, в вашем случае это lun внешнего массива подключенного либо через sas либо через fiber channel, хотя iscsi тоже видно как sda.

dm-0(1) это device mapper, просто создает алиасы, для более удобного наименования, например у вас multipath соединил раунд робином sda sdb sdc sdd (это один и тот-же lun массива видимый по 4-м путям) и назовет его /dev/.../21000d210001f230000000000000000c7 , а девайсмеппер делает пачку симлинков типа как-то /dev/scsi/dm0 у sar и iostat есть ключики какие имена выдавать.
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38793668
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
И сотни гигабайт, вообще ни о чем, я недавно импротнул базу 150 гиг, за 10мин, вместо 40, всего лишь убрав буферный кеш в оракле, отдав память линуксу, и сделав двойоное кеширование через filesystemio_options. Надо понять сначала где узкое место.
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38793694
joiner_plus
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Журавлев Денисэта сентенция выдает полнейшего профана в оракле, noarhivelog почти не влияет на производительность, если вы считаете что так выключаете журналирование, то это не так.

ощущение, что я вас чем-то обидел и вы пытаетесь хоть чем нибудь задеть. я в курсе как работает оракл, я в курсе, что даже tablespace c nolog будет много чего логить. смотрите на вещи проще, я упомянул noarhivelog, что бы было понятно, что у меня не было ситуации когда на работе пишет еще и арклоги, устраивая дополнительное ио, тогда как дома база по дефолту без арклогов. на это можно было бы списать разницу.

Журавлев ДенисИ сотни гигабайт, вообще ни о чем, я недавно импротнул базу 150 гиг, за 10мин, вместо 40, всего лишь убрав буферный кеш в оракле, отдав память линуксу, и сделав двойоное кеширование через filesystemio_options. Надо понять сначала где узкое место.
ну вот в конкретном тесте с большим отрывом идет переключение redo (1-3 раза в минуту), но на работе redo 500 мб каждый, а дома по дефолту, кажется 50мб. и там и сям вроде по одному redo в группе, т.е. условия относительно равные.
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38793709
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
joiner_plusощущение, что я вас чем-то обидел и вы пытаетесь хоть чем нибудь задеть.вам прилетает за то что вы девелопер влезли не свой монастырь, это конечно подло с моей стороны как модератора, потому что я сам себя не буду наверное банить и модерировать, но пока вот так.

joiner_plus я в курсе как работает оракл, я в курсе, что даже tablespace c nolog будет много чего логить. обычные инсерты будут записаны в редо.
NOLOGGING can be used to minimize the amount of redo generated by Oracle. Only the following operations can make use of nologging:

* SQL*Loader in direct mode
* INSERT /*+APPEND*/ ...
* CTAS
* ALTER TABLE statements (move/add/split/merge partitions)
* CREATE INDEX
* ALTER INDEX statements (move/add/split/merge partitions)

joiner_plus смотрите на вещи проще, я упомянул noarhivelog, что бы было понятно, что у меня не было ситуации когда на работе пишет еще и арклоги, устраивая дополнительное ио, тогда как дома база по дефолту без арклогов. на это можно было бы списать разницу.ясно.

joiner_plusну вот в конкретном тесте с большим отрывом идет переключение redo (1-3 раза в минуту), но на работе redo 500 мб каждый, а дома по дефолту, кажется 50мб. и там и сям вроде по одному redo в группе, т.е. условия относительно равные.ну вот возможно и на работе надо уменьшить до 50, чтобы например 3 группы занимали в райткеше стораджа 50*3, а не 500*3. Давайте 10046, отформатированную orasrp. Можете на почту скинуть, чтобы текст запросов не светить в интернет.
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38793723
joiner_plus
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
не, то что с ораклом я буду разбираться это понятно, надеюсь буду совместно с дба. там действительно куча нюансов, начиная со статистик, заканчивая меняющимися с каждым прогоном планами. мой тест сейчас синтетический, с захинтоваными фулсканами, больше для нагрузки писанины на строидж. тюнить этот скрипт особого смысла нет. сейчас я хочу понять похожи ли цифры sar/iostat на нормальный сторидж ? достигает ли приделов ио ? у меня вот полное ощущение, что netwind прав
netwindА как же ее поддать, если очередь заполнена всегда и любые попытки запустить еще процессов и подать запросов только приведут к блокировке этих процессов ?


не могу доказать цифрами, но ощущение, что если скрипты миграции запускать последовательно, они проходят быстрее, чем если их параллельно пускать и дело там точно не в блокировках, т.к. мигрируются не пересекающиеся по данным схемы. полное ощущение, что это особенности сториджа, который слишком умно шарит нагрузку с другими системами.
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38793732
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
joiner_plusне, то что с ораклом я буду разбираться это понятно, надеюсь буду совместно с дба. там действительно куча нюансов, начиная со статистик, заканчивая меняющимися с каждым прогоном планами. мой тест сейчас синтетический, с захинтоваными фулсканами, больше для нагрузки писанины на строидж. тюнить этот скрипт особого смысла нет. сейчас я хочу понять похожи ли цифры sar/iostat на нормальный сторидж ? достигает ли приделов ио ? у меня вот полное ощущение, что netwind прав
netwindА как же ее поддать, если очередь заполнена всегда и любые попытки запустить еще процессов и подать запросов только приведут к блокировке этих процессов ?
чего проще, берете fio и запускаете randread randwrite тесты, смотрите при какой глубине запросов наступает насыщение, чтобы время отклика оставалось < 10мс, смотрите iops-ы.

joiner_plusне могу доказать цифрами, но ощущение, что если скрипты миграции запускать последовательно, они проходят быстрее, чем если их параллельно пускать и дело там точно не в блокировках, т.к. мигрируются не пересекающиеся по данным схемы. полное ощущение, что это особенности сториджа, который слишком умно шарит нагрузку с другими системами.вполне возможно что при параллельности начинается драка за какой-то ресурс, буфферный кеш оракла, кеш стораджа, вплоть до io шедулера в линуксе.
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38949456
joiner_plus
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
продолжу тему. все тот же сторидж, примерно те же проблемы. заметил интересный момент, fullscan с его scattered read работает относительно стабильно, а Nested Loop может сторидж ввести в какое-то неадекватное состояние:
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
WAIT #47551526577264: nam='db file parallel read' ela= 469712 files=1 blocks=35 requests=35 obj#=202840 tim=1430307529023997
WAIT #47551526577264: nam='db file sequential read' ela= 5042 file#=70 block#=110095 blocks=1 obj#=202840 tim=1430307529029312
WAIT #47551526577264: nam='db file parallel read' ela= 429030 files=1 blocks=36 requests=36 obj#=202840 tim=1430307529458550
WAIT #47551526577264: nam='db file sequential read' ela= 15513 file#=70 block#=115549 blocks=1 obj#=202840 tim=1430307529474340
...

WAIT #47551526577264: nam='db file parallel read' ela= 282113 files=1 blocks=36 requests=36 obj#=202840 tim=1430307647942505
WAIT #47551526577264: nam='db file sequential read' ela= 13063 file#=70 block#=147065 blocks=1 obj#=202840 tim=1430307647955955
WAIT #47551526577264: nam='db file parallel read' ela= 324968 files=1 blocks=38 requests=38 obj#=202840 tim=1430307648281134
WAIT #47551526577264: nam='db file sequential read' ela= 4589 file#=70 block#=222885 blocks=1 obj#=202840 tim=1430307648285935
WAIT #47551526577264: nam='db file parallel read' ela= 264707 files=1 blocks=36 requests=36 obj#=202840 tim=1430307648550768
WAIT #47551526577264: nam='db file sequential read' ela= 6754 file#=70 block#=317855 blocks=1 obj#=202840 tim=1430307648557803
WAIT #47551526577264: nam='db file parallel read' ela= 245245 files=1 blocks=34 requests=34 obj#=202840 tim=1430307648803211
WAIT #47551526577264: nam='db file sequential read' ela= 6034 file#=70 block#=391838 blocks=1 obj#=202840 tim=1430307648809502
WAIT #47551526577264: nam='db file sequential read' ela= 7163 file#=69 block#=441851 blocks=1 obj#=202938 tim=1430307648816740
...

WAIT #47551526577264: nam='db file parallel read' ela= 125586 files=1 blocks=8 requests=8 obj#=202840 tim=1430308223051741
WAIT #47551526577264: nam='db file sequential read' ela= 16006 file#=69 block#=447849 blocks=1 obj#=202938 tim=1430308223067947
WAIT #47551526577264: nam='db file parallel read' ela= 412568 files=1 blocks=32 requests=32 obj#=202840 tim=1430308223480667
WAIT #47551526577264: nam='db file sequential read' ela= 40104 file#=70 block#=795 blocks=1 obj#=202840 tim=1430308223520875
WAIT #47551526577264: nam='db file parallel read' ela= 38108 files=1 blocks=4 requests=4 obj#=202840 tim=1430308223559067
WAIT #47551526577264: nam='db file sequential read' ela= 5571 file#=70 block#=541796 blocks=1 obj#=202840 tim=1430308223564796
WAIT #47551526577264: nam='db file sequential read' ela= 7274 file#=69 block#=448116 blocks=1 obj#=202938 tim=1430308223572151
как я понимаю ela совсем неадекватны.

Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
# sar -p -d 3 1000
08:02:21 AM       DEV       tps  rd_sec/s  wr_sec/s  avgrq-sz  avgqu-sz     await     svctm     %util
08:02:24 AM cciss/c0d0     18.60     13.29    446.51     24.71      0.01      0.32      0.23      0.43
08:02:24 AM cciss/c0d0p1      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
08:02:24 AM cciss/c0d0p2      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
08:02:24 AM cciss/c0d0p3      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
08:02:24 AM cciss/c0d0p4      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
08:02:24 AM cciss/c0d0p5      0.66      0.00     10.63     16.00      0.00      0.00      0.00      0.00
08:02:24 AM cciss/c0d0p6      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
08:02:24 AM cciss/c0d0p7      1.99      0.00     37.21     18.67      0.00      0.00      0.00      0.00
08:02:24 AM cciss/c0d0p8      9.63      0.00    231.23     24.00      0.00      0.21      0.07      0.07
08:02:24 AM cciss/c0d0p9      6.31     13.29    167.44     28.63      0.00      0.63      0.58      0.37
08:02:24 AM       sda     67.77    465.12   7755.48    121.29      0.80     11.73      8.59     58.24
08:02:24 AM       sdb     43.19    271.10   7859.14    188.25      0.46     10.68     10.30     44.49
08:02:24 AM       sdc     32.89     66.45   7960.13    244.04      0.35     10.79      7.72     25.38
08:02:24 AM       sdd     46.51    199.34   7750.17    170.91      0.54     11.56      7.38     34.32
08:02:24 AM     nodev   3980.07   1001.99  31324.92      8.12     47.27     11.88      0.25     99.60
08:02:24 AM     nodev   3980.07   1001.99  31324.92      8.12     47.30     11.88      0.25     99.63

08:03:21 AM       DEV       tps  rd_sec/s  wr_sec/s  avgrq-sz  avgqu-sz     await     svctm     %util
08:03:24 AM cciss/c0d0     63.21     16.05   1468.90     23.49      0.09      1.40      0.10      0.60
08:03:24 AM cciss/c0d0p1      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
08:03:24 AM cciss/c0d0p2      0.67      0.00     58.86     88.00      0.00      0.50      0.50      0.03
08:03:24 AM cciss/c0d0p3      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
08:03:24 AM cciss/c0d0p4      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
08:03:24 AM cciss/c0d0p5      5.35      0.00    109.70     20.50      0.00      0.31      0.06      0.03
08:03:24 AM cciss/c0d0p6      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
08:03:24 AM cciss/c0d0p7      2.34      0.00     45.48     19.43      0.00      1.29      0.57      0.13
08:03:24 AM cciss/c0d0p8      0.00      0.00      0.00      0.00      0.00      0.00      0.00      0.00
08:03:24 AM cciss/c0d0p9     54.85     16.05   1254.85     23.17      0.08      1.52      0.07      0.40
08:03:24 AM       sda     25.75    401.34      5.35     15.79      0.31     12.05     11.96     30.80
08:03:24 AM       sdb     21.40    342.47      0.00     16.00      0.26     12.09     12.09     25.89
08:03:24 AM       sdc     21.40    339.80      0.00     15.88      0.23     10.62     10.62     22.74
08:03:24 AM       sdd     19.73    299.67     21.40     16.27      0.21     10.56     10.51     20.74
08:03:24 AM     nodev     89.97   1383.28     26.76     15.67      1.01     11.19     11.13    100.17
08:03:24 AM     nodev     89.97   1383.28     26.76     15.67      1.01     11.19     11.13    100.17

я такие ситуации ловил именно когда с этого сервера другой нагрузки не было, и проверил, что своп не дергался
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38951407
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
WAIT #47551526577264: nam='db file parallel read' ela= 469712 files=1 blocks=35 requests=35 obj#=202840 tim=1430307529023997

35 блоков 469712 микросекунд, ну 0.01 сек на блок, для шпинделя не смертельно


WAIT #47551526577264: nam='db file sequential read' ela= 5042 file#=70 block#=110095 blocks=1 obj#=202840 tim=1430307529029312

1 блок 5042 микросекунд.

обработайте трассу orasrp и выложите статистику с планом запроса тогда и поржем
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38951415
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
есть утилита fio измеряйте http://habrahabr.ru/post/154235/
потом напишете админам что вашему приложению надо 100kiops при латенси 1мкс, а у вас 1kiops при 1мс
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38951589
joiner_plus
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
отфоматировал orasrp, суть вот такая

SecondsCalls Avg Min Maxdb file parallel read93.3% 3 320.1965s18.114 0.1833s 0.0000s 16.2891sdb file sequential read5.2%184.0852s18.4170.0100s 0.0000s 9.9448s

SecondsCalls Avg Min Maxdb file sequential read 5.0%1.7494s12.393 0.0001s 0.0000s 0.0461sdb file parallel read4.1%1.4279s18.522 0.0001s0.0000s0.1305s

получается так, утром запускаю запрос с хинтом Nested Loop, вижу чтения "медленные" (0.1833s). жделаю cancel запросу, ставлю хинт, что бы получился HashJoin получаю результат, убираю возвращаю хинт Nested Loop, запускаю запрос - чтения "быстрые" (0.0001s).
и так каждое утро, раз 5 проверял. мне кажется такое тяжело списать на загруженность сториджа.
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38951828
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
joiner_plusотфоматировал orasrp, суть вот такая

calls отличается, это nl и hash ? или nl и nl ? Из orasrp, дерево планом можете показать, для обоих случаев?


joiner_plusполучается так, утром запускаю запрос с хинтом Nested Loop, вижу чтения "медленные" (0.1833s). жделаю cancel запросу, ставлю хинт, что бы получился HashJoin получаю результат, убираю возвращаю хинт Nested Loop, запускаю запрос - чтения "быстрые" (0.0001s).
и так каждое утро, раз 5 проверял. мне кажется такое тяжело списать на загруженность сториджа.очень похоже на кеш или линукса или дискового массива. При nl надо все равно в таблицу ходить, причем построчно by rowid, после hashjoin оно все в кеше.
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38952346
joiner_plus
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Журавлев Денисcalls отличается, это nl и hash ? или nl и nl ? Из orasrp, дерево планом можете показать, для обоих случаев?

оба NL, планы в обоих случая идентичны:
Код: plaintext
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
HASH GROUP BY (cr=689,609 pr=435,849 pw=0 time=3,510.9411s cost=204,794 size=151,924 card=3,998)
  NESTED LOOPS OUTER (cr=689,609 pr=435,849 pw=0 time=4,633.6672s cost=204,756 size=3,647,582 card=95,989)
    TABLE ACCESS FULL TABLE1 (cr=22 pr=16 pw=0 time=0.0154s cost=15 size=71,964 card=3,998)
    TABLE ACCESS BY INDEX ROWID TABLE2 (cr=689,587 pr=435,833 pw=0 time=3,021.6227s cost=51 size=480 card=24)
      INDEX RANGE SCAN TABLE2_FK_I (cr=9,558 pr=4,727 pw=0 time=49.5160s cost=2 size=0 card=50)

HASH GROUP BY (cr=689,608 pr=244,941 pw=0 time=6.3544s cost=204,794 size=151,924 card=3,998)
  NESTED LOOPS OUTER (cr=689,608 pr=244,941 pw=0 time=8.0466s cost=204,756 size=3,647,582 card=95,989)
    TABLE ACCESS FULL TABLE1 (cr=22 pr=10 pw=0 time=0.0077s cost=15 size=71,964 card=3,998)
    TABLE ACCESS BY INDEX ROWID TABLE2 (cr=689,586 pr=244,931 pw=0 time=5.5439s cost=51 size=480 card=24)
      INDEX RANGE SCAN TABLE2_FK_I (cr=9,558 pr=4,871 pw=0 time=1.5111s cost=2 size=0 card=50)


Журавлев Денисочень похоже на кеш или линукса или дискового массива. При nl надо все равно в таблицу ходить, причем построчно by rowid, после hashjoin оно все в кеше.

да, наверно все таки кеш, мне сначала показалось, что
alter system flush buffer_cache;
каким-то образом стабильно превращает в "медленно", 5 раз пробовал, но сегодня flush не превратил в "медленно".
блин, не ужели 3,510.9411s на такой запрос это нормально ?
...
Рейтинг: 0 / 0
Какой сторидж подключен к серверу ?
    #38952390
Фотография Журавлев Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
joiner_plus INDEX RANGE SCAN TABLE2_FK_I (cr=9,558 pr=4,727 pw=0 time=49.5160s cost=2 size=0 card=50)
4,727 чтений за 49.5160s, 100iops , примерно пол-сата диска


joiner_plusда, наверно все таки кеш, мне сначала показалось, что
alter system flush buffer_cache;
каким-то образом стабильно превращает в "медленно", 5 раз пробовал, но сегодня flush не превратил в "медленно".
блин, не ужели 3,510.9411s на такой запрос это нормально ?кешируется где-то помимо оракла, либо в линуксе, либо в массиве.

joiner_plus3,510.9411s на такой запрос это нормально?
pr=435,833
pr=4,727
прочитано 4,727 блоков из индекса и 435,833 из таблицы при блоке=8кб, это 3.5Гигабайта, читая их рандомно дисковая подсистема тупила один час, дисковая говно -- это нормально.


Запрос я надеюсь искусственный, потому что TABLE2_FK_I как бы совсем не подходит, и ораклу приходится обмолачивать 5гигов (cr=689,608 при блоке 8кб ), для его выполнения.
...
Рейтинг: 0 / 0
26 сообщений из 26, показаны все 2 страниц
Форумы / Unix-системы [игнор отключен] [закрыт для гостей] / Какой сторидж подключен к серверу ?
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]