powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Oracle [игнор отключен] [закрыт для гостей] / Ваши любимые инструменты для анализа производительности
49 сообщений из 49, показаны все 2 страниц
Ваши любимые инструменты для анализа производительности
    #39487904
Valergrad
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Есть достаточно большой проект ( набор клиентских сервисов + БД ) на который собираются кратно увеличить нагрузку в виде обрабатываемых данных, хотя БД не сказать, что и сейчас отдыхает. Есть капасити для оптимизации проекта какая понадобится ( от тюнинга конкретных запросов, до изменения архитектуры и даже переписывания тормозящих кусков). Предварительно, конечно, нужно узнать слабые места, и уметь в дальнейшем быстро видеть какие ресурсы окажутся боттлнеками при увеличении нагрузки.
Следуя принципу "know your tools" - какие инструменты вы используете для анализа производительности на уровне сервера БД? Подозреваю, что многие скажут "пользуюсь отлаженным за годы набором запросов", но не использует ли кто-нибудь какой-нибудь GUI?
Наборы запросов, это, конечно, хорошо, но грамотный GUI нередко позволяет экономить свое время ( т.к. грамотно организованная графическая информация, гиперссылки и вкладки не зря придумали). Хотя и ссылка на хороший, тщательно отобранный пак диагностических запросов тоже будет в тему.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39487907
Фотография andrey_anonymous
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AWR не предлагать? Тогда statspack :)
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39487910
jan2ary
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
snapper
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39487912
Yo.!
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
для не шибко продвинутых или для мигрантов с других субд: quest spotlight

наглядно, стандартные косяки красиво подсвечивает. советую.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39487915
Valergrad
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
andrey_anonymous,

AWR/ASH - это исходные данные. Сырые. Тонны и тонны цифр и текста. GUI - это инструмент, который позволяет плавать в этих данных, не сбивая себе пальцы в кровь запросами. Мгновенно подсвечивая/выделяя важные места, аггрегируя/детализируя/переходя к подробностям/доставая дополнительную информацию/убирая ненужную информацию/рисуя графики, чарты и диаграммы по одному клику мышкой.
Гугл сходу предлагает разные ASH Viewer, Elastik + KIBANO солюшен и т.п., есть, полагаю десятки инструменты разной степени паршивости. Интересны мнения тех, кто что-то уже пробовал и чем пользуется.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39487919
recovery manager
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Valergrad,

Это все делает штатный оракловый Cloud Control.
Ну и плюс мозги, конечно же.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39487946
Фотография Vladimir Filin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
recovery manager Это все делает штатный оракловый Cloud Control.
Ну и плюс мозги, конечно же.
Поддерживаю обе рекомендации.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39488006
ORA__SQL
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Valergradно грамотный GUI нередко позволяет экономить свое время1. gui навряд ли поможет найти "root cause" (а делается это вручную без gui, и чем выше квалификация - тем быстрее и корректнее)
2. Не редко бывает так, что бизнес беспокоит запрос, который в awr не попал или просто не выделяется на фоне остальных (приходится вылавливать через v$)
3. Если базе совсем плохо (без конкретики, типа sql_id), то в 99% случаях сразу же приступаешь курить запросы и ожидания
4. gui если и можно использовать, то для того, чтобы сделать красивый скриншот :)
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39488355
Фотография Takurava
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
В ОЕМ отлично видны общие проблемы и легко понять с чего надо начинать. Да и потом на 95% можно найти проблему там же.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39488412
д0kХ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
ValergradЕсть достаточно большой проект ( набор клиентских сервисов + БД ) на который собираются кратно увеличить нагрузку в виде обрабатываемых данных, хотя БД не сказать, что и сейчас отдыхает. Есть капасити для оптимизации проекта какая понадобится ( от тюнинга конкретных запросов, до изменения архитектуры и даже переписывания тормозящих кусков). Предварительно, конечно, нужно узнать слабые места, и уметь в дальнейшем быстро видеть какие ресурсы окажутся боттлнеками при увеличении нагрузки.
Следуя принципу "know your tools" - какие инструменты вы используете для анализа производительности на уровне сервера БД? Подозреваю, что многие скажут "пользуюсь отлаженным за годы набором запросов", но не использует ли кто-нибудь какой-нибудь GUI?
Наборы запросов, это, конечно, хорошо, но грамотный GUI нередко позволяет экономить свое время ( т.к. грамотно организованная графическая информация, гиперссылки и вкладки не зря придумали). Хотя и ссылка на хороший, тщательно отобранный пак диагностических запросов тоже будет в тему.

Бейслайны, триггеры, комплексные экраны в оракловом профиле заббикс
начиная от нагрузки на CPU и диски , виртуальную память,
заканчивая сетевым трафиком.
Бейслайны Оракла по сессиям, ожидания, задержки стендбая ,
бекапы итд где то посредине.


По сработке триггеров ( инцидент) можно автоматом
отстегивать ссылку на сайт с AWR -ом для более глубокого расследования.
Мы пока не отстегиваем.

Но ближайших планах автоматизировать
отлов объектов БД по триггеру на ожидании buffer busy waits.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39488490
Фотография AmKad
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А я никогда ничего не анализирую. Я как на...ячу, а DBA пусть анализирует и оптимизирует.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39488519
Никанор Кузьмич
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ValergradГугл сходу предлагает разные ASH Viewer , Elastik + KIBANO солюшен и т.п., есть, полагаю десятки инструменты разной степени паршивости. Интересны мнения тех, кто что-то уже пробовал и чем пользуется.ASH Viewer пробовал, нравится, пользуюсь. Ну, насколько мозги позволяют
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39488569
Фотография Sergey_Korolev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Valergrad,

Давно и успешно используем lab128.com

Написано профессионалами по Performance Oracle , которые решают конкретные проблемы и поэтому знают, какой инструмент нужен.

Весит и стоит совсем немного на фоне цен продуктов для Oracle.
Хотя можно пользоваться и Trial. Работали в таком режиме года два, затем купили лицензию - Разработчик доделал наши "хотелки".
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39488844
Фотография kinky cat
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
oem, ash-awr, [pl/]sql developer, set events, strace/dtrace, vi ) вроде все, если чисто применительно к oracle, пока хватало) Еще есть конечно общемониторные тулзы, и у схдшников свои пироги, но это уже не моя ЗО )

авторБейслайны Оракла по сессиям, ожидания, задержки стендбая ,
бекапы итд где то посредине.
Завис немного на этой фразе, потом понял что тут другие бейслайны)
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39488874
д0kХ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
kinky catoem, ash-awr, [pl/]sql developer, set events, strace/dtrace, vi ) вроде все, если чисто применительно к oracle, пока хватало) Еще есть конечно общемониторные тулзы, и у схдшников свои пироги, но это уже не моя ЗО )

авторБейслайны Оракла по сессиям, ожидания, задержки стендбая ,
бекапы итд где то посредине.
Завис немного на этой фразе, потом понял что тут другие бейслайны)

У нас те, которые подразумеваются по топику - Performance Measurement Baseline (PMB).
А вы о каких других подумали ?
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39488877
Фотография kinky cat
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
д0kХ,
угадайте) у оракла не много вещей официально назвается baseline'ом
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39488886
д0kХ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
В терминологии забикса Performance Measurement Baseline (PMB) называются
atest_data - статистика изменений нагрузок.

Расследование инцедента начинается с формирования комплексного экрана , если его
еще не сущетсвует , в котором собраны бейслайны всех компонент с взаимным влиянием, друг на друга.

А вобще , шо это я тут офтоплю , это не оракл , это ITIL и ITSM.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39488936
д0kХ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
kinky catд0kХ,
угадайте) у оракла не много вещей официально назвается baseline'ом

Оракл в большестве случаев не является конечним продуктом ( информационной системой )
в бизнес и технологическом смысле, сам в себе .
Поэтому вопрос анлиза производительности должен быть комплексным по всей
информационной системе, в которой оракл один из компонент,
и поэтому производительность оракла отдельно я не рассматирваю.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39488955
д0kХ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
административно организационный офтопик
рентабельнее инвестировать в покупку или
собственнуюр разработку комплексой системы
мониторинга производительности и расследования инцидентов,
где админы эксплуатации бизнес приложений могут локализовать место проблем
с производительностью в том числе оракла и задавать конкретные вопросы
конкретным людям , чем устраивать широковещательную
рассылку проблемы сетевикам, железячникам, ДБА ......,
а те в свою очередь начинают играать этой расслыкой в пинг понг.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39488959
Фотография andrey_anonymous
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
д0kХа те в свою очередь начинают играать этой расслыкой в пинг понг.
К сожалению, именно так и будет.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39488972
д0kХ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
andrey_anonymousд0kХа те в свою очередь начинают играать этой расслыкой в пинг понг.
К сожалению, именно так и будет.

Нет, потому как у этого процесса цербер -
в лице руководителя службы эксплуатации,
и ему выдана сабля, котрой
он может сносить премию за игрую пинг понг
( залогированную в бейслайнах профнепригодность или
человеческие качества ( отсуствие конструктивизма) в процессе расследования).

Тяжело лепить горбатого , когда человека тыкают носом в тренд бейслайна,
в процессе расследовния, следить за которым прямая должностная обязанность этого человека.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489011
Фотография andrey_anonymous
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
д0kХНет, потому как у этого процесса цербер
Ну вот ситуация: начали падать выгрузки из оракеля в хранилище.
Тулза, выливающая данные, на середине выгрузки начала обижаться в логах на ORA-02396.
Разумеется, "Никто ничего не делал" (с) и "У нас все в порядке" tm
Все бейслайны в норме :)
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489038
д0kХ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
andrey_anonymousд0kХНет, потому как у этого процесса цербер
Ну вот ситуация: начали падать выгрузки из оракеля в хранилище.
Тулза, выливающая данные, на середине выгрузки начала обижаться в логах на ORA-02396.
Разумеется, "Никто ничего не делал" (с) и "У нас все в порядке" tm
Все бейслайны в норме :)


Наверное будет задан вопрос кто был инициатором
на основании какой информации был изменен профиль.
В звисимости от ответа на этот вопрос есть куча вариантов для действий,
начиная с пересмотра регламентов ,
заканчивая эскалацией инцидента в проблему
на уровень проектного офиса и разработчиков, с переформулирокой вопроса
бизнесовым языком :

У нас автотранспорт перестал укладывается
в лимиты бюджетов по ГСМ , покрывает ли повышение прибыли текущего периода
разницу фактических и забюджетированных затрат ?
Покрывает - отлично.
Не покрывает - скажите какие риски реализовались ?
.....
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489062
Фотография andrey_anonymous
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
д0kХandrey_anonymousВсе бейслайны в норме :)
Наверное будет задан вопрос кто был инициатором
на основании какой информации был изменен профиль.
В общем верно - в той ситуации именно решение DBA об установке idle_time в профиле приложения привела к спецэффекту.
Однако "веселые картинки" этого не покажут.
Лишь тот факт, что система была в ОПЭ и разработчик имел доступ ко всем компонентам + слышал кое что про администрирование позволила диагностировать проблему достаточно оперативно.
Случись такое в проме - не уверен, что решение вопроса заняло бы менее 2-х дней - и это при наличии при весьма компетентного "цербера" в конкретном случае.
Первый день был бы потрачен на пинг-понг между тремя подразделениями Заказчика и двумя - у подрядчика, второй - на согласование доступов разрабов на прод, диагностику и постановку DBA задачи на устранение.
Два дня * 5-6 человек => 10-12 человекодней на устранение примитивного косяка... а Вы говорите цербер... :)
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489076
д0kХ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
andrey_anonymousд0kХпропущено...

Наверное будет задан вопрос кто был инициатором
на основании какой информации был изменен профиль.
В общем верно - в той ситуации именно решение DBA об установке idle_time в профиле приложения привела к спецэффекту.
Однако "веселые картинки" этого не покажут.
Лишь тот факт, что система была в ОПЭ и разработчик имел доступ ко всем компонентам + слышал кое что про администрирование позволила диагностировать проблему достаточно оперативно.
Случись такое в проме - не уверен, что решение вопроса заняло бы менее 2-х дней - и это при наличии при весьма компетентного "цербера" в конкретном случае.
Первый день был бы потрачен на пинг-понг между тремя подразделениями Заказчика и двумя - у подрядчика, второй - на согласование доступов разрабов на прод, диагностику и постановку DBA задачи на устранение.
Два дня * 5-6 человек => 10-12 человекодней на устранение примитивного косяка... а Вы говорите цербер... :)

ДБА должен показать веселые картинки .
Смотрите вот пик бизнес активности внешних потребителей сервиса,
что бы не мешать бизнесу расти и зарабатывать деньги , я принял решение
притормозить внутренние регламентные процедуры не зарабатывающие деньги явным образом.
Ему скажут маладец , ты пока иди бери с полки пирожок ,
а мы сейчас у бизнес аналитиков спросим ,
заработывал ли бизнес на этой активности деньги ,
кто овнер проекта , и все ли риски он учел когда давал отмашку
запускать бизнес процесс ( услугу для клиента ) в продуктив.
Если это результат рекламной акции прорывного продукта
и виден стратегический бизнес профит
то забюджетировать инвестиции новое железо на основании расследования
инцидента сам Бог велел.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489079
MacDuck
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
авторВаши любимые инструменты для анализа производительности

Инструмент использую исключительно административный: от отечески-ласкового "Ну и чо натворили, придурки" и до...

А все эти AWR/CC/Spotlight - это для наивных или не в России.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489084
Фотография andrey_anonymous
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
д0kХДБА должен показать веселые картинки .
Смотрите вот пик бизнес активности внешних потребителей сервиса,
что бы не мешать бизнесу расти и зарабатывать деньги , я принял решение
притормозить внутренние регламентные процедуры не зарабатывающие деньги явным образом.
Это и будет ответ из серии "пинг-понг".
Просто потому, что установка idle_time в профиле активно работающего приложения не имеет никакого отношения ни к "пику бизнес-активности", ни - уж тем более - к "притормаживанию регламентных процедур".
Это скорее что-то из разряда "вставить запись в dual" в ранних версиях сервера.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489090
д0kХ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
andrey_anonymousд0kХДБА должен показать веселые картинки .
Смотрите вот пик бизнес активности внешних потребителей сервиса,
что бы не мешать бизнесу расти и зарабатывать деньги , я принял решение
притормозить внутренние регламентные процедуры не зарабатывающие деньги явным образом.
Это и будет ответ из серии "пинг-понг".
Просто потому, что установка idle_time в профиле активно работающего приложения не имеет никакого отношения ни к "пику бизнес-активности", ни - уж тем более - к "притормаживанию регламентных процедур".
Это скорее что-то из разряда "вставить запись в dual" в ранних версиях сервера.

Я не сталкивался с необходимостью установки
idle_time в профиле активно работающего приложения .
По этому не знаю причиин, мотивов, рисковых кейсов необходимости его установки.
Я предполагаю, что в любом действии есть разумная целесообразность.
и просто так никто ничего не делает в рамках делегированных
человеку должностных полномочий.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489099
д0kХ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Если кто то принял решение что то поменять , то для этого есть

2 категории причин .

1. Ранее расследованный инцидент.
2. Подкладывание соломы под риски
( что бы начать делать бекапы не обязательно сначала потерять данные).

То есть, нужно высянить в какую категорию попадает изменения
idle_time профиле.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489142
Фотография andrey_anonymous
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
д0kХ1. Ранее расследованный инцидент.
2. Подкладывание соломы под риски

Или просто желание отсечь простаивающие (idle) сессии.
Но выбранный механизм работает не совсем очевидным образом:
idle_time профиля - штука кумулятивная, потому сетевые задержки ( в составе sql*net message to/from client, more data to client) в процессе fetch курсора активной сессией "идут в зачет".
Для распараллеленного запроса в зачет идет даже ожидание координатором отклика от slave-ов.
Все это "добро" быстро аккумулируется в idle_time.
В итоге "active" сессия рубится "на ровном месте".

Я это все к тому, что не каждый инцидент может быть легко расследован на базе "картинок" под руководством "цербера".
Иногда картинки в норме, а система не работает.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489150
д0kХ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
andrey_anonymousд0kХДБА должен показать веселые картинки .
Смотрите вот пик бизнес активности внешних потребителей сервиса,
что бы не мешать бизнесу расти и зарабатывать деньги , я принял решение
притормозить внутренние регламентные процедуры не зарабатывающие деньги явным образом.
Это и будет ответ из серии "пинг-понг".
Просто потому, что установка idle_time в профиле активно работающего приложения не имеет никакого отношения ни к "пику бизнес-активности", ни - уж тем более - к "притормаживанию регламентных процедур".
Это скорее что-то из разряда "вставить запись в dual" в ранних версиях сервера.

административно организационный офтопик
Я ранее эту тему уже упоминал
20643814 ( наличие и остуствие конструктивазма в процессе расследования)
И дополнительно расшифровал 20644425
как принцип разумной целесообразности действий.

Если человек, которому делегированы полномочия ДБА,
принятия решений по изменению прараметров влияющих
на производительность и как результат на качество функционарования
информационный системы в целом, не усваивает
принцип разумной целесообразности действий
ему после Н го непонимания руководитель службы эксплуатации
цинично срезает премию саблей , до тех пор пока на рынке труда не найдется другой .
Планка ЗП ДБА начинается ОТ $2000 .
С меньшим порогом планки нет смысла делегировать человеку
полномочия ДБА потому, что описанная административно-организационная
бизнес модель перестанет работать.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489191
д0kХ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
andrey_anonymousд0kХ1. Ранее расследованный инцидент.
2. Подкладывание соломы под риски

Или просто желание отсечь простаивающие (idle) сессии.
Но выбранный механизм работает не совсем очевидным образом:
idle_time профиля - штука кумулятивная, потому сетевые задержки ( в составе sql*net message to/from client, more data to client) в процессе fetch курсора активной сессией "идут в зачет".
Для распараллеленного запроса в зачет идет даже ожидание координатором отклика от slave-ов.
Все это "добро" быстро аккумулируется в idle_time.
В итоге "active" сессия рубится "на ровном месте".

Я это все к тому, что не каждый инцидент может быть легко расследован на базе "картинок" под руководством "цербера".
Иногда картинки в норме, а система не работает.

Бизнесу ехать, а не шашечки, ДБА делегированы полномочия , он должен
решить проблему, либо коструктивно обосновать компенсационный
решение из смежной области совместно коллегами из других
технических областей, а цербер в этом процессе третийский судья.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489199
Фотография andrey_anonymous
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
д0kХон должен
решить проблему
Вопрос не в этом.
Вопрос - в диагностике когда "оно само" и у всех "все хорошо", включая "веселые картинки".
А также - о ценности "шашки" как диагностического инструмента.
Любой нормальный человек, оказавшись под "домокловой шашкой" не в первый раз, в первую очередь будет не решать проблему, а прикрывать пятую точку.
DBA не исключение - у них тоже хобби, семьи, дети.
А решение по прикрытию пятой точки не всегда совпадает с решением проблемы.
Отсюда - "пинг-понг".
И чем злее "судья" размахивает шашкой - те изощреннее "спортсмены" переводят стрелки.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489215
д0kХ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
andrey_anonymousд0kХон должен
решить проблему
Вопрос не в этом.
Вопрос - в диагностике когда "оно само" и у всех "все хорошо", включая "веселые картинки".
А также - о ценности "шашки" как диагностического инструмента.
Любой нормальный человек, оказавшись под "домокловой шашкой" не в первый раз, в первую очередь будет не решать проблему, а прикрывать пятую точку.
DBA не исключение - у них тоже хобби, семьи, дети.
А решение по прикрытию пятой точки не всегда совпадает с решением проблемы.
Отсюда - "пинг-понг".
И чем злее "судья" размахивает шашкой - те изощреннее "спортсмены" переводят стрелки.

В любых вопросах есть перегибы.

Шашка не есть диагностическим инструментом.

Шашка это административно организационный инструмент .

Что касается жен и детей , то ДБА или другой
админ наделенный полномочиями изменения конфигураций
должен иметь набор инструкций и документов
для круглосуточного дежурного персонала
проводить с ними обучения на тестовом окруждении,
выискивать себе помошников , инициировать их обчуения на курсах.
А не седеть на чемодане без ручки своей квалификации.
Как правило ДБА , которые не делятся знаниями с коллегами,
ищут повод продемострировать свою незаменимость ,
в конечном итоге не имеют времени на жен и детей.
Это их проблемы , а не проблемы цербера или организации.
Они будут иметь эти проблемы в любой организации.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489236
д0kХ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
andrey_anonymousд0kХон должен
решить проблему
Вопрос не в этом.
Вопрос - в диагностике когда "оно само" и у всех "все хорошо", включая "веселые картинки".


Если так, то опять же категоризируем.
Либо это реализация рисков,
либо оно не само ( другая категория рисков).

Задача собрать дополнительную информацию ,
что бы стало ясны причины какие риски реализовались.

Возвращаясь в топик в свете описанного, рентабельнее
инветсировать в собствнную систему мониторинга организации,
чем использоваать покупную.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489256
Фотография andrey_anonymous
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
д0kХдолжен иметь набор инструкций и документов
для круглосуточного дежурного персонала
И какое отношение имеет инструкция для ночных дежурных к решениям, принимаемым DBA?
Правильно, никакого.
DBA участвует в сочинении тех самых инструкций, согласно которым ночной дежурный должен действовать (как правило - это первичная классификация проблемы, регистрация инцидента и информирование ответственного).

Ну вот и смотрим предметно:
0. ДБА в рамках мероприятий по оптимизации-чего-то-там лепит idle_time.
1. Ночной дежурный (НД) регистрирует инцидент - в DWH полегли ETL по источнику "И", рестарт не помогает.
2. (НД) информирует ответственного за загрузку данных из "И" в DWH (ОDWH).
3. (НД) вписывает строчку в отчет и спокойно сдает смену.
4. (ОDWH) некоторое время тупит, затем чтит логи, видит "ORA-02396", понимает что раньше не встречал и отписывает ДБА "разберитесь там со своей базой"
5. (ДБА) отписывает "база работает штатно, картинки красивые, проблем нет"
6. (ОDWH) командует сотруднику ТП рестартовать процесс.
... проходит два часа, в течение которых идет выгрузка
7. (ТП) отписывает, что "в DWH полегли ETL по источнику "И", рестарт не помогает"
8. (ОDWH) видит "ORA-02396" и отписывает ДБА "разберитесь там со своей базой"
9. (ДБА) отписывает "база работает штатно, картинки красивые, проблем нет", ORA- обозначает, что аппликуха ничего не делает и потому отрубается по timeout - разбирайтесь в своем ETL сами.
10. (ОDWH) эскалирует проблему на руководителя ТП (РТП)
11. (РТП) привлекает техподдержку подрядчика (ПТП)
12. (ПТП) пишет, что подрядчик не проводил никаких работ, на тесте все отрабатывает штатно
13. (ОDWH) эскалирует проблему на руководителя ТП (РТП)
14. (РТП) ласково журит ТП подрядчика и грозит шашкой
15. (ПТП) в конечном итоге передает проблему на 3 линию... разрабам ETL, которые про idle_time и прочую dbaшню не в курсе.
16. (3 линия) отписывает, что проблема не воспроизводится.
17. (РТП) вспоминает, что были работы на сети и привлекает сетевиков
18. (Сетевики) ругаются и говорят, что их работы не имеют отношения к проблеме
19. (РТП) грозит шашкой
20. (Сетевики) ставят новый маршрутизатор и списывают расходы на бюджет ТП
21. (РТП) командует ODWH, тот командует ТП поднять процессы
22. (ТП) отписывает, что "в DWH полегли ETL по источнику "И", рестарт не помогает"
23. (ОDWH) эскалирует проблему на руководителя ТП (РТП)
24. (РТП) грозно машет шашкой и собирает очную ставку между руководителями подразделений
.... время идет, шторм крепчает, представители вендора рекомендуют пропатчиться и - желательно - обновить жлезку...

...в это время DBA осознает, что причина переполоха - п.0, а также то, что п.8 закрыл перед ним возможность корректно вырулить, не попав под "шашку".
И начинает операцию "прикрытие":
78. (DBA) Предлагаю рестартовать базу. Прошу согласовать окно 40 минут.
79-88 - идут согласования
89. (DBA) база рестартована, пробуйте.
90. (ОDWH) ...
91. (ТП) - заработало
92. (вендор, подрядчик, РТП хором) непонятный глюк, сам пришел, сам ушел, база "И" - говно, давайте патчиться/апгрейдиться
93. (DBA) ...пронесло... да и новую железку давно хотел...
Всеобщий консенсус и хеппиэнд :)
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489271
д0kХ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
andrey_anonymousд0kХдолжен иметь набор инструкций и документов
для круглосуточного дежурного персонала
И какое отношение имеет инструкция для ночных дежурных к решениям, принимаемым DBA?
Правильно, никакого.
DBA участвует в сочинении тех самых инструкций, согласно которым ночной дежурный должен действовать (как правило - это первичная классификация проблемы, регистрация инцидента и информирование ответственного).

Ну вот и смотрим предметно:
0. ДБА в рамках мероприятий по оптимизации-чего-то-там лепит idle_time.
1. Ночной дежурный (НД) регистрирует инцидент - в DWH полегли ETL по источнику "И", рестарт не помогает.
2. (НД) информирует ответственного за загрузку данных из "И" в DWH (ОDWH).
3. (НД) вписывает строчку в отчет и спокойно сдает смену.
4. (ОDWH) некоторое время тупит, затем чтит логи, видит "ORA-02396", понимает что раньше не встречал и отписывает ДБА "разберитесь там со своей базой"
5. (ДБА) отписывает "база работает штатно, картинки красивые, проблем нет"
6. (ОDWH) командует сотруднику ТП рестартовать процесс.
... проходит два часа, в течение которых идет выгрузка
7. (ТП) отписывает, что "в DWH полегли ETL по источнику "И", рестарт не помогает"
8. (ОDWH) видит "ORA-02396" и отписывает ДБА "разберитесь там со своей базой"
9. (ДБА) отписывает "база работает штатно, картинки красивые, проблем нет", ORA- обозначает, что аппликуха ничего не делает и потому отрубается по timeout - разбирайтесь в своем ETL сами.
10. (ОDWH) эскалирует проблему на руководителя ТП (РТП)
11. (РТП) привлекает техподдержку подрядчика (ПТП)
12. (ПТП) пишет, что подрядчик не проводил никаких работ, на тесте все отрабатывает штатно
13. (ОDWH) эскалирует проблему на руководителя ТП (РТП)
14. (РТП) ласково журит ТП подрядчика и грозит шашкой
15. (ПТП) в конечном итоге передает проблему на 3 линию... разрабам ETL, которые про idle_time и прочую dbaшню не в курсе.
16. (3 линия) отписывает, что проблема не воспроизводится.
17. (РТП) вспоминает, что были работы на сети и привлекает сетевиков
18. (Сетевики) ругаются и говорят, что их работы не имеют отношения к проблеме
19. (РТП) грозит шашкой
20. (Сетевики) ставят новый маршрутизатор и списывают расходы на бюджет ТП
21. (РТП) командует ODWH, тот командует ТП поднять процессы
22. (ТП) отписывает, что "в DWH полегли ETL по источнику "И", рестарт не помогает"
23. (ОDWH) эскалирует проблему на руководителя ТП (РТП)
24. (РТП) грозно машет шашкой и собирает очную ставку между руководителями подразделений
.... время идет, шторм крепчает, представители вендора рекомендуют пропатчиться и - желательно - обновить жлезку...

...в это время DBA осознает, что причина переполоха - п.0, а также то, что п.8 закрыл перед ним возможность корректно вырулить, не попав под "шашку".
И начинает операцию "прикрытие":
78. (DBA) Предлагаю рестартовать базу. Прошу согласовать окно 40 минут.
79-88 - идут согласования
89. (DBA) база рестартована, пробуйте.
90. (ОDWH) ...
91. (ТП) - заработало
92. (вендор, подрядчик, РТП хором) непонятный глюк, сам пришел, сам ушел, база "И" - говно, давайте патчиться/апгрейдиться
93. (DBA) ...пронесло... да и новую железку давно хотел...
Всеобщий консенсус и хеппиэнд :)

После пункта я не читал
автор4. (ОDWH) некоторое время тупит, затем чтит логи, видит "ORA-02396", понимает что раньше не встречал и отписывает ДБА "разберитесь там со своей базой"

Ибо система мониторинга должна уведомить сменного дежурного
конкретным сообщением ORA-ХХХХ в точках взаимодействия информационных систем.

Если не уведомила , то ДБА вместе с админом системы мониторинга
получают задачу организовать реализацию
соотвествующие бейслайны и триггеры и им даются для этого полномочия
и определенные ресурсы.

Если при повторении ORA-ХХХХ
сменный дежурный не смог ее самостоятельно закрыть
или неправильно смаршрутизировал проблему,
цербер проверяет наличие сабли и возможность
( потенцильную необходимость в зависимости от обстоятельств )
ее применения при следуещем ORA-ХХХХ в данной точке взаимодействия .
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489290
д0kХ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Системный Администратор ( сетевик железячник или или ДБА, не важно)
- синоним слова менеджер , у каждого из них есть
набор делегированных им полномочий отвественности и доступных ресурсов .
а в команде их общий набор полномочий шире.
Если они не могут разобраться со своими полномочиями и ресурсами ,
в силу человеческих качества каждого ( кто то недоговорспособен), то
рано или поздно челевеческие качества ( недоговроспособность )
вылазят при взаимодействии в разных задачах, и разными людьми и тогда цербер
достает свою саблю.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489347
д0kХ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
andrey_anonymous...в это время DBA осознает, что причина переполоха - п.0, а также то, что п.8 закрыл перед ним возможность корректно вырулить, не попав под "шашку".
И начинает операцию "прикрытие":

78. (DBA) Предлагаю рестартовать базу. Прошу согласовать окно 40 минут.
79-88 - идут согласования
89. (DBA) база рестартована, пробуйте.
90. (ОDWH) ...
91. (ТП) - заработало
92. (вендор, подрядчик, РТП хором) непонятный глюк, сам пришел, сам ушел, база "И" - говно, давайте патчиться/апгрейдиться
93. (DBA) ...пронесло... да и новую железку давно хотел...

Всеобщий консенсус и хеппиэнд :)

При правильно построенных ITIL & ITSM процессах ,
когда все коллеги Админы видят в системе мониторинга ORA-02396
и могут ее нагуглить , как это сделал я никогда до этого с ней не персекавшийся
у ДБА с мозгами нет смысла усугулять
совое положение "планом прикрытие" .

У него даже не возникнет мысли п 8 сказать база работает нормально

Потому, что с большой долей вероятности кто то из дежурной смены
с амбициями вырости в ДБА, или пройти собеседования на ДБА
в другой канторе , нагуглить потенциальные причины и опишет их в отчете.

ДБА поставлен не для того, что бы смотреть в красивые отчеты,
а для тоого что бы совместно со службой мониторинга их создавать,
писать регламентные инсрукции инженера более низкого уровня,
, править параметры базы для улучшения качества работы бизнес процессов.

Поэтому еще раз повторю свою ИМХО позицию переходя от фотопика в топик.
Бизнес организации не выгодно инвестировать в производителей систем
мониторинга, а рентабельнее создавать свою ИТ интеллектуальную собственность.

ITIL & ITSM это не результат,
это непрерывный технологический и административно- организационный процесс.
Его нельзя купить и пользоваться,
откупаясть от рисков платой за саппорт производителю ПО.
Производители которые создают системы мониторинга не могут
подложить солому под все возможные риски клиентов,
что бы их вовремя отмониторить, это физически невозможно независимо
от цены продаваемого ими решения обеспечивающего ITIL & ITSM процессы .
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489379
onitir
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489522
Valergrad
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Пока разговор не ушел в сторону срачей - попробую подытожить что уже есть.

Spotlight - когда-то давно пользовался, лет 8 назад. Если с тех пор ничего не изменилось, то это скорее админская вещь для повседневного мониторинга/алертинга. А не для нахождения руткозов проблем при стресс-тестировании.

snapper - насколько я понимаю он дает тот же AWR функционал что в 11g EE уже наличествует ( может дело в опциях, но они в общем, у нас есть). Дает ли snapper что-нибудь сверх этого? Вероятно, нет.

OEM - возможно. Правда, сколько я ни пытался начать им пользоваться, мне всегда функционал казался дико скудным по сравнению с тем, что можно получить напрямую запросами. Возможно, я не умею им пользоваться. Возможно, там все полезное запрятано в неочевидных местах. Возможно, кто-то может скинуть хороший обучающий материал как это найти. Возможно, дело в том, что Cloud Control у нас 10-й версии еще, почему-то.

заббикс - интересная вещь. Но кажется что это сугубо админская вещь, или я неправ?

ASH Viewer - получен 1 положительный отзыв.

lab128.com - получен 1 положительный отзыв. Возможно, неплохая вещь, но платная, при этом скриншоты выглядят....ну очень вырвиглазно. Делалось, судя по скриншотам, лет 15 назад и с тех пор не обновлялось. Я понимаю, что дело не в красоте, но ведь за 15 лет и в самом оракле многое что изменилось, и если программа не обновляется вряд ли она может быть лучшей?

Всем высказавшимся - спасибо.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489635
д0kХ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Valergrad
заббикс - интересная вещь. Но кажется что это сугубо админская вещь, или я неправ?





Да,
он быстро учится выполнять sql запросы и читать логи на предмет ORA-XXXX
и прочих абракадабр, на которые должна реагировать система мониторинга.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489686
Фотография mefman
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Valergradlab128.com - получен 1 положительный отзыв. Возможно, неплохая вещь, но платная, при этом скриншоты выглядят....ну очень вырвиглазно. Делалось, судя по скриншотам, лет 15 назад и с тех пор не обновлялось. Я понимаю, что дело не в красоте, но ведь за 15 лет и в самом оракле многое что изменилось, и если программа не обновляется вряд ли она может быть лучшей?

Обновляется регулярно. Последнее обновление - май 2017. Есть 20дневный триал(нужно лайкнуть их на фейсбуке). В триале полноценная версия ПО. По истечению 20 дней - лайкаешь их еще раз и снова пользуешься 20 дней.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489877
Фотография Scott Tiger
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
andrey_anonymous4. (ОDWH) некоторое время тупит, затем чтит логи, видит "ORA-02396", понимает что раньше не встречал и отписывает ДБА "разберитесь там со своей базой"

Такого ОDWH, по-хорошему, надо гнать в шею, ибо сообщение об ошибке достаточно информативное, чтобы и понять суть наблюдаемого явления, и сформулировать правильный вопрос для ДБА. Ибо если человек умеет читать логи, он должен понимать, что там написано. Впрочем, я бы и ночного дежурного гнал за перезапуск процесса без понимания сути сбоя.
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39489933
Фотография andrey_anonymous
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Scott Tigerнадо гнать в шею
...я бы и ночного дежурного гнал
Оно понятно.
Пофиг, что DWH и близко не oracle, пофиг что ETL тоже далеко не orcle-овый - все люди должны уметь понимать ORA-xxxx.
Да-да, конечно, не поспоришь.
Каждая уборщица обязана уметь указать пальцем на причину проблем в сложносочиненной корпоративной информационной системе, состоящей из нескольких десятков отдельных ИС от разных вендоров.
Жестко стелете, коллега.
...если посмотреть текст ошибки, не являясь профильным специалистом по Oracle RDBMS, то он ничего особенного не говорит - под описание подходит и сетевой сбой, и косяк утилиты, выгружающей данные, и настройка сервера БД.

...дело не в конкретном сценарии, который носит откровенно синтетический характер, хоть и на основе многолетних наблюдений.
Дело в резких и решительных ребятах, всегда на 100% точно знающих, кого конкретно надо казнить, чтобы все было хорошо - в отделе, в компании, в стране.
Тоска...
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39490583
Фотография Scott Tiger
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
andrey_anonymousКаждая уборщица обязана уметь указать пальцем на причину проблем в сложносочиненной корпоративной информационной системе, состоящей из нескольких десятков отдельных ИС от разных вендоров.

Уборщицы логи обычно не читают, а упомянутый ОDWH - читает, более того - может сопоставить ошибку приложения и ошибку при работе с СУБД и заключить, что ошибка при работе с СУБД вызвала сбой приложения. Далее он может и должен прочитать описание ошибки, которое звучит как "A user has exceeded the maximum time allowed to remain idle.", понять, что без других сопровождающих ошибок получение этой ошибки говорит о том, что подключение к СУБД было закрыто самой СУБД явно и штатно по неактивности пользовательской сессии, и задать ДБА вопрос "Действительно ли у нас отключаются неактивные пользователи, и, если да, то почему?", в крайнем случае - вытребовать от ДБА пояснения сути ошибки. При помощи поисковых систем в сети Интернет он может понять, как получить ответ на все вопросы, кроме "почему".

andrey_anonymousЖестко стелете, коллега.
...если посмотреть текст ошибки, не являясь профильным специалистом по Oracle RDBMS, то он ничего особенного не говорит - под описание подходит и сетевой сбой, и косяк утилиты, выгружающей данные, и настройка сервера БД.

Нет, не подходит. Ошибка (ее описания в документации достаточно) и контекст её появления вполне однозначно указывает, что отключение было управляемым и штатным по достижению сконфигурированного предела idle time. Не являясь профильным специалистом, ОDWH может не знать, как проверить и настроить лимиты в профайле и/или зачем этот функционал вообще нужен, но минимальную диагностику провести обязан. Иначе это не ответственный за загрузку данных, а уборщица на большой зарплате.

andrey_anonymous...дело не в конкретном сценарии, который носит откровенно синтетический характер, хоть и на основе многолетних наблюдений. Дело в резких и решительных ребятах, всегда на 100% точно знающих, кого конкретно надо казнить, чтобы все было хорошо - в отделе, в компании, в стране.
Тоска...

Меня просто задело за больное, благо синтетический пример очень близок к жизни :) Уже много лет я ежедневно занимаюсь разными аспектами траблшутинга в большом количестве крайне разнообразно устроенных организаций и описанный сценарий, к большому сожалению, в последнее время разыгрывается всё чаще и чаще. Причины понятны: вместо накопления и развития компетенций по используемым продуктам накапливаются лицензии, контракты в поддержке, уборщицы-сисадмины, ИГИЛITIL-коучи и "эффективные менеджеры", в результате элементарные проблемы решаются месяцами вместо часов, если вообще решаются, на что тратятся тонны денег и времени. Но вы все сами знаете...
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39490595
Фотография andrey_anonymous
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Scott Tigerandrey_anonymousнадо казнить, чтобы все было хорошо
Меня просто задело за больное, благо синтетический пример очень близок к жизни :) Но вы все сами знаете...
Обратите внимание на Аксиомы 2 и 3 по указанной ссылке :)
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39491140
Фотография Sayan Malakshinov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Модератор форума
Valergradsnapper - насколько я понимаю он дает тот же AWR функционал что в 11g EE уже наличествует ( может дело в опциях, но они в общем, у нас есть). Дает ли snapper что-нибудь сверх этого? Вероятно, нет.session snapper Подера? Да, дает больше чем просто ASH/AWR, как минимум потому что он семплирует намного чаще. Еще пользуюсь Latchprofx от него же и переделанными под себя его скриптами такими как asqlmon, rtsm...

ValergradASH Viewer - получен 1 положительный отзыв.и еще один голос от меня: очень удобно носить его всегда с собой и иметь ASH даже там, где его нет.

Но в итоге, для себя свой набор скриптов всегда намного удобнее, хотя было бы идеальным иметь какой-то еще один общий стандартный для всех набор скриптов, типа @?/rbmds/admin/..., чтобы когда оказываешь кому-то помощь, можно было просто просить выполнить какой-то конкретный скрипт из этого набора. Но пока этого нет приходится либо просить присылать целиком экспорты AWR, либо отправлять на выполнение свой скрипт, либо просить скачать SQLd360/eDB360...
...
Рейтинг: 0 / 0
Ваши любимые инструменты для анализа производительности
    #39491223
Valergrad
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
xtenderхотя было бы идеальным иметь какой-то еще один общий стандартный для всех набор скриптов

Так давайте создадим git repу, дадим права мержить пулл-реквесты уважаемым чувакам в виде Льюиса, Гейста, Осборна, вас и т.п. и будем обновлять.
...
Рейтинг: 0 / 0
49 сообщений из 49, показаны все 2 страниц
Форумы / Oracle [игнор отключен] [закрыт для гостей] / Ваши любимые инструменты для анализа производительности
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]