|
Профайлинг хадуп-кластера
|
|||
---|---|---|---|
#18+
Всем добрый день. Кто знает как сделать профайлинг всего выполняющегося mapreduce/spark и другого java-кода всех вместе взятых java-процессов в кластере? Имеется в виду следующее (объясняю на примере): если у нас обычное java-приложение, мы запустим yourkit profiler, посмотрим на дерево вызовов методов и % процессорного времени, занимаемого методом. А дальше можем найти тормоз, оптимизируя это место. Когда мы написали mapreduce job, запустили в кластере, и видим, что результат тупит, мы бы тоже хотели посмотреть на то что и где тупит - какой кусок кода. Может быть что наш map и редьюс выполняется 10% времени, а 90% - Фреймворк (и ничего не поделаешь), а может 90% CPU жрет наш map, в котором неоптимально сделан поиск подстрочки в строчке. Вот было бы хорошо, если бы существовал аналог yourkit, который бы inject-ился во все java-процессы, собирал статистику и писал куда-то. А потом чем-то просмотрели и увидели тормоза. Вопрос: есть такое? Прошу не критиковать подход, типа "ты что, не понимаешь что это тормознет выполнение всего?" - понимаю; и понимаю что запуск такой штуки надо делать на тестовом кластере, или с согласованием с заказчиком. Вопрос сейчас стоит "а есть ли такая штука?" Всем, кто что-то знает по этому вопросу - буду очень признателен за любую информацию. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.06.2015, 20:38 |
|
Профайлинг хадуп-кластера
|
|||
---|---|---|---|
#18+
Вот уж не думал, что буду сам отвечать на свой же вопрос. Нашел два подхода: http://blog.factual.com/profiling-hadoop-jobs-with-riemann и https://codeascraft.com/2015/01/14/introducing-statsd-jvm-profiler-a-jvm-profiler-for-hadoop/ + https://codeascraft.com/2015/05/12/four-months-of-statsd-jvm-profiler-a-retrospective/ Первый удалось воплотить - было сложно в плане настройки. Riemann не понравился потому что нет тотальной статистики в виде flame chart. Пожалел, что пошел первым путем, поэтому двигаюсь по второму пути - statsd. Перспективы намного лучше, поскольку есть шанс получить вот это http://www.brendangregg.com/FlameGraphs/cpu-bash-flamegraph.svg (детально описано тут ... |
|||
:
Нравится:
Не нравится:
|
|||
19.07.2015, 18:57 |
|
Профайлинг хадуп-кластера
|
|||
---|---|---|---|
#18+
И вот наконец результат моих трудов: http://ihorbobak.com/index.php/2015/08/05/cluster-profiling/ буду благодарен за фидбеки. ... |
|||
:
Нравится:
Не нравится:
|
|||
05.08.2015, 12:39 |
|
Профайлинг хадуп-кластера
|
|||
---|---|---|---|
#18+
Игорь Бобак, Супер, плохо, что все на английском ( ... |
|||
:
Нравится:
Не нравится:
|
|||
16.11.2015, 17:49 |
|
Профайлинг хадуп-кластера
|
|||
---|---|---|---|
#18+
кириллkИгорь Бобак, Супер, плохо, что все на английском ( а на каком должно быть? apache -> апачьЁ profiler -> профайлер ... ... |
|||
:
Нравится:
Не нравится:
|
|||
16.11.2015, 19:37 |
|
|
start [/forum/topic.php?fid=48&msg=39010804&tid=1856785]: |
0ms |
get settings: |
13ms |
get forum list: |
15ms |
check forum access: |
5ms |
check topic access: |
5ms |
track hit: |
48ms |
get topic data: |
13ms |
get forum data: |
3ms |
get page messages: |
62ms |
get tp. blocked users: |
2ms |
others: | 15ms |
total: | 181ms |
0 / 0 |