Новые сообщения [новые:0]
Дайджест
Горячие темы
Избранное [новые:0]
Форумы
Пользователи
Статистика
Статистика нагрузки
Мод. лог
Поиск
|
15.07.2021, 21:12
|
|||
---|---|---|---|
spark stream kafka debug |
|||
#18+
Салют! Подскажите, кто, как дебажит стриминг из кафки? Спасибо! ... |
|||
:
Нравится:
Не нравится:
|
|||
|
16.07.2021, 17:25
|
|||
---|---|---|---|
spark stream kafka debug |
|||
#18+
мигель1, дебажить спарк ? даже на уровне идеи кажется сомнительной идея. думаю подавляющее большинство тупо смотрит spark ui и логи. ... |
|||
:
Нравится:
Не нравится:
|
|||
|
21.09.2021, 05:23
|
|||
---|---|---|---|
spark stream kafka debug |
|||
#18+
мигель1, дебагером. А как еще? >дебажить спарк ? даже на уровне идеи кажется сомнительной идея. >думаю подавляющее большинство тупо смотрит spark ui и логи. Это еще почему? Программы для спакра не только дебажить, их еще и тестрировать можно (и нужно), юнит тестами. ... |
|||
:
Нравится:
Не нравится:
|
|||
|
21.09.2021, 08:38
|
|||
---|---|---|---|
spark stream kafka debug |
|||
#18+
Apex Это еще почему? Программы для спакра не только дебажить, их еще и тестрировать можно (и нужно), юнит тестами. юнит тесты не тестируют стриминг, они тестируют методы логики на совсем простеньких датасетах. я полагаю тут вопрос был про стриминг и к примеру падающие экзекьютеры из-за перекоса прилетающих данных. а логику, да. можно и локально отладить/подебажить. ... |
|||
:
Нравится:
Не нравится:
|
|||
|
24.09.2021, 11:43
|
|||
---|---|---|---|
spark stream kafka debug |
|||
#18+
Ещё накину плюсов к предложению выше: spark ui и логи . У нас стриминг из EventHub на DataBricks (PySpark) из-за ограниченности операций над стриминговыми батчами датасетов приходилось вводить дополнительные строки для вывода в логи (driver log , в самом notebook, или вообще отдельно в файл или базу) в самом notebook есть состояние стрима (продолжительность батча, время начала, кол-во событий в нём) если батч подвис (нода на кластере глючит {ganglia, gc в driver log, и пр.) - то сразу видно по аномалии времени исполнения. на Spark UI операции тоже видны - состояние, продолжительность, ошибки (с полной java детализацией), планы исполнения ну и стандартный Python-овский (в нашем случае вместо Scala) Try/Except тоже в некоторых местах для стриминга вполне справляется.. ... |
|||
:
Нравится:
Не нравится:
|
|||
|
|
start [/forum/topic.php?fid=48&mobile=1&tid=1856519]: |
0ms |
get settings: |
10ms |
get forum list: |
15ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
36ms |
get topic data: |
13ms |
get forum data: |
3ms |
get page messages: |
51ms |
get tp. blocked users: |
2ms |
others: | 11ms |
total: | 149ms |
0 / 0 |