Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Java [игнор отключен] [закрыт для гостей] / Зачем нужен спарк? :) / 10 сообщений из 10, страница 1 из 1
16.03.2017, 11:37
    #39420615
natanabrahamjr
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Зачем нужен спарк? :)
Собссно вопрос такой, попросили написать простенькое приложение под спарк стриминг. ну там собирает какие то данные с броукера, неким образом перерабатываются и результаты скидываются в базу.

Написал.. обычное стандалон, т.е. слушает порт брокера, собирает, выкладывает. окей. работает. потом говорят "запусти на кластере". хорошо, гружу спарк кластер поднимаю, через спарк-субмит тоже самое приложение. запускается, работает, собирает, выкладывает.. в самом спарк-стриминге в вебконсоли какие то циферки бегут. я подумал.. может я что-то неправильно сделал? открываю туториалы, смотрю примеры приложений - нет всё так же. внутри приложения описывают коннекшн к потоку, адрес-порт брокера. и т.п.. оно просто запускается в кластере и всё.. Что я делаю не так? зачем он тогда вообще нужен? Какую роль он выполняет, если приложение и так само может работать? у меня складывается ощущение, что я что-то сделал, оно даже работает, но я никак не въеду как оно работает.
...
Рейтинг: 0 / 0
16.03.2017, 11:52
    #39420627
забыл ник
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Зачем нужен спарк? :)
В чем вопрос решительно непонятно
...
Рейтинг: 0 / 0
16.03.2017, 11:55
    #39420631
забыл ник
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Зачем нужен спарк? :)
Спарк это по факту имплементация лямбда архитектуры. Имеет смысл использовать если у вас реально МНОГО данных, из коробки обеспечивает отказоустойчивость и масштабируемость(ну во всяком случае так заявляется). Если у вас 30событий в секунду и меньше, заморачиваться не стоит на мой взгляд
...
Рейтинг: 0 / 0
16.03.2017, 11:57
    #39420633
Blazkowicz
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Зачем нужен спарк? :)
natanabrahamjr,

Приложение может само по себе работать в кластере? Само себя запустит на нодах и соберет результат?
...
Рейтинг: 0 / 0
16.03.2017, 12:24
    #39420675
dimonz80
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Зачем нужен спарк? :)
natanabrahamjrСобссно вопрос такой, попросили написать простенькое приложение под спарк стриминг. ну там собирает какие то данные с броукера, неким образом перерабатываются и результаты скидываются в базу.

Написал.. обычное стандалон, т.е. слушает порт брокера, собирает, выкладывает. окей. работает. потом говорят "запусти на кластере". хорошо, гружу спарк кластер поднимаю, через спарк-субмит тоже самое приложение. запускается, работает, собирает, выкладывает.. в самом спарк-стриминге в вебконсоли какие то циферки бегут. я подумал.. может я что-то неправильно сделал? открываю туториалы, смотрю примеры приложений - нет всё так же. внутри приложения описывают коннекшн к потоку, адрес-порт брокера. и т.п.. оно просто запускается в кластере и всё.. Что я делаю не так? зачем он тогда вообще нужен? Какую роль он выполняет, если приложение и так само может работать? у меня складывается ощущение, что я что-то сделал, оно даже работает, но я никак не въеду как оно работает.

Spark нужен когда данные не то что в ОЗУ а на диск не влазят, а работать с ними хочется как с простыми коллекциями, юзая все эти ваши filter/map/fold/reduce etc
...
Рейтинг: 0 / 0
16.03.2017, 12:52
    #39420693
natanabrahamjr
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Зачем нужен спарк? :)
Blazkowicznatanabrahamjr,

Приложение может само по себе работать в кластере? Само себя запустит на нодах и соберет результат?
ну ты можешь просто написать с подключенными спаркбиблиотеками обычное консольное джава приложение, которое будет работать само по себе как скажешь. а можно его же запустить через кластер )) я не понимаю в упор что дает запускание приложения через кластер. он что-то как то по-другому там исполняет?
...
Рейтинг: 0 / 0
16.03.2017, 14:20
    #39420801
natanabrahamjr
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Зачем нужен спарк? :)
я решительно не понимаю какую функцию выполняет спарк стриминг, если внутри джарника ты сам указываешь ему куда (в моем случае - кафка) стучаться ( для получения данных.
...
Рейтинг: 0 / 0
16.03.2017, 16:35
    #39420931
Leonid Kudryavtsev
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Зачем нужен спарк? :)
А можно вопрос: что такое спарк?
И можно ли ссылку?

я решительно не понимаю какую функцию выполняет спарк стриминг, если внутри джарника ты сам указываешь ему куда (в моем случае - кафка) стучаться ( для получения данных.
Честно говоря, я этого не понимаю для 90% продвинутых технологий в последние лет 10
...
Рейтинг: 0 / 0
16.03.2017, 16:40
    #39420939
Blazkowicz
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Зачем нужен спарк? :)
...
Рейтинг: 0 / 0
16.03.2017, 22:12
    #39421086
mayton
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Зачем нужен спарк? :)
natanabrahamjr, Spark, насколько я понимаю учел недостатки Hadoop.
А именно - ввел нормальные типы данных с человеческим лицом.
Добавил Stream-style разработки. А также поддежку языка Scala.
Все учебные примеры из книг по Spark смотрятся достаточно
компактно в отличие от Хадуп, где надо тонну кода написать
чтобы сделать простейший маппинг со сверткой.

Вообще, чтобы понять зачем нужен такой стек технологий нужно
как-то начать с основ. Я и сообщество не сможем рассказать тебе
преимущество Spark потому-как преимущества познаются в сравнениях.

Кроме того эти фреймворки создавались для задач с big-datа и если у тебя
нет этих самых больших данных то нет никакого смысла юзать Спарк.
Возможно тебе можно решить задачу просто на коллекциях в heap.
...
Рейтинг: 0 / 0
Форумы / Java [игнор отключен] [закрыт для гостей] / Зачем нужен спарк? :) / 10 сообщений из 10, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]