Гость
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Какие знания Scala нужны, чтобы работать в Spark? / 6 сообщений из 6, страница 1 из 1
01.12.2021, 14:33
    #40116441
sysn1k
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какие знания Scala нужны, чтобы работать в Spark?
Здравствуйте! Я джун.
Недавно перешел из MS SQL + python(pandas) на Spark.

Нужно писать Spark job-ы (переместить данные, проанализировать данные) на Scala. Сейчас начал изучать Scala.
Нужно ли мне вдаваться во все тяжкие, чтобы познать и освоить ООП Scala или все таки для работы в Spark достаточно уметь применять местные RDD-команды и вдаваться в полиморфизм, абстрактные классы, в защиту от переопределения и т.д. не нужно, это необходимо больше для разработчиков Scala?

На Python писал в стиле ФП.
...
Рейтинг: 0 / 0
01.12.2021, 17:51
    #40116494
vikkiv
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какие знания Scala нужны, чтобы работать в Spark?
sysn1k,

чтобы удостовериться - PySpark не предлагать?
мне вполне хватает и вполне нормально работает с другими питоновскими библиотеками (Pandas и пр.)
...
Рейтинг: 0 / 0
01.12.2021, 18:11
    #40116499
sysn1k
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какие знания Scala нужны, чтобы работать в Spark?
vikkiv,

изначально на PySpark учился. На нынешней работе нужно уже на Scala писать.
...
Рейтинг: 0 / 0
01.12.2021, 18:24
    #40116504
H5N1
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какие знания Scala нужны, чтобы работать в Spark?
sysn1k


изначально на PySpark учился. На нынешней работе нужно уже на Scala писать.


зависит от канторы, кто-то пишет ноутбуки, я сходу и не могу определить скала это или питончик.
а есть те кто из жава шли и воротят все по полной программе - сплошные flatmap и внутри жесть по плоной. учи скалу, там платят x2. не ошибешься.
...
Рейтинг: 0 / 0
01.12.2021, 20:13
    #40116539
Дедушка
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какие знания Scala нужны, чтобы работать в Spark?
Как только перед вами встанет вопрос о действительно серьёзных и производительных пайплайнах вопрос о PySpark отпадёт сам собой.
sysn1k
Нужно ли мне вдаваться во все тяжкие
Для начала вам хватит основных конструкций языка (просто открываете доку по программированию Spark и смотрите примеры на Scala), более важно понять сами паттерны и принципы написания джобов под Spark.
Но как только сложность ваших трансформаций увеличится и вы начнёте писать функции, то вам понадобится вся Scala (ну почти), если только вы будете стремиться к поддерживаемости и производительности ваших пайплайнов.
...
Рейтинг: 0 / 0
02.12.2021, 02:44
    #40116598
vikkiv
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какие знания Scala нужны, чтобы работать в Spark?
Дедушка
...Как только перед вами встанет вопрос о действительно серьёзных и производительных пайплайнах вопрос о PySpark отпадёт сам собой...

это ведь извечная дилемма противоположностей - скриптовые подходы против компилированных
гибкость и простота против производительности и долгой разработки
естественно что чем длиннее цепь PySpark->Scala->Java API/интерпретаторов
тем медленнее это будет работать.

просто большинство классов задач в моей практике обычно ставят приоритет
определённого баланса между сложностью решения и чтобы это было быстро доставлено бизнесу
с доступной поддержкой (где ресурсы можно найти на рынке труда быстро и дёшево)

понятно что где-то на более узком сегменте приоритеты будут немного другие.
(но там и объём рынка намного меньше)

так что стандартный подход поиска нужного соотношения недостатков и преимуществ
в котором у каждого свои предпочтения.
...
Рейтинг: 0 / 0
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Какие знания Scala нужны, чтобы работать в Spark? / 6 сообщений из 6, страница 1 из 1
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]