powered by simpleCommunicator - 2.0.19     © 2024 Programmizd 02
Map
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Какие знания Scala нужны, чтобы работать в Spark?
6 сообщений из 6, страница 1 из 1
Какие знания Scala нужны, чтобы работать в Spark?
    #40116441
sysn1k
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Здравствуйте! Я джун.
Недавно перешел из MS SQL + python(pandas) на Spark.

Нужно писать Spark job-ы (переместить данные, проанализировать данные) на Scala. Сейчас начал изучать Scala.
Нужно ли мне вдаваться во все тяжкие, чтобы познать и освоить ООП Scala или все таки для работы в Spark достаточно уметь применять местные RDD-команды и вдаваться в полиморфизм, абстрактные классы, в защиту от переопределения и т.д. не нужно, это необходимо больше для разработчиков Scala?

На Python писал в стиле ФП.
...
Рейтинг: 0 / 0
Какие знания Scala нужны, чтобы работать в Spark?
    #40116494
Фотография vikkiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
sysn1k,

чтобы удостовериться - PySpark не предлагать?
мне вполне хватает и вполне нормально работает с другими питоновскими библиотеками (Pandas и пр.)
...
Рейтинг: 0 / 0
Какие знания Scala нужны, чтобы работать в Spark?
    #40116499
sysn1k
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
vikkiv,

изначально на PySpark учился. На нынешней работе нужно уже на Scala писать.
...
Рейтинг: 0 / 0
Какие знания Scala нужны, чтобы работать в Spark?
    #40116504
H5N1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
sysn1k


изначально на PySpark учился. На нынешней работе нужно уже на Scala писать.


зависит от канторы, кто-то пишет ноутбуки, я сходу и не могу определить скала это или питончик.
а есть те кто из жава шли и воротят все по полной программе - сплошные flatmap и внутри жесть по плоной. учи скалу, там платят x2. не ошибешься.
...
Рейтинг: 0 / 0
Какие знания Scala нужны, чтобы работать в Spark?
    #40116539
Фотография Дедушка
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Как только перед вами встанет вопрос о действительно серьёзных и производительных пайплайнах вопрос о PySpark отпадёт сам собой.
sysn1k
Нужно ли мне вдаваться во все тяжкие
Для начала вам хватит основных конструкций языка (просто открываете доку по программированию Spark и смотрите примеры на Scala), более важно понять сами паттерны и принципы написания джобов под Spark.
Но как только сложность ваших трансформаций увеличится и вы начнёте писать функции, то вам понадобится вся Scala (ну почти), если только вы будете стремиться к поддерживаемости и производительности ваших пайплайнов.
...
Рейтинг: 0 / 0
Какие знания Scala нужны, чтобы работать в Spark?
    #40116598
Фотография vikkiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Дедушка
...Как только перед вами встанет вопрос о действительно серьёзных и производительных пайплайнах вопрос о PySpark отпадёт сам собой...

это ведь извечная дилемма противоположностей - скриптовые подходы против компилированных
гибкость и простота против производительности и долгой разработки
естественно что чем длиннее цепь PySpark->Scala->Java API/интерпретаторов
тем медленнее это будет работать.

просто большинство классов задач в моей практике обычно ставят приоритет
определённого баланса между сложностью решения и чтобы это было быстро доставлено бизнесу
с доступной поддержкой (где ресурсы можно найти на рынке труда быстро и дёшево)

понятно что где-то на более узком сегменте приоритеты будут немного другие.
(но там и объём рынка намного меньше)

так что стандартный подход поиска нужного соотношения недостатков и преимуществ
в котором у каждого свои предпочтения.
...
Рейтинг: 0 / 0
6 сообщений из 6, страница 1 из 1
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Какие знания Scala нужны, чтобы работать в Spark?
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали тему (0):
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]