Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / Java [игнор отключен] [закрыт для гостей] / Spark чтение csv файла с указанием схемы и нестандартными типами / 3 сообщений из 3, страница 1 из 1
16.04.2018, 19:06
    #39631072
just_vladimir
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Spark чтение csv файла с указанием схемы и нестандартными типами
Всем привет, пытаюсь прочитать csv'шку spark'ом в Dataset, в самой csv'шке лежат даты в некотором виде "dd.MM.yyyy" и double'ы, у которых decimal separator не точка, а запятая. Можно ли как то указать эти особенности формата, при указании схемы csv?
В идеале на Java, но если на Scala то тоже пойдет.

Или так нельзя и нужно читать как String, потом парсим в отдельную колонку через udf и withColumn и не заморачиваемся? (сейчас напилили именно так, но чет смущает такая реализация)
...
Рейтинг: 0 / 0
18.04.2018, 12:46
    #39632410
забыл ник
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Spark чтение csv файла с указанием схемы и нестандартными типами
just_vladimir, https://issues.apache.org/jira/browse/SPARK-18359

Так что работайте с udf и не заморачивайтесь
...
Рейтинг: 0 / 0
19.04.2018, 10:18
    #39632987
just_vladimir
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Spark чтение csv файла с указанием схемы и нестандартными типами
забыл ник,
спасибо за ссылку на соответствующий improvement issue, плюс если кому будет актуально, то по данной проблеме ситуация такая:
1. Мне ответили на stackoverflow https://stackoverflow.com/questions/49869402/load-csv-in-spark-with-types-in-non-standard-format, там предлагают использовать стандартные функции unix_timestamp для парсинга даты и менять разделитель через замену по регекспу regexp_replace
2. Дополнительно раскопал, что у Spark-Csv есть option для указания формата даты .option("dateFormat", "dd.MM.yyyy"); ( https://github.com/databricks/spark-csv)
...
Рейтинг: 0 / 0
Форумы / Java [игнор отключен] [закрыт для гостей] / Spark чтение csv файла с указанием схемы и нестандартными типами / 3 сообщений из 3, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]