powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Java [игнор отключен] [закрыт для гостей] / Spark чтение csv файла с указанием схемы и нестандартными типами
3 сообщений из 3, страница 1 из 1
Spark чтение csv файла с указанием схемы и нестандартными типами
    #39631072
just_vladimir
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Всем привет, пытаюсь прочитать csv'шку spark'ом в Dataset, в самой csv'шке лежат даты в некотором виде "dd.MM.yyyy" и double'ы, у которых decimal separator не точка, а запятая. Можно ли как то указать эти особенности формата, при указании схемы csv?
В идеале на Java, но если на Scala то тоже пойдет.

Или так нельзя и нужно читать как String, потом парсим в отдельную колонку через udf и withColumn и не заморачиваемся? (сейчас напилили именно так, но чет смущает такая реализация)
...
Рейтинг: 0 / 0
Spark чтение csv файла с указанием схемы и нестандартными типами
    #39632410
забыл ник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
just_vladimir, https://issues.apache.org/jira/browse/SPARK-18359

Так что работайте с udf и не заморачивайтесь
...
Рейтинг: 0 / 0
Spark чтение csv файла с указанием схемы и нестандартными типами
    #39632987
just_vladimir
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
забыл ник,
спасибо за ссылку на соответствующий improvement issue, плюс если кому будет актуально, то по данной проблеме ситуация такая:
1. Мне ответили на stackoverflow https://stackoverflow.com/questions/49869402/load-csv-in-spark-with-types-in-non-standard-format, там предлагают использовать стандартные функции unix_timestamp для парсинга даты и менять разделитель через замену по регекспу regexp_replace
2. Дополнительно раскопал, что у Spark-Csv есть option для указания формата даты .option("dateFormat", "dd.MM.yyyy"); ( https://github.com/databricks/spark-csv)
...
Рейтинг: 0 / 0
3 сообщений из 3, страница 1 из 1
Форумы / Java [игнор отключен] [закрыт для гостей] / Spark чтение csv файла с указанием схемы и нестандартными типами
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]