powered by simpleCommunicator - 2.0.49     © 2025 Programmizd 02
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Загрузка данных из MS SQL в HADOOP
9 сообщений из 9, страница 1 из 1
Загрузка данных из MS SQL в HADOOP
    #38746021
flexgen
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Появилась необходимость загрузить данные из базы MS SQL 2005 в HADOOP. Размер данных, которые необходимо перегрузить - ~600 GB. Как наиболее оптимально сделать такое? Пока что ничего более умного как выгрузить данные утилитой BCP в файл и загрузить в HADOOP не придумали.
...
Рейтинг: 0 / 0
Загрузка данных из MS SQL в HADOOP
    #38746210
Фотография Apex
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
flexgenПоявилась необходимость загрузить данные из базы MS SQL 2005 в HADOOP. Размер данных, которые необходимо перегрузить - ~600 GB. Как наиболее оптимально сделать такое? Пока что ничего более умного как выгрузить данные утилитой BCP в файл и загрузить в HADOOP не придумали.
Можно воспользоваться sqoop, хотя не факт, что получится быстрее. Но то, что получится удобнее, ИМХО - факт.
...
Рейтинг: 0 / 0
Загрузка данных из MS SQL в HADOOP
    #38748811
Фотография ASCRUS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Что касательно удобства, можно посмотреть Talend BigData Community версию. Там и ETL и джобы Хадупа рисовать можно достаточно просто. А можно просто PIG сверху Хадупа накатить и в нем маленьким скриптом подцепится к МССКУЛю и затянуть запросами на HDFS сразу данные в нужном формате (том же AVRO).
...
Рейтинг: 0 / 0
Загрузка данных из MS SQL в HADOOP
    #38749788
Фотография Apex
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ASCRUSЧто касательно удобства, можно посмотреть Talend BigData Community версию. Там и ETL и джобы Хадупа рисовать можно достаточно просто. А можно просто PIG сверху Хадупа накатить и в нем маленьким скриптом подцепится к МССКУЛю и затянуть запросами на HDFS сразу данные в нужном формате (том же AVRO).
Когда я в последний раз на него смотрел оно не умело загружать данные в хадуп, не приземляя их на локальный диск перед этим. Этот недостаток устранен?
...
Рейтинг: 0 / 0
Загрузка данных из MS SQL в HADOOP
    #38750373
Фотография ASCRUS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ApexASCRUSЧто касательно удобства, можно посмотреть Talend BigData Community версию. Там и ETL и джобы Хадупа рисовать можно достаточно просто. А можно просто PIG сверху Хадупа накатить и в нем маленьким скриптом подцепится к МССКУЛю и затянуть запросами на HDFS сразу данные в нужном формате (том же AVRO).
Когда я в последний раз на него смотрел оно не умело загружать данные в хадуп, не приземляя их на локальный диск перед этим. Этот недостаток устранен?
Привет. Вопрос про PIG или Talend ? :)
...
Рейтинг: 0 / 0
Загрузка данных из MS SQL в HADOOP
    #38750906
flexgen
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
В конечном итоге решили делать экспорт при помощи BCP, как это будут грузить в HADOOP - уже не моя проблема, для этого у нас специально обученный человек имеется. Всем спасибо.
...
Рейтинг: 0 / 0
Загрузка данных из MS SQL в HADOOP
    #38754050
Фотография Apex
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ASCRUSApexпропущено...

Когда я в последний раз на него смотрел оно не умело загружать данные в хадуп, не приземляя их на локальный диск перед этим. Этот недостаток устранен?
Привет. Вопрос про PIG или Talend ? :)
Про Talend конечно, причем здесь Pig то?:)
...
Рейтинг: 0 / 0
Загрузка данных из MS SQL в HADOOP
    #38769150
Очень лысый
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Дело, конечно, хозяйское, но через файло гемору полюбому больше чем через sqoop. Производительность sqoop вполне на уровне. Давеча гоняли достаточно большие объёмы. Вопросы могут быть с подключением по JDBC ну и настраивать надо, да.
...
Рейтинг: 0 / 0
Загрузка данных из MS SQL в HADOOP
    #38769154
Очень лысый
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Скажем так, если разово выгрузить, то в принципе пофиг, а если регулярно, то sqoop.
...
Рейтинг: 0 / 0
9 сообщений из 9, страница 1 из 1
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Загрузка данных из MS SQL в HADOOP
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]