Гость
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Загрузка данных из MS SQL в HADOOP / 9 сообщений из 9, страница 1 из 1
13.09.2014, 18:41
    #38746021
flexgen
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Загрузка данных из MS SQL в HADOOP
Появилась необходимость загрузить данные из базы MS SQL 2005 в HADOOP. Размер данных, которые необходимо перегрузить - ~600 GB. Как наиболее оптимально сделать такое? Пока что ничего более умного как выгрузить данные утилитой BCP в файл и загрузить в HADOOP не придумали.
...
Рейтинг: 0 / 0
14.09.2014, 10:32
    #38746210
Apex
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Загрузка данных из MS SQL в HADOOP
flexgenПоявилась необходимость загрузить данные из базы MS SQL 2005 в HADOOP. Размер данных, которые необходимо перегрузить - ~600 GB. Как наиболее оптимально сделать такое? Пока что ничего более умного как выгрузить данные утилитой BCP в файл и загрузить в HADOOP не придумали.
Можно воспользоваться sqoop, хотя не факт, что получится быстрее. Но то, что получится удобнее, ИМХО - факт.
...
Рейтинг: 0 / 0
17.09.2014, 10:21
    #38748811
ASCRUS
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Загрузка данных из MS SQL в HADOOP
Что касательно удобства, можно посмотреть Talend BigData Community версию. Там и ETL и джобы Хадупа рисовать можно достаточно просто. А можно просто PIG сверху Хадупа накатить и в нем маленьким скриптом подцепится к МССКУЛю и затянуть запросами на HDFS сразу данные в нужном формате (том же AVRO).
...
Рейтинг: 0 / 0
17.09.2014, 22:22
    #38749788
Apex
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Загрузка данных из MS SQL в HADOOP
ASCRUSЧто касательно удобства, можно посмотреть Talend BigData Community версию. Там и ETL и джобы Хадупа рисовать можно достаточно просто. А можно просто PIG сверху Хадупа накатить и в нем маленьким скриптом подцепится к МССКУЛю и затянуть запросами на HDFS сразу данные в нужном формате (том же AVRO).
Когда я в последний раз на него смотрел оно не умело загружать данные в хадуп, не приземляя их на локальный диск перед этим. Этот недостаток устранен?
...
Рейтинг: 0 / 0
18.09.2014, 13:36
    #38750373
ASCRUS
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Загрузка данных из MS SQL в HADOOP
ApexASCRUSЧто касательно удобства, можно посмотреть Talend BigData Community версию. Там и ETL и джобы Хадупа рисовать можно достаточно просто. А можно просто PIG сверху Хадупа накатить и в нем маленьким скриптом подцепится к МССКУЛю и затянуть запросами на HDFS сразу данные в нужном формате (том же AVRO).
Когда я в последний раз на него смотрел оно не умело загружать данные в хадуп, не приземляя их на локальный диск перед этим. Этот недостаток устранен?
Привет. Вопрос про PIG или Talend ? :)
...
Рейтинг: 0 / 0
18.09.2014, 20:10
    #38750906
flexgen
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Загрузка данных из MS SQL в HADOOP
В конечном итоге решили делать экспорт при помощи BCP, как это будут грузить в HADOOP - уже не моя проблема, для этого у нас специально обученный человек имеется. Всем спасибо.
...
Рейтинг: 0 / 0
22.09.2014, 22:54
    #38754050
Apex
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Загрузка данных из MS SQL в HADOOP
ASCRUSApexпропущено...

Когда я в последний раз на него смотрел оно не умело загружать данные в хадуп, не приземляя их на локальный диск перед этим. Этот недостаток устранен?
Привет. Вопрос про PIG или Talend ? :)
Про Talend конечно, причем здесь Pig то?:)
...
Рейтинг: 0 / 0
07.10.2014, 14:46
    #38769150
Очень лысый
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Загрузка данных из MS SQL в HADOOP
Дело, конечно, хозяйское, но через файло гемору полюбому больше чем через sqoop. Производительность sqoop вполне на уровне. Давеча гоняли достаточно большие объёмы. Вопросы могут быть с подключением по JDBC ну и настраивать надо, да.
...
Рейтинг: 0 / 0
07.10.2014, 14:48
    #38769154
Очень лысый
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Загрузка данных из MS SQL в HADOOP
Скажем так, если разово выгрузить, то в принципе пофиг, а если регулярно, то sqoop.
...
Рейтинг: 0 / 0
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Загрузка данных из MS SQL в HADOOP / 9 сообщений из 9, страница 1 из 1
Целевая тема:
Создать новую тему:
Автор:
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]