|
ETL кроме SSIS
|
|||
---|---|---|---|
#18+
Ребят подскажите какие инструменты используете для ETL процессов, кроме SSIS. Есть сервер MSSQL, вот SSIS конечно хороший инструмент, особенно простые вещи, а сложные уже надо думать. Читал про Airflow - интересно. Хочу вынести ETL отдельно, так как есть процессы типа отправить письмо, взять Excel, загрузить, отправить и скопировать в папку. Много разных процессов от получения данных по API до сложных расчетов на сервере. Поделитесь опытом. ... |
|||
:
Нравится:
Не нравится:
|
|||
11.10.2020, 19:49 |
|
ETL кроме SSIS
|
|||
---|---|---|---|
#18+
Focha Читал про Airflow - интересно. Это не ETL. Это больше оркестратор задач, которые нужно выполнять в основном последовательно, а местами параллельно. Он не умеет делать потоки данных. Даже передача переменных от оператора к оператору ограничена. А весь смысле Airflow в том, что он масштабируется. Иначе он бы даром не был нужен. Focha Хочу вынести ETL отдельно, так как есть процессы типа отправить письмо, взять Excel, загрузить, отправить и скопировать в папку. Много разных процессов от получения данных по API до сложных расчетов на сервере. Да как-то не очень это к ETL относится. Микросервисы: сервис получения почты (обработки писем), сервис отправки почты, сервис парсинга Excel, сервис расчётов (аналитика?!), брокеры сообщений. И где-то в этой архитектуре уже можно сделать Airflow для оркестрации. ... |
|||
:
Нравится:
Не нравится:
|
|||
11.10.2020, 21:20 |
|
ETL кроме SSIS
|
|||
---|---|---|---|
#18+
Focha есть процессы типа отправить письмо, взять Excel, загрузить, отправить и скопировать в папку. Много разных процессов от получения данных по API до сложных расчетов на сервере. (собственно, у меня, к нему, "претензий" хватает, но всё выше перечисленное, он делает "легко и просто" :) ) ... |
|||
:
Нравится:
Не нравится:
|
|||
11.10.2020, 22:53 |
|
ETL кроме SSIS
|
|||
---|---|---|---|
#18+
Focha, авторотправить письмо, взять Excel, загрузить, отправить и скопировать в папку Вы немного не понимаете, что такое ETL. ETL , это E Извлечение данных из произвольного источника T Преобразование в требуемые типы и форматы L Загрузка в базу данных ... |
|||
:
Нравится:
Не нравится:
|
|||
12.10.2020, 10:27 |
|
ETL кроме SSIS
|
|||
---|---|---|---|
#18+
Focha какие инструменты используете для ETL процессов, кроме SSIS. Есть много всяких разных средств, вот небольшой список - 15 Best ETL Tools In 2020 ... |
|||
:
Нравится:
Не нравится:
|
|||
12.10.2020, 13:35 |
|
ETL кроме SSIS
|
|||
---|---|---|---|
#18+
Focha, Не уверен что вам это надо ну гляньте Pentaho бесплатно , ява-код но тормознутое гуи если сильны в яве м.б зайдет вам но для скл-сервера все таки SSIS родней для других pentaho вполне себе вариант ... |
|||
:
Нравится:
Не нравится:
|
|||
12.10.2020, 14:14 |
|
ETL кроме SSIS
|
|||
---|---|---|---|
#18+
На прошлой работе использовали SAS, но в связке с такими монстрами как Teradata, Impala, Greenplum. На мой взгляд довольно таким мощный инструмент. С другой стороны - мне сравнивать особо не с чем. ... |
|||
:
Нравится:
Не нравится:
|
|||
12.10.2020, 14:27 |
|
ETL кроме SSIS
|
|||
---|---|---|---|
#18+
flexgen Focha какие инструменты используете для ETL процессов, кроме SSIS. Есть много всяких разных средств, вот небольшой список - 15 Best ETL Tools In 2020 ... |
|||
:
Нравится:
Не нравится:
|
|||
12.10.2020, 21:25 |
|
ETL кроме SSIS
|
|||
---|---|---|---|
#18+
alexeyvg Cloudera не упомянута, или не то? cloudera это кантора собирающая дистрибутив hadoop. какого-то своего etl продукта у них как минимум на слуху нет, на hadoop кончено можно свои джобы запускать, например spark джобы, но если нужен etl то и к хадупу обычно прикручивают airflow, nifi, pentaho ... |
|||
:
Нравится:
Не нравится:
|
|||
13.10.2020, 09:31 |
|
ETL кроме SSIS
|
|||
---|---|---|---|
#18+
flexgen Focha какие инструменты используете для ETL процессов, кроме SSIS. Есть много всяких разных средств, вот небольшой список - 15 Best ETL Tools In 2020 глянул я знаком с талендом и пентахо но там не 16 а даже больше видел сбоку Matillion но там я 0 вообщем пощупать интереса ради можно много чего ... |
|||
:
Нравится:
Не нравится:
|
|||
13.10.2020, 11:23 |
|
ETL кроме SSIS
|
|||
---|---|---|---|
#18+
Гулин Федор flexgen пропущено... Есть много всяких разных средств, вот небольшой список - 15 Best ETL Tools In 2020 вообщем пощупать интереса ради можно много чего Ну... если больше нечем заняться. А во фсех прочих случаях: powershell + BULK INSERT + script T-SQL. Быстро, дешево и сердито. Переносимо. ... |
|||
:
Нравится:
Не нравится:
|
|||
13.10.2020, 13:41 |
|
ETL кроме SSIS
|
|||
---|---|---|---|
#18+
О, сейчас нужно что-то типа Airflow как оркестратор. Пару вопросов по нему - у него есть веб-интрерфейс? Если да, то этот интерфейс можно показывать пользователям? (желательно на русском). Самое главное - он умеет запускать SSIS-пакеты и показывать сообщения об ошибках? ... |
|||
:
Нравится:
Не нравится:
|
|||
13.10.2020, 18:02 |
|
ETL кроме SSIS
|
|||
---|---|---|---|
#18+
Критик Самое главное - он умеет запускать SSIS-пакеты и показывать сообщения об ошибках? Ну запустить SSIS пакет дело не хитрое, а вот где ошибки с него собирать сильно зависит от того, где это пакет хранится. Если в SSIS каталоге, до даже "нативный" SQLAgent ошибки не показывает. Приходиться просматривать их в оснастке самого каталога. ... |
|||
:
Нравится:
Не нравится:
|
|||
13.10.2020, 18:08 |
|
ETL кроме SSIS
|
|||
---|---|---|---|
#18+
Андрей Юниор Focha Читал про Airflow - интересно. Это не ETL. Это больше оркестратор задач, которые нужно выполнять в основном последовательно, а местами параллельно. Он не умеет делать потоки данных. Даже передача переменных от оператора к оператору ограничена. А весь смысле Airflow в том, что он масштабируется. Иначе он бы даром не был нужен. Focha Хочу вынести ETL отдельно, так как есть процессы типа отправить письмо, взять Excel, загрузить, отправить и скопировать в папку. Много разных процессов от получения данных по API до сложных расчетов на сервере. Да как-то не очень это к ETL относится. Микросервисы: сервис получения почты (обработки писем), сервис отправки почты, сервис парсинга Excel, сервис расчётов (аналитика?!), брокеры сообщений. И где-то в этой архитектуре уже можно сделать Airflow для оркестрации. ETL и другие процесс по автоматизации. масштабируется - да, важный момент court Focha есть процессы типа отправить письмо, взять Excel, загрузить, отправить и скопировать в папку. Много разных процессов от получения данных по API до сложных расчетов на сервере. (собственно, у меня, к нему, "претензий" хватает, но всё выше перечисленное, он делает "легко и просто" :) ) Когда задач много одинаковых, начинается каша + пакеты пакеты пакеты и расписание расписание расписание, все как то и в одном, но в разных местах. Я думаю с помощью кода реализовать будет все проще. Владислав Колосов Focha, авторотправить письмо, взять Excel, загрузить, отправить и скопировать в папку Вы немного не понимаете, что такое ETL. ETL , это E Извлечение данных из произвольного источника T Преобразование в требуемые типы и форматы L Загрузка в базу данных Ой я прям вот люблю таких умников, ETL (Extract, Transform, Load) — извлечение (api, excel и т.п.), преобразование (расчеты и т.п.) и загрузка(ну, а так как вы умный, сами знаете ответ) flexgen Focha какие инструменты используете для ETL процессов, кроме SSIS. Есть много всяких разных средств, вот небольшой список - 15 Best ETL Tools In 2020 Спасибо! aleks222 Гулин Федор пропущено... вообщем пощупать интереса ради можно много чего Ну... если больше нечем заняться. А во фсех прочих случаях: powershell + BULK INSERT + script T-SQL. Быстро, дешево и сердито. Переносимо. Вот, что я Вам должен ответить, вы тупой?(вопрос имеет шуточную форму как и ответ) я когда вижу такие решение, вы думали о том как их будут поддерживать после Вас? Почитав интернет, с SSIS я только тупеть буду (как Гулин Федор), а Airflow это новое современное решение. Спасибо, пошел устанавливать и настраивать. ... |
|||
:
Нравится:
Не нравится:
|
|||
13.10.2020, 23:39 |
|
|
start [/forum/topic.php?fid=46&msg=40007989&tid=1685541]: |
0ms |
get settings: |
9ms |
get forum list: |
13ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
26ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
58ms |
get tp. blocked users: |
1ms |
others: | 14ms |
total: | 141ms |
0 / 0 |