powered by simpleCommunicator - 2.0.52     © 2025 Programmizd 02
Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / ETL кроме SSIS
15 сообщений из 15, страница 1 из 1
ETL кроме SSIS
    #40007470
Фотография Focha
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ребят подскажите какие инструменты используете для ETL процессов, кроме SSIS.
Есть сервер MSSQL, вот SSIS конечно хороший инструмент, особенно простые вещи, а сложные уже надо думать.
Читал про Airflow - интересно.

Хочу вынести ETL отдельно, так как есть процессы типа отправить письмо, взять Excel, загрузить, отправить и скопировать в папку. Много разных процессов от получения данных по API до сложных расчетов на сервере.

Поделитесь опытом.
...
Рейтинг: 0 / 0
ETL кроме SSIS
    #40007493
Андрей Юниор
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Focha
Читал про Airflow - интересно.

Это не ETL. Это больше оркестратор задач, которые нужно выполнять в основном последовательно, а местами параллельно. Он не умеет делать потоки данных. Даже передача переменных от оператора к оператору ограничена.

А весь смысле Airflow в том, что он масштабируется. Иначе он бы даром не был нужен.
Focha
Хочу вынести ETL отдельно, так как есть процессы типа отправить письмо, взять Excel, загрузить, отправить и скопировать в папку. Много разных процессов от получения данных по API до сложных расчетов на сервере.

Да как-то не очень это к ETL относится. Микросервисы: сервис получения почты (обработки писем), сервис отправки почты, сервис парсинга Excel, сервис расчётов (аналитика?!), брокеры сообщений. И где-то в этой архитектуре уже можно сделать Airflow для оркестрации.
...
Рейтинг: 0 / 0
ETL кроме SSIS
    #40007508
Фотография court
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Focha
есть процессы типа отправить письмо, взять Excel, загрузить, отправить и скопировать в папку. Много разных процессов от получения данных по API до сложных расчетов на сервере.
и что не так с SSIS ?
(собственно, у меня, к нему, "претензий" хватает, но всё выше перечисленное, он делает "легко и просто" :) )
...
Рейтинг: 0 / 0
ETL кроме SSIS
    #40007605
Владислав Колосов
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Focha,

авторотправить письмо, взять Excel, загрузить, отправить и скопировать в папку

Вы немного не понимаете, что такое ETL.
ETL , это
E Извлечение данных из произвольного источника
T Преобразование в требуемые типы и форматы
L Загрузка в базу данных
...
Рейтинг: 0 / 0
ETL кроме SSIS
    #40007710
flexgen
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Focha
какие инструменты используете для ETL процессов, кроме SSIS.


Есть много всяких разных средств, вот небольшой список - 15 Best ETL Tools In 2020
...
Рейтинг: 0 / 0
ETL кроме SSIS
    #40007729
Гулин Федор
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Focha,
Не уверен что вам это надо
ну гляньте Pentaho
бесплатно , ява-код
но тормознутое гуи
если сильны в яве м.б зайдет вам

но для скл-сервера все таки SSIS родней
для других pentaho вполне себе вариант
...
Рейтинг: 0 / 0
ETL кроме SSIS
    #40007735
Агрох
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
На прошлой работе использовали SAS, но в связке с такими монстрами как Teradata, Impala, Greenplum.
На мой взгляд довольно таким мощный инструмент. С другой стороны - мне сравнивать особо не с чем.
...
Рейтинг: 0 / 0
ETL кроме SSIS
    #40007853
Фотография alexeyvg
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
flexgen
Focha
какие инструменты используете для ETL процессов, кроме SSIS.


Есть много всяких разных средств, вот небольшой список - 15 Best ETL Tools In 2020
Cloudera не упомянута, или не то?
...
Рейтинг: 0 / 0
ETL кроме SSIS
    #40007954
H5N1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
alexeyvg

Cloudera не упомянута, или не то?

cloudera это кантора собирающая дистрибутив hadoop. какого-то своего etl продукта у них как минимум на слуху нет, на hadoop кончено можно свои джобы запускать, например spark джобы, но если нужен etl то и к хадупу обычно прикручивают airflow, nifi, pentaho
...
Рейтинг: 0 / 0
ETL кроме SSIS
    #40007989
Гулин Федор
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
flexgen
Focha
какие инструменты используете для ETL процессов, кроме SSIS.


Есть много всяких разных средств, вот небольшой список - 15 Best ETL Tools In 2020


глянул
я знаком с талендом и пентахо
но там не 16 а даже больше
видел сбоку Matillion но там я 0
вообщем пощупать интереса ради можно много чего
...
Рейтинг: 0 / 0
ETL кроме SSIS
    #40008067
aleks222
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Гулин Федор
flexgen
пропущено...
Есть много всяких разных средств, вот небольшой список - 15 Best ETL Tools In 2020


вообщем пощупать интереса ради можно много чего


Ну... если больше нечем заняться.
А во фсех прочих случаях: powershell + BULK INSERT + script T-SQL.

Быстро, дешево и сердито.
Переносимо.
...
Рейтинг: 0 / 0
ETL кроме SSIS
    #40008151
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
О, сейчас нужно что-то типа Airflow как оркестратор.
Пару вопросов по нему - у него есть веб-интрерфейс?
Если да, то этот интерфейс можно показывать пользователям? (желательно на русском).
Самое главное - он умеет запускать SSIS-пакеты и показывать сообщения об ошибках?
...
Рейтинг: 0 / 0
ETL кроме SSIS
    #40008154
msLex
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Критик
Самое главное - он умеет запускать SSIS-пакеты и показывать сообщения об ошибках?


Ну запустить SSIS пакет дело не хитрое, а вот где ошибки с него собирать сильно зависит от того, где это пакет хранится.

Если в SSIS каталоге, до даже "нативный" SQLAgent ошибки не показывает. Приходиться просматривать их в оснастке самого каталога.
...
Рейтинг: 0 / 0
ETL кроме SSIS
    #40008289
Фотография Focha
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Андрей Юниор
Focha
Читал про Airflow - интересно.

Это не ETL. Это больше оркестратор задач, которые нужно выполнять в основном последовательно, а местами параллельно. Он не умеет делать потоки данных. Даже передача переменных от оператора к оператору ограничена.

А весь смысле Airflow в том, что он масштабируется. Иначе он бы даром не был нужен.
Focha
Хочу вынести ETL отдельно, так как есть процессы типа отправить письмо, взять Excel, загрузить, отправить и скопировать в папку. Много разных процессов от получения данных по API до сложных расчетов на сервере.

Да как-то не очень это к ETL относится. Микросервисы: сервис получения почты (обработки писем), сервис отправки почты, сервис парсинга Excel, сервис расчётов (аналитика?!), брокеры сообщений. И где-то в этой архитектуре уже можно сделать Airflow для оркестрации.

ETL и другие процесс по автоматизации. масштабируется - да, важный момент


court
Focha
есть процессы типа отправить письмо, взять Excel, загрузить, отправить и скопировать в папку. Много разных процессов от получения данных по API до сложных расчетов на сервере.
и что не так с SSIS ?
(собственно, у меня, к нему, "претензий" хватает, но всё выше перечисленное, он делает "легко и просто" :) )

Когда задач много одинаковых, начинается каша + пакеты пакеты пакеты и расписание расписание расписание, все как то и в одном, но в разных местах. Я думаю с помощью кода реализовать будет все проще.


Владислав Колосов
Focha,
авторотправить письмо, взять Excel, загрузить, отправить и скопировать в папку

Вы немного не понимаете, что такое ETL.
ETL , это
E Извлечение данных из произвольного источника
T Преобразование в требуемые типы и форматы
L Загрузка в базу данных
Ой я прям вот люблю таких умников, ETL (Extract, Transform, Load) — извлечение (api, excel и т.п.), преобразование (расчеты и т.п.) и загрузка(ну, а так как вы умный, сами знаете ответ)


flexgen
Focha
какие инструменты используете для ETL процессов, кроме SSIS.

Есть много всяких разных средств, вот небольшой список - 15 Best ETL Tools In 2020

Спасибо!


aleks222
Гулин Федор
пропущено...
вообщем пощупать интереса ради можно много чего

Ну... если больше нечем заняться.
А во фсех прочих случаях: powershell + BULK INSERT + script T-SQL.
Быстро, дешево и сердито.
Переносимо.

Вот, что я Вам должен ответить, вы тупой?(вопрос имеет шуточную форму как и ответ) я когда вижу такие решение, вы думали о том как их будут поддерживать после Вас?




Почитав интернет, с SSIS я только тупеть буду (как Гулин Федор), а Airflow это новое современное решение.
Спасибо, пошел устанавливать и настраивать.
...
Рейтинг: 0 / 0
ETL кроме SSIS
    #40008291
Гавриленко Сергей Алексеевич
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Модератор: Уважаемый Focha. Раз вам дискуссия не нужна, я тему закрою. А в следующий раз профилактические баны прописывать буду за троллинг.
...
Рейтинг: 0 / 0
15 сообщений из 15, страница 1 из 1
Форумы / Microsoft SQL Server [игнор отключен] [закрыт для гостей] / ETL кроме SSIS
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]