|
|
|
Какой аркистратор для job вы используете?
|
|||
|---|---|---|---|
|
#18+
Встал вопрос выбора аркистратора для ELT. Что посоветуете? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.12.2018, 23:33 |
|
||
|
Какой аркистратор для job вы используете?
|
|||
|---|---|---|---|
|
#18+
sQudВстал вопрос выбора аркистратора для ELT. Что посоветуете? Тут или Azure Data Factory , или Hortonworks DataFlow . Свежая документация от Microsoft таки здесь . Вы не сказали, где у Вас данные лежат. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.12.2018, 23:56 |
|
||
|
Какой аркистратор для job вы используете?
|
|||
|---|---|---|---|
|
#18+
+ (плюсану к ADF v2 ) еще такой вариант Можно полностью запилить на Azure Databricks, если специфика позволяет или комбинация ADF v2 + Azure DataBricks ... Notebook Workflows: The Easiest Way to Implement Apache Spark Pipelines Load data to Azure DWH На ADF можно строить и гибридное Cloud + OnPremises, в v2 добавилось и добавляются стремительно много коннекторов к известным системам типа SalesForce, всё меньше кастомного гавнакода приходится писать. У нас сейчас ADF v2 + Azure DataBricks + Azure DWH + (Azure SSAS, другая команда), все довольны... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.12.2018, 22:32 |
|
||
|
Какой аркистратор для job вы используете?
|
|||
|---|---|---|---|
|
#18+
данные лежат hadoop + oracle, но берем мы их отовсюду, все написанно на bash скриптах. Ищем тулу которая бы позволяла удобно упарвять именно джобами, и все что с этим связанно (перезапуск с места падения, перезапуск по иерархии для какой-то таблицы, мониторинг процесса), поддержка запуска 1000 jobs ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.12.2018, 11:18 |
|
||
|
Какой аркистратор для job вы используете?
|
|||
|---|---|---|---|
|
#18+
Apache Airflow ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.12.2018, 11:34 |
|
||
|
Какой аркистратор для job вы используете?
|
|||
|---|---|---|---|
|
#18+
Jack CarverApache Airflow А в чем разница с ADF? Давайте больше брендов хороших и новых. А внутре у нее неонка. Тьху. Apache Airflow. Но какая разница. Продадим одну вещь по цене двух. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.12.2018, 14:03 |
|
||
|
Какой аркистратор для job вы используете?
|
|||
|---|---|---|---|
|
#18+
System main characteristics: Environment – Hadoop(CDH 5.7), Oracle DB, ODI Current number of configured jobs – ~ 5000 Current max number of simultaneously active jobs - ~600 Scheduler main characteristics: - Ability to connect to heterogeneous environments: Secure Storage for connecting info(login/password) Ability to use “connect” templates with diff. variables(i.e. connect to diff. hosts with same characteristics) - Ability to configure thousands of jobs(~ 10000) and more; - Ability to simultaneously run of ~1000 jobs and more; - Ability to combine jobs into sub-groups and sub-groups into groups; - Ability to management of complex dependencies and helps users quickly resolve workflow bottlenecks with detailed analytics; - Ability to configure execution rules and dependencies on group level, sub-group level, single job level(group/sub-group/job dependencies, time dependencies, variable dependencies);(limited) - Ability to build graphical workflow based on dependencies(Predecessors, Successors); - Ability to flexible manage job, sub-groups, groups(Need to be tested): Hold/Stop, Release/Resume, Abort/Cancel, Rerun/Rerun with dependencies(ability to run workflow from any step with all following dependencies) and etc.; - Fault tolerance and high availability; - Ability to configure flexible actions for special events, i.e. job failed – send email and run special job and etc.; - Intuitive User Interface for monitoring/configuring/creating jobs and etc.; ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.12.2018, 14:54 |
|
||
|
|

start [/forum/topic.php?fid=49&msg=39747382&tid=1857704]: |
0ms |
get settings: |
12ms |
get forum list: |
15ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
166ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
48ms |
get tp. blocked users: |
1ms |
| others: | 231ms |
| total: | 495ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...