powered by simpleCommunicator - 2.0.19     © 2024 Programmizd 02
Map
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / Data Lake как Staging Area
25 сообщений из 158, страница 1 из 7
Data Lake как Staging Area
    #39717728
Glebanski
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Сходил тут SQL Saturday в недавнюю..... кажется субботу(!)
Микрософт просто адски пушает Databrick, но речь не об этом.

Местные консалтеры уверены, если вы хотите современное Хранилище - то, где вместо унылых файлов и/или базы под Staging Аrea всем надо срочно внедрить Data Lakи
Что думаете?
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39717779
Ivan Durak
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
унылый хадуп под стейджинг?
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39717799
Полковник.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
GlebanskiСходил тут SQL Saturday в недавнюю..... кажется субботу(!)
Микрософт просто адски пушает Databrick, но речь не об этом.

Местные консалтеры уверены, если вы хотите современное Хранилище - то, где вместо унылых файлов и/или базы под Staging Аrea всем надо срочно внедрить Data Lakи
Что думаете?

Ахаха
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39717801
L_argo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
авторМикрософт....Дальше можно не читать... :)
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39717833
Glebanski
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
L_argo,

Да если на Microsoft тусне такое вещают, то что на других происходит?
Вообще мрак наверно.
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39717848
Barclay
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А что Microsoft? Плохо что ли?
Или вы в прошлом еще с Win95?
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39717852
Andy_OLAP
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
GlebanskiМестные консалтеры уверены...всем надо срочно внедрить Data Lakи
Что думаете?
То есть умные ребята готовы осваивать шекели заказчиков. Много шекелей. Срочно осваивать.
А при чем же здесь Microsoft?
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39717862
Glebanski
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Andy_OLAP,

У L_argo спросите. Наверно что-то личное
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39717975
tarrus
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
GlebanskiСходил тут SQL Saturday в недавнюю..... кажется субботу(!)
Микрософт просто адски пушает Databrick, но речь не об этом.

Местные консалтеры уверены, если вы хотите современное Хранилище - то, где вместо унылых файлов и/или базы под Staging Аrea всем надо срочно внедрить Data Lakи
Что думаете?

Учитывая, что половина консалтеров не понимает, что такое полуаддитивные меры, отношения m2m, ничего другого им и не остается.
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39718001
churupaha
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39718019
H5N1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
tarrusGlebanskiСходил тут SQL Saturday в недавнюю..... кажется субботу(!)
Микрософт просто адски пушает Databrick, но речь не об этом.

Местные консалтеры уверены, если вы хотите современное Хранилище - то, где вместо унылых файлов и/или базы под Staging Аrea всем надо срочно внедрить Data Lakи
Что думаете?

Учитывая, что половина консалтеров не понимает, что такое полуаддитивные меры, отношения m2m, ничего другого им и не остается.
что-то мне подсказывает что эти консалтеры хоть и с нулевыми знаниями, но наголову выше местной публики. хотя бы даташыты по англицки прочесть могут.

https://databricks.com/blog/2017/11/15/a-technical-overview-of-azure-databricks.html

нет там хадупов, пропихивают какого-то франкинштейна, где у спарка вместо hdfs какой-то dbfs и прочая ажурная муть.
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39718201
Glebanski
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
churupaha,

отличный рассказ.
От себя добавлю, что пара местных консалтеров толкающих Azure Data Lake Analytics после посещения microsoft ignite очень расстроились.
Они рассказали, что Microsoft явно пушает Databricks в ущерб их любимому Analytics. Просто сравнивая кол-во воркшопов и упоминаний.
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39721113
churupaha
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
авторWell with Data Flow Microsoft have done something really special. The JSON output from the graphic ADF-DF user interface is used to write the Scala for us! This then gets compiled into the Jar file and passed to Azure Databricks to execute as a job on a given cluster (defined via ADF linked services as normal).


Azure Data Flow (ADF-DF)
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39721261
Кэптен
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Помню, еще года три назад Оракл толкал тему выноса предрасчета агрегатов в Хадуп. И различных трудоемких трансформаций.
Мол, например, у телекома офигезно много данных с базовых станций, и А) - хранить это в реляционке тупо дорого, и Б) большое количество мощных серверов (конечно Oracle BigData Appliance) легче и быстрее справятся с очисткой-подготовкой данных.
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39721307
Ivan Durak
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ну так уже все доперли что хранить сырье в реляционке дорого.
А вот расчеты это уже по возможностям.
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39721309
Полковник.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
КэптенПомню, еще года три назад Оракл толкал тему выноса предрасчета агрегатов в Хадуп. И различных трудоемких трансформаций.
Мол, например, у телекома офигезно много данных с базовых станций, и А) - хранить это в реляционке тупо дорого, и Б) большое количество мощных серверов (конечно Oracle BigData Appliance) легче и быстрее справятся с очисткой-подготовкой данных.

У Инмона есть статья почему даталайк не хранилище данных. В двух словах 1 пользователям нужны понятные им структуры данных для анализа - это хранилище данных, данные структурированы, разложены по таблицам и колонкам 2 даталайк это технология обработки больших массивов данных параллельным процессом.
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39721386
H5N1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Полковник.
У Инмона есть статья почему даталайк не хранилище данных. В двух словах 1 пользователям нужны понятные им структуры данных для анализа - это хранилище данных, данные структурированы, разложены по таблицам и колонкам 2 даталайк это технология обработки больших массивов данных параллельным процессом.
а можно точнее что за книга? а то как-то не понятно на кой пользователю хранилище, если даталейк витрины пользователям строит. вполне структурированные.
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39721397
.Евгений
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
У меня есть архив ХД, в который складываются входящие XML. Но сделать это центральным элементом ХД и обозвать DataLake мне в голову не пришло...
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39721415
churupaha
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
из корп. чатикаWe should NOT use Data lake analytics and USQL. Instead Databricks with Python and Spark SQL
We just learned that Data Lake Analytics will be discontinued and USQL will not be supported any longer by Microsoft
Data Lake Store Gen1 will be replaced by Data Lake store Gen2 end of this year, and migration will be easier from Blob
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39721481
H5N1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
.ЕвгенийУ меня есть архив ХД, в который складываются входящие XML. Но сделать это центральным элементом ХД и обозвать DataLake мне в голову не пришло...
и никому не приходит. далейком называют то во что эти xml трансформировали . orc, parquet, hbase и прочие файлики на hdfs.
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39721551
Полковник.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
H5N1Полковник.У Инмона есть статья почему даталайк не хранилище данных. В двух словах 1 пользователям нужны понятные им структуры данных для анализа - это хранилище данных, данные структурированы, разложены по таблицам и колонкам 2 даталайк это технология обработки больших массивов данных параллельным процессом.
а можно точнее что за книга? а то как-то не понятно на кой пользователю хранилище, если даталейк витрины пользователям строит. вполне структурированные.

Я выше написал - статья. Года три назад Инмон раз в неделю писал по статье, где обличал любителей свалить все в кучу и назвать это даталайк.

Витрины поверх даталайк появились именно потому что пользователям нужны структурированные данные.

А теперь вопрос - зачем эта прослойка, которую все упорно пытаются варить называя это изделие красивым словосочетанием - озеро данных?
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39721553
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
H5N1,

я считал, что Data Lake это все это в одном месте,
то есть такая мегамусорка
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39721595
.Евгений
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
H5N1и никому не приходит. далейком называют то во что эти xml трансформировали . orc, parquet, hbase и прочие файлики на hdfs.
А-аа, все понятно! Datalake по определению бывает только поверх Hadoop, поэтому мне надо запихать xml-ки в хадуп и вот тогда озеро украсит мой повседневный пейзаж ИТ-систем! Не было у меня ни малейшей нужды в хадупе - а вот появилась!
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39721604
Бумбараш
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
сейчас все хранилища делают с предбанником из хадуп, который в разной степени пытаются натянуть на всё хранилище

поэтому удивление автора темы непонятно

А Inmon это outdated дед. Есть сомнение, что он может что-то решать сейчас по теме.
...
Рейтинг: 0 / 0
Data Lake как Staging Area
    #39721654
H5N1
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Полковник.Я выше написал - статья. Года три назад Инмон раз в неделю писал по статье, где обличал любителей свалить все в кучу и назвать это даталайк.

ну вот хотелось бы ссылочку, что бы не вышло как в той истории, где рабинович напел

Полковник.Витрины поверх даталайк появились именно потому что пользователям нужны структурированные данные.

сомневаюсь. даталейки из ентерпрайза и банков пошли, а там все данные хорошо структурированы. подозреваю банку в принципе что-то не структурированное грузить смертный приговор.

Полковник. А теперь вопрос - зачем эта прослойка, которую все упорно пытаются варить называя это изделие красивым словосочетанием - озеро данных?
- что бы эффективно обрабатывать данные там где они лежат, а не таскать без конца данные из субд во всякие питоны, R и sas data майнеры. в обычной субд нет даже базовых алгоритмов анализа, все что сложне AVG() требует перекачки данных.
- что бы пользователь получил привычные данные в человеческом виде, а не набор мутных фактов, которые еще толпа инженеров нужна, что бы правильно заджоинить.
- имея резиновые ресурсы, многие вещи можно тупо и в лоб проворачивать. там где рсубд хранилище будет выдумывать мутные алгоритмы исправлений косяка, на хадупах просто перестроят витрину, не вникая даже в суть проблемы.
- что бы с какой-нить ESB в реалтайме данные читать, а не по старинке батчами
- с консистентностью на хадупах все сделано удобней, в рдбмс же exchange partition на всю бд не сделать.
...
Рейтинг: 0 / 0
25 сообщений из 158, страница 1 из 7
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / Data Lake как Staging Area
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали тему (0):
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]