powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / Будущее реляционных DWH и Big Data в России
24 сообщений из 24, страница 1 из 1
Будущее реляционных DWH и Big Data в России
    #39446416
Joz07
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Задумался о будущем и об области применения реляционных DWH и Big Data в России. Ну и о путях своего дальнейшего развития :-)


Область применения классических DWH (SQL -хранилищ, построенных на Oracle, MSSQL, Teradata, ...):
1. Создание строгой отчетности по структурированным данным. Например, банковская отчетность для регуляторов(ЦБ), государственных структур, высшего менеджмента.
Здесь данные уже структурированы (например, денежные транзакции) и важна точность.


Область применения Big Data:
1. Поддержка принятия решений, где данных много, где данные неструктурированны, где нужен их анализ (Machine Learning).


Будущее в России:
1. Классические реляционные DWH останутся в крупных и средних компаниях (особенно в банках), где нужна отчетность для регуляторов, где данные структурированы.
2. BigData останется и будет там, где действительно много данных для реляционных хранилищ, где данные неструктурированны, и где есть хоть небольшая, но конкуренция, например, телеком, ретейл, банковские продукты, ориентированные не на корпоративный сектор. Где есть польза от принятия решений на основе анализа рынка.
3. Все больше OLTP и OLAP систем будет строиться на бесплатных реляционных СУБД типа PostgreSQL. Некоторые компании уже перешли и у многих в планах переход с дорогой РСУБД Oracle на PostgreSQL.
4. Много BigData проектов после всплеска интереса умрет, т.к. в России не развитая экономика и для многих направлений аналитика данных особенно не приносит дохода, т.к. проще договориться с кем нужно, чем основываясь на аналитике данных повышать продажи на 1%.
5. в BigData если и будут платить деньги выше среднего программиста, то только аналитикам BigData(которые знают Machine Learning), могут непосредственно давать советы бизнесу. А зарплаты программистов, например Spark, упадут.
6. Сейчас зарплаты программистов отчетности и ETL для классических DWH ниже зарплат Java программистов и в дальнейшем не будут расти, т.к. рынок DWH уже сформировался. Новых проектов на реляционных DWH почти нет. Остается поддержка и доработка существующих ETL процессов, поддержка отчетности. Специалистов сформировалось за годы внедрения DWH с начала 2000-х много.

Вопрос: согласны ли вы с данными выводами ?


Спасибо
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39446461
Ivan Durak
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
где-то у тебя в цепочке мыслей произошла подмена понятий.
На всю простыню отвечать нет смысла, отвечу на главное-
Главная ценность DWH как раз в способности превращать неструктурированные, несвязанные, разрозненные данные в структурированные, цельные и консистентные. Это и приносит бизнес вэлью.
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39446494
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Joz07Область применения Big Data:
1. Поддержка принятия решений, где данных много, где данные неструктурированны, где нужен их анализ (Machine Learning).

а где данных много и они одновременно неструктурированны?
сможете ответить на этот вопрос - тогда сможете очертить круг потенциальных работодателей и оценить свои выгоды при принятии решения о переквалификации
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39446518
Фотография essbase.ru
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ivan Durak
Главная ценность DWH как раз в способности превращать неструктурированные, несвязанные, разрозненные данные в структурированные, цельные и консистентные. Это и приносит бизнес вэлью.

Присоединюсь , что бы рядом постоять )

А для DataLake есть определение ? Каждый ищет свое Value ? )
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39446523
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
essbase.ru,

болото данных
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39446616
Leoris
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
авторв BigData если и будут платить деньги выше среднего программиста, то только аналитикам BigData(которые знают Machine Learning), могут непосредственно давать советы бизнесу. А зарплаты программистов, например Spark, упадут.

У открытых систем, внезнапно, есть одно преимущество. На больших объемах данных (как раз средние/большие компании) каждый сервер Оракла / лишний терабайт в Терадате стоит как крыло самолёта. В пересчёте на терабайт места разница может быть в пару порядков. Но есть оверхед при первоначальной настройке. Так что надо считать.
Ещё момент - вы не упомянули про данные с счетчиков(в т.ч. IoT). Этого у нас пока мало, но скорее всего будет расширяться. Там реально нужно перелопатить большие объемы данных, чтобы на выход получить несколько строчек.

essbase.ruА для DataLake есть определение ? Каждый ищет свое Value ? )

В идеале озера данных - реплика данных, как они хранятся в операционных приложениях. Чтобы разработчики имели один источник данных и все ETL и интеграции делали на их основе, а не тянулись руками в пром и роняли базы запросами ))
Сложность в том, что требуется в мониторинг и периодическая перенастройка, когда меняется схема данных в приложении источнике. Ещё нужен справочник мета-данных: что мы туда сложили, какие etl-процедуры складывают и кто за них отвечает. Если этого нет - озеро превращается в болото.
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39446634
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Интересно было бы услышать "истории успеха" bigdata в России, в том числе почему не подошла "стандартная" архитектура.
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39446637
Фотография Alex_496
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Критик,

+1
... и как затраты на bigdata отбиваются, приносят прибыль компании, а не кому-то в карман
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39446639
Фотография javajdbc
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
LeorisВ идеале озера данных - реплика данных, как они хранятся в операционных приложениях. Чтобы разработчики имели один источник данных и все ETL и интеграции делали на их основе, а не тянулись руками в пром и роняли базы запросами ))

Вообщето есть ODS -- периодическая копия продакшена если (!) LOB продакшен дата сушествует .
Но ДатаЛейк шире чем набор ODS-сов. Далалейк может сохранять стримы,
Даталейк может делать ODS хистори.
Так же как и основная задача DWH -- иметь "единую правду"
структурированых И ПРОАНАЛИЗИРОВАНЫХ данных,
то оснавная задача DL -- хранить НЕ структурированую и/или
НЕ проанализированые данные.

Проанализировнаые данные -- данные которы имеют документировнаую
структуру и связи с другими блоками EDS. Короче это называется "schema".
DWH по определению "схема-при-записи" -- только структурированые
и связаные данные попадают туда.
DL по определению "схема-при-чтении". т.е. туда буквально сваливают
все что приходит , но связки и анализ происходит когда
данные вынимаются аналитиками.

схематично:

schema-on-write: raw data >сложно> analysis >средне> DWH >легко> usage
schema-on-read: raw data >очень легко> DL >сложно, возможен бардак> analysis+usage
комбинация: raw data >очень легко> DL >сложно> analysis >средне> DWH >легко> usage
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39446641
Dmitry Biryukov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Alex_496... и как затраты на bigdata отбиваются, приносят прибыль компании, а не кому-то в карманохоспади.. а как затраты на банальные пивоты в экселе приносят прибыль? эти все бигдаты затеяны ради конкурентного преимущества. кто-то может его использовать, а кто-то нет. это не так просто как станок с чпу заменяет трёх рабочих...
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39446661
Joz07Задумался о будущем и об области применения реляционных DWH и Big Data в России.

...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39446677
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dmitry BiryukovAlex_496... и как затраты на bigdata отбиваются, приносят прибыль компании, а не кому-то в карманохоспади.. а как затраты на банальные пивоты в экселе приносят прибыль? эти все бигдаты затеяны ради конкурентного преимущества. кто-то может его использовать, а кто-то нет. это не так просто как станок с чпу заменяет трёх рабочих...

Каких конкурентных преимуществ? Скорее мода такая.
Почитайте, как в Тинькове нагородили систему из почти двух десятков серверов, чтобы проанализировать всего лишь 100Гб суточных логов их сайта. Плюс расходы на команду из ориентировочно 5-7 человек. Задача решается без таких извращений.
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39446727
Фотография essbase.ru
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Alex_496,

Поищите avito ,на хабре и ютубе.
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39446793
Voyager_lan
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Joz07,

Пока кол-во реально успешных проектов автоматизации учета не поднимется (и не только у нас , в РФ), то уж поверьте, без хлеба не останетесь. Зачастую сложность и постоянная изменяемость процессов в бизнесе, компенсирует объемы еще как :)
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39447305
Бумбараш
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Joz075. А зарплаты программистов, например Spark, упадут.
6. Новых проектов на реляционных DWH почти нет.
Когда-нибудь в российском айти было такое, что зарплаты у программистов "падают"? Не припомню такого. (абаперов не предлагать, там изначально сильный оверпрайс был). Медленнее расти, чем в другим направлениях - да, такое может быть.
Новые проекты есть. Их, конечно, меньше, чем на пике, но с тем, что прям всё так увядает - я бы не сказал.
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39447321
Бумбараш
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
КритикИнтересно было бы услышать "истории успеха" bigdata в России, в том числе почему не подошла "стандартная" архитектура.
Для того, чтобы бабло шло в каком-то направлении (и зарплаты в нем специалистов), необязательно, чтобы были "истории успеха". Такой же вопрос о историях успеха можно задать относительно "стандартной" архитектуры. Много ли там этих историй?

Потому, как бабло двигалось в "стандартную" архитектуру, так оно будет литься и в бигдату. Что мы сейчас и наблюдаем. Конечно, если там будет сильное преобладание "грустных" и "очень грустных" историй, то поток денег просто быстрее увянет. Но в любом случае на несколько лет, я думаю и на пять, вполне хватит.
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39447414
Dmitry Biryukov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
БумбарашКогда-нибудь в российском айти было такое, что зарплаты у программистов "падают"? Не припомню такогоудивительно такое слышать от БиАйщика. в зимбабве тоже зарплаты росли. причём ежечасно. процентов на 300 ;)
напомню, что минимальный рост зарплаты должен быть даже не выше инфляции, а выше самого выгодного вложения денег (не МММ)
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39447459
Бумбараш
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dmitry Biryukov в зимбабве тоже

рост зарплаты должен быть выше самого выгодного вложения денег
попытка ок, но крео не осилил
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39447576
Фотография bbx1389
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Joz07,

з.п. вопрос интересный, гипотетически , если предположить, что BI движется в сторону Self-Service и граница IT/не IT размывается, то логично что з.п. может и не расти, т.к. для бизнеса-это "простая" деятельность, чай не хадупы с бигдатами:)

рынок DWH уже сформировался
не понятно о чем вы, все Компании растут, со временем у них появляется потребность в отчетности и аналитике, постепенно они обзаводятся DWH/BI
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39447610
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Тенденции типа BI Self-Service у нас оказывают минимальное влияние на процесс роста зп, больше влияет разрыв общемировых зп и наших, если работодатели не будут повышать компенсацию до уровня, который будет близок к оплате на западе, то специалистов в наличии будет все меньше и меньше. Все же айтишники - самые мобильные в массовом сегменте.
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39449711
Yo.!
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
сейчас участвую в проекте, где пытаются заменить оракловые DWH и аналитику на DataLake/Hadoop перевести. не потому, что данных много и реляционные не тянут, а тупо потому, что расти на оракле становиться чудовищно дорого. в бигдата все данные строго структурированы, хватает ума не превращать DataLake в свалку.

думаю в свете санкций и странновастой ценовой политики в России тоже пойдет мода на замену ораклу, потому как если уж вкладывать бабло на переезд, то логичней в бигдату, там действительно интересные плюшки становиться реальным реализовать. например теперь реально за пол часа сгенерить реляционные таблички импалы на нужный момент времени в прошлом, которые аналитик со своим SAS data miner может работать как привык в оракловые времена. на оракле такое было бы пипец как дорого.

так что дело не в структурированности, а том что хотелки бизнеса становиться дешевле реализовать мигрируя на бигдату, со всеми тратами на миграцию, железо, девелоперов.
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39449768
Ivan Durak
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
и какие у вас sas конекторы к импале??
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39449791
Yo.!
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Ivan Durakи какие у вас sas конекторы к импале??
точно не знаю, но данные в SAS точно из импалы берут. думаю по odbc, т.к. краем уха слышал, что наш местечковый "аналитик" именно с odbc воевал.
...
Рейтинг: 0 / 0
Будущее реляционных DWH и Big Data в России
    #39450025
JJZ
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Yo.!сейчас участвую в проекте, где пытаются заменить оракловые DWH и аналитику на DataLake/Hadoop перевести. не потому, что данных много и реляционные не тянут, а тупо потому, что расти на оракле становиться чудовищно дорого. в бигдата все данные строго структурированы, хватает ума не превращать DataLake в свалку.

думаю в свете санкций и странновастой ценовой политики в России тоже пойдет мода на замену ораклу, потому как если уж вкладывать бабло на переезд, то логичней в бигдату, там действительно интересные плюшки становиться реальным реализовать. например теперь реально за пол часа сгенерить реляционные таблички импалы на нужный момент времени в прошлом, которые аналитик со своим SAS data miner может работать как привык в оракловые времена. на оракле такое было бы пипец как дорого.

так что дело не в структурированности, а том что хотелки бизнеса становиться дешевле реализовать мигрируя на бигдату, со всеми тратами на миграцию, железо, девелоперов.

Да у меня примерно такое же видение, что рынок Oracle DB будет потихоньку уменьшаться в России, что надо изучать Java и переходить постепенно в Java Web, интеграцию или BigData
...
Рейтинг: 0 / 0
24 сообщений из 24, страница 1 из 1
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / Будущее реляционных DWH и Big Data в России
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]