|
|
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
Задумался о будущем и об области применения реляционных DWH и Big Data в России. Ну и о путях своего дальнейшего развития :-) Область применения классических DWH (SQL -хранилищ, построенных на Oracle, MSSQL, Teradata, ...): 1. Создание строгой отчетности по структурированным данным. Например, банковская отчетность для регуляторов(ЦБ), государственных структур, высшего менеджмента. Здесь данные уже структурированы (например, денежные транзакции) и важна точность. Область применения Big Data: 1. Поддержка принятия решений, где данных много, где данные неструктурированны, где нужен их анализ (Machine Learning). Будущее в России: 1. Классические реляционные DWH останутся в крупных и средних компаниях (особенно в банках), где нужна отчетность для регуляторов, где данные структурированы. 2. BigData останется и будет там, где действительно много данных для реляционных хранилищ, где данные неструктурированны, и где есть хоть небольшая, но конкуренция, например, телеком, ретейл, банковские продукты, ориентированные не на корпоративный сектор. Где есть польза от принятия решений на основе анализа рынка. 3. Все больше OLTP и OLAP систем будет строиться на бесплатных реляционных СУБД типа PostgreSQL. Некоторые компании уже перешли и у многих в планах переход с дорогой РСУБД Oracle на PostgreSQL. 4. Много BigData проектов после всплеска интереса умрет, т.к. в России не развитая экономика и для многих направлений аналитика данных особенно не приносит дохода, т.к. проще договориться с кем нужно, чем основываясь на аналитике данных повышать продажи на 1%. 5. в BigData если и будут платить деньги выше среднего программиста, то только аналитикам BigData(которые знают Machine Learning), могут непосредственно давать советы бизнесу. А зарплаты программистов, например Spark, упадут. 6. Сейчас зарплаты программистов отчетности и ETL для классических DWH ниже зарплат Java программистов и в дальнейшем не будут расти, т.к. рынок DWH уже сформировался. Новых проектов на реляционных DWH почти нет. Остается поддержка и доработка существующих ETL процессов, поддержка отчетности. Специалистов сформировалось за годы внедрения DWH с начала 2000-х много. Вопрос: согласны ли вы с данными выводами ? Спасибо ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.04.2017, 00:31 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
где-то у тебя в цепочке мыслей произошла подмена понятий. На всю простыню отвечать нет смысла, отвечу на главное- Главная ценность DWH как раз в способности превращать неструктурированные, несвязанные, разрозненные данные в структурированные, цельные и консистентные. Это и приносит бизнес вэлью. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.04.2017, 09:33 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
Joz07Область применения Big Data: 1. Поддержка принятия решений, где данных много, где данные неструктурированны, где нужен их анализ (Machine Learning). а где данных много и они одновременно неструктурированны? сможете ответить на этот вопрос - тогда сможете очертить круг потенциальных работодателей и оценить свои выгоды при принятии решения о переквалификации ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.04.2017, 12:18 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
Ivan Durak Главная ценность DWH как раз в способности превращать неструктурированные, несвязанные, разрозненные данные в структурированные, цельные и консистентные. Это и приносит бизнес вэлью. Присоединюсь , что бы рядом постоять ) А для DataLake есть определение ? Каждый ищет свое Value ? ) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.04.2017, 13:54 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
essbase.ru, болото данных ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.04.2017, 14:06 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
авторв BigData если и будут платить деньги выше среднего программиста, то только аналитикам BigData(которые знают Machine Learning), могут непосредственно давать советы бизнесу. А зарплаты программистов, например Spark, упадут. У открытых систем, внезнапно, есть одно преимущество. На больших объемах данных (как раз средние/большие компании) каждый сервер Оракла / лишний терабайт в Терадате стоит как крыло самолёта. В пересчёте на терабайт места разница может быть в пару порядков. Но есть оверхед при первоначальной настройке. Так что надо считать. Ещё момент - вы не упомянули про данные с счетчиков(в т.ч. IoT). Этого у нас пока мало, но скорее всего будет расширяться. Там реально нужно перелопатить большие объемы данных, чтобы на выход получить несколько строчек. essbase.ruА для DataLake есть определение ? Каждый ищет свое Value ? ) В идеале озера данных - реплика данных, как они хранятся в операционных приложениях. Чтобы разработчики имели один источник данных и все ETL и интеграции делали на их основе, а не тянулись руками в пром и роняли базы запросами )) Сложность в том, что требуется в мониторинг и периодическая перенастройка, когда меняется схема данных в приложении источнике. Ещё нужен справочник мета-данных: что мы туда сложили, какие etl-процедуры складывают и кто за них отвечает. Если этого нет - озеро превращается в болото. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.04.2017, 20:56 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
Интересно было бы услышать "истории успеха" bigdata в России, в том числе почему не подошла "стандартная" архитектура. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.04.2017, 22:15 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
Критик, +1 ... и как затраты на bigdata отбиваются, приносят прибыль компании, а не кому-то в карман ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.04.2017, 22:19 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
LeorisВ идеале озера данных - реплика данных, как они хранятся в операционных приложениях. Чтобы разработчики имели один источник данных и все ETL и интеграции делали на их основе, а не тянулись руками в пром и роняли базы запросами )) Вообщето есть ODS -- периодическая копия продакшена если (!) LOB продакшен дата сушествует . Но ДатаЛейк шире чем набор ODS-сов. Далалейк может сохранять стримы, Даталейк может делать ODS хистори. Так же как и основная задача DWH -- иметь "единую правду" структурированых И ПРОАНАЛИЗИРОВАНЫХ данных, то оснавная задача DL -- хранить НЕ структурированую и/или НЕ проанализированые данные. Проанализировнаые данные -- данные которы имеют документировнаую структуру и связи с другими блоками EDS. Короче это называется "schema". DWH по определению "схема-при-записи" -- только структурированые и связаные данные попадают туда. DL по определению "схема-при-чтении". т.е. туда буквально сваливают все что приходит , но связки и анализ происходит когда данные вынимаются аналитиками. схематично: schema-on-write: raw data >сложно> analysis >средне> DWH >легко> usage schema-on-read: raw data >очень легко> DL >сложно, возможен бардак> analysis+usage комбинация: raw data >очень легко> DL >сложно> analysis >средне> DWH >легко> usage ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.04.2017, 22:31 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
Alex_496... и как затраты на bigdata отбиваются, приносят прибыль компании, а не кому-то в карманохоспади.. а как затраты на банальные пивоты в экселе приносят прибыль? эти все бигдаты затеяны ради конкурентного преимущества. кто-то может его использовать, а кто-то нет. это не так просто как станок с чпу заменяет трёх рабочих... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.04.2017, 22:33 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.04.2017, 23:45 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
Dmitry BiryukovAlex_496... и как затраты на bigdata отбиваются, приносят прибыль компании, а не кому-то в карманохоспади.. а как затраты на банальные пивоты в экселе приносят прибыль? эти все бигдаты затеяны ради конкурентного преимущества. кто-то может его использовать, а кто-то нет. это не так просто как станок с чпу заменяет трёх рабочих... Каких конкурентных преимуществ? Скорее мода такая. Почитайте, как в Тинькове нагородили систему из почти двух десятков серверов, чтобы проанализировать всего лишь 100Гб суточных логов их сайта. Плюс расходы на команду из ориентировочно 5-7 человек. Задача решается без таких извращений. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.04.2017, 01:50 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
Alex_496, Поищите avito ,на хабре и ютубе. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.04.2017, 13:00 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
Joz07, Пока кол-во реально успешных проектов автоматизации учета не поднимется (и не только у нас , в РФ), то уж поверьте, без хлеба не останетесь. Зачастую сложность и постоянная изменяемость процессов в бизнесе, компенсирует объемы еще как :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.04.2017, 21:47 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
Joz075. А зарплаты программистов, например Spark, упадут. 6. Новых проектов на реляционных DWH почти нет. Когда-нибудь в российском айти было такое, что зарплаты у программистов "падают"? Не припомню такого. (абаперов не предлагать, там изначально сильный оверпрайс был). Медленнее расти, чем в другим направлениях - да, такое может быть. Новые проекты есть. Их, конечно, меньше, чем на пике, но с тем, что прям всё так увядает - я бы не сказал. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.05.2017, 13:25 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
КритикИнтересно было бы услышать "истории успеха" bigdata в России, в том числе почему не подошла "стандартная" архитектура. Для того, чтобы бабло шло в каком-то направлении (и зарплаты в нем специалистов), необязательно, чтобы были "истории успеха". Такой же вопрос о историях успеха можно задать относительно "стандартной" архитектуры. Много ли там этих историй? Потому, как бабло двигалось в "стандартную" архитектуру, так оно будет литься и в бигдату. Что мы сейчас и наблюдаем. Конечно, если там будет сильное преобладание "грустных" и "очень грустных" историй, то поток денег просто быстрее увянет. Но в любом случае на несколько лет, я думаю и на пять, вполне хватит. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.05.2017, 13:33 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
БумбарашКогда-нибудь в российском айти было такое, что зарплаты у программистов "падают"? Не припомню такогоудивительно такое слышать от БиАйщика. в зимбабве тоже зарплаты росли. причём ежечасно. процентов на 300 ;) напомню, что минимальный рост зарплаты должен быть даже не выше инфляции, а выше самого выгодного вложения денег (не МММ) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.05.2017, 15:53 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
Dmitry Biryukov в зимбабве тоже рост зарплаты должен быть выше самого выгодного вложения денег попытка ок, но крео не осилил ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.05.2017, 16:40 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
Joz07, з.п. вопрос интересный, гипотетически , если предположить, что BI движется в сторону Self-Service и граница IT/не IT размывается, то логично что з.п. может и не расти, т.к. для бизнеса-это "простая" деятельность, чай не хадупы с бигдатами:) рынок DWH уже сформировался не понятно о чем вы, все Компании растут, со временем у них появляется потребность в отчетности и аналитике, постепенно они обзаводятся DWH/BI ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.05.2017, 21:06 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
Тенденции типа BI Self-Service у нас оказывают минимальное влияние на процесс роста зп, больше влияет разрыв общемировых зп и наших, если работодатели не будут повышать компенсацию до уровня, который будет близок к оплате на западе, то специалистов в наличии будет все меньше и меньше. Все же айтишники - самые мобильные в массовом сегменте. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.05.2017, 23:16 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
сейчас участвую в проекте, где пытаются заменить оракловые DWH и аналитику на DataLake/Hadoop перевести. не потому, что данных много и реляционные не тянут, а тупо потому, что расти на оракле становиться чудовищно дорого. в бигдата все данные строго структурированы, хватает ума не превращать DataLake в свалку. думаю в свете санкций и странновастой ценовой политики в России тоже пойдет мода на замену ораклу, потому как если уж вкладывать бабло на переезд, то логичней в бигдату, там действительно интересные плюшки становиться реальным реализовать. например теперь реально за пол часа сгенерить реляционные таблички импалы на нужный момент времени в прошлом, которые аналитик со своим SAS data miner может работать как привык в оракловые времена. на оракле такое было бы пипец как дорого. так что дело не в структурированности, а том что хотелки бизнеса становиться дешевле реализовать мигрируя на бигдату, со всеми тратами на миграцию, железо, девелоперов. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.05.2017, 11:12 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
и какие у вас sas конекторы к импале?? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.05.2017, 15:56 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
Ivan Durakи какие у вас sas конекторы к импале?? точно не знаю, но данные в SAS точно из импалы берут. думаю по odbc, т.к. краем уха слышал, что наш местечковый "аналитик" именно с odbc воевал. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.05.2017, 20:33 |
|
||
|
Будущее реляционных DWH и Big Data в России
|
|||
|---|---|---|---|
|
#18+
Yo.!сейчас участвую в проекте, где пытаются заменить оракловые DWH и аналитику на DataLake/Hadoop перевести. не потому, что данных много и реляционные не тянут, а тупо потому, что расти на оракле становиться чудовищно дорого. в бигдата все данные строго структурированы, хватает ума не превращать DataLake в свалку. думаю в свете санкций и странновастой ценовой политики в России тоже пойдет мода на замену ораклу, потому как если уж вкладывать бабло на переезд, то логичней в бигдату, там действительно интересные плюшки становиться реальным реализовать. например теперь реально за пол часа сгенерить реляционные таблички импалы на нужный момент времени в прошлом, которые аналитик со своим SAS data miner может работать как привык в оракловые времена. на оракле такое было бы пипец как дорого. так что дело не в структурированности, а том что хотелки бизнеса становиться дешевле реализовать мигрируя на бигдату, со всеми тратами на миграцию, железо, девелоперов. Да у меня примерно такое же видение, что рынок Oracle DB будет потихоньку уменьшаться в России, что надо изучать Java и переходить постепенно в Java Web, интеграцию или BigData ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.05.2017, 09:41 |
|
||
|
|

start [/forum/topic.php?fid=49&msg=39446518&tid=1858258]: |
0ms |
get settings: |
8ms |
get forum list: |
15ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
159ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
60ms |
get tp. blocked users: |
1ms |
| others: | 250ms |
| total: | 513ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...