powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / Что так все носятся с этой bigdata-ой?
25 сообщений из 59, страница 2 из 3
Что так все носятся с этой bigdata-ой?
    #39495603
Полковник.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Дедушка,

Так я и спрашиваю при чем тут биг-дата? Что с ней все носятся то, хадупы разворачивают надо и не надо, дальше то что? Ответа пока не услышал.
Три года назад в январе довелось мне на каком-то собрании читать небольшую лекцию о применении технологий биг-дата для построения реляционных ХД. Технологиях!!! Я и говорю, что биг-дата это ПЛАТФОРМА для решения конкретных задачь.
Какие конкретные задачи на этой платформе собирается решать, к примеру банк ВТБ? Что за фигня, зачем они полезли туда? И таких вот примеров вагон и маленькая тележка.
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39495616
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Полковник.Дедушка,

Так я и спрашиваю при чем тут биг-дата? Что с ней все носятся то, хадупы разворачивают надо и не надо, дальше то что? Ответа пока не услышал.
Три года назад в январе довелось мне на каком-то собрании читать небольшую лекцию о применении технологий биг-дата для построения реляционных ХД. Технологиях!!! Я и говорю, что биг-дата это ПЛАТФОРМА для решения конкретных задачь.
Какие конкретные задачи на этой платформе собирается решать, к примеру банк ВТБ? Что за фигня, зачем они полезли туда? И таких вот примеров вагон и маленькая тележка.[youtube=
YouTube Video
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39495618
Yo.!
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Полковник.Какие конкретные задачи на этой платформе собирается решать, к примеру банк ВТБ? Что за фигня, зачем они полезли туда? И таких вот примеров вагон и маленькая тележка.
а куда им еще надо было лезть ? в оракл и получить "ORA-100500 ваш баш банк совершил нелегальную операцию в Крыму, пожалуйста закройте банк и будьте впреть умнее ?"
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39495626
Фотография javajdbc
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
биг-дата -- это в первую очередь "философский" вопрос.

Природа разнообразна, аморфна и рассредоточена,
реляционая база заранее фиксирована. Любая модель, формула,
закон всемирного тяготения или аеродинамики -- есть
рабочая попытка описать и обьяснить сложные явления
простымы связками. Законы прекрасно работают пока
не приходят новые вводные.

Развитие коммуникации привело к нелинейному росту
не только самих данных/фактов но и связок между ними.
Человеки перестали успевать находить связки в реальном
маштабе времени (т.е. дата анализ, дата дисковери не успевает к началу загрузки)
и обычные релационные базы просто
не могут уложить эти данные по полочкам -- связки не известны (пока).

Для таких (отнюдь не для всех) задач приходится делать EAV (дедушка даталейков),
даталейки, хадупы (для скейл-аут) и иже с ними.

На етапе записи подход "биг-дата" -- не заморачиваться
созданием новых структур, дата анализом, агрегацией...
Главное -- скушать все это ... будушее золото... и распихать по подземным
хранилишам.

На етапе чтения -- вот тут и начинается проблемы, ибо
schema-on-read ... читатель сам должен собирать структуру.
(то что до него уже сделано в обычных реляционных базах).

Тут вступает в игру противоречия

легко в записи - тяжело в чтении (в простейшем виде -- вспомним eav)

легко раскидать по дешевым ПС в хадупе -- ОЧЕНЬ тяжело
делать джоинты и искать корреляции по дистрибутед данным

легко работать с разрознеными статичными аморфными данными --
сложно работать с пре-структурироваными динамичными данными ...

короче -- биг-дата -- серьезный молоток для рассыпаных гвоздей разного размера
но плохонькая отвертка для набора шурупов....
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39495665
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Yo.!Полковник.Какие конкретные задачи на этой платформе собирается решать, к примеру банк ВТБ? Что за фигня, зачем они полезли туда? И таких вот примеров вагон и маленькая тележка.
а куда им еще надо было лезть ? в оракл и получить "ORA-100500 ваш баш банк совершил нелегальную операцию в Крыму, пожалуйста закройте банк и будьте впреть умнее ?" т.е. любой банк, собирающийся работать в Крыму просто обязан использовать big data? Мне кажется вы подменяется термином big data какой-то другой
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39495667
982183
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Полковник.982183пропущено...

Любом.
Отличный ответ.
Согласен. Какой вопрос, такой и ответ.
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39495714
Yo.!
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Alexander Ryndin т.е. любой банк, собирающийся работать в Крыму просто обязан использовать big data? Мне кажется вы подменяется термином big data какой-то другой
т.е. любой банк должен здраво оценивать риски и завязывать с русским авось, а у ВТБ, находящегося в санационном списке выбора и не было.

javajdbcДля таких (отнюдь не для всех) задач приходится делать EAV (дедушка даталейков),
даталейки, хадупы (для скейл-аут) и иже с ними.

На етапе записи подход "биг-дата" -- не заморачиваться
созданием новых структур, дата анализом, агрегацией...
Главное -- скушать все это ... будушее золото... и распихать по подземным
хранилишам.

На етапе чтения -- вот тут и начинается проблемы, ибо
schema-on-read ...
религия никому не запрещает при записи сразу считать агрегаты и копировать на тот же хадуп эти же данные в реляционные структуры, типа витрин данных. BI инструменты уже давно не испытывают трудностей наджоинить в хадупе чего пожелаешь с помощью impala, tez или spark sql.
скушать и неструктурированные данные лишь дополнительная фишка, просто в истории с хадупом это ничего не стоит их записать и сохранить, ресурсы то резиновые.
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39496477
Фотография essbase.ru
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Теперь в трендах новый термин Clever Data . Нужно говорить всем , что этим занимаемся до того как это стало модным ) ))
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39496488
LSV
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Бигдата, облака, хадупы, блокчейны, биткИ, эфиры, спиннеры........ это всё не более чем мемы.
Эра информации мыслит только мемами. Не важно какими, главное, что популярными мемами. Надо быть модным и в тренде.
Завтра появится очередная мемошняга - и все кинутся ее обсасывать, обсуждать, применять, делать разного рода перфомансы и инсталляции.... И прочее инфодрочево.
Людям просто нечем заняться на фоне прогрессирующего массового скудоумия.....
Кризис жанра, пацаны. :)
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39496546
Yo.!
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
точно. все крупные корпорации на самом деле dwh на foxpro держат, но что бы злые русские и мудрые украинцы не догадались напридумывали базвордов аля хадуп, дата лейки и прочие смешные слова. :)
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39496809
982183
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Про мемы это конечно верно.
Но всё же, например, БД бух/фин системы и БД данных с датчиков технологической линии это совершенно разные вещи.
Даже если реализованы в одной СУБД.
И подходы к работе с данными совершенно другие.
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39496845
Фотография javajdbc
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
essbase.ruТеперь в трендах новый термин Clever Data . Нужно говорить всем , что этим занимаемся до того как это стало модным ) ))

...чаще "Smart Data"...
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39496853
Фотография javajdbc
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
>>Yo.!

>> религия никому не запрещает при записи сразу считать агрегаты и копировать на тот же хадуп эти же данные в реляционные структуры, типа витрин данных.

...не то штоп религия не запрешает...сама идея биг-даты -- по слыслу есть ELT,
сначала загрузить а потом разбиратся... Агрегаты возможны если данные уже
про-анализированы, по факту : агрегаты уже есть модель.
А если мы говорим про пре-анализированые, уже смоделированые данные, то
что остается той Биг-Дате? скале-аут? так кластеры уже давно есть в
обычных реляционках...

Ну и вдобавок, агрегаты , по определению меньше исходных данных
и хотелось бы чтоб они лежали близко к аналитикам анд не размазаные по
сотням компютерам в сети...

Короче -- биг-дата не про агрегаты...

>>BI инструменты уже давно не испытывают трудностей наджоинить в хадупе чего пожелаешь с помощью impala, tez или spark sql.

...согласен, никаких трудностей : забил СКЛ с жоинтом и
можно пойти на обед... пока несколько джоинтов для регресивного
анализа вернется через мириарды нетворк-запросов...
можно спокойно пару гамбургеров с пивом уговорить....

>>скушать и неструктурированные данные лишь дополнительная фишка, просто в истории с хадупом это ничего не стоит их записать и сохранить, ресурсы то резиновые.

...вот тут реально где хадуп и нужен... на запись аморфных данных
хадуыт действительно резиновый... как я уже сказал,
реальная работа начинается при чтении... причем дистрибутивная
натура в лучшем случае НЕ помогает анализу и агрегации
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39496860
Фотография javajdbc
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
LSVБигдата, облака, хадупы, блокчейны, биткИ, эфиры, спиннеры........ это всё не более чем мемы.
Эра информации мыслит только мемами. Не важно какими, главное, что популярными мемами. Надо быть модным и в тренде.
Завтра появится очередная мемошняга - и все кинутся ее обсасывать, обсуждать, применять, делать разного рода перфомансы и инсталляции.... И прочее инфодрочево.
Людям просто нечем заняться на фоне прогрессирующего массового скудоумия.....
Кризис жанра, пацаны. :)


...что за старперство? что за брузжание?
тот факт что огурец кто-то пихает в попу НЕ значит что
огурцы плохие. За каждым из етих модных слов
есть много интересных идей и технологий...

..почти по теме -- Безос обощел Била как самый богатый человек мира.
Амазон развил идею облаков, PaaS, IaaS сначала в ИТ
а сечас на реальную ретейл индустрию, логистику, медию, etc...
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39496915
Фотография Alex_496
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
essbase.ruТеперь в трендах новый термин Clever Data . Нужно говорить всем , что этим занимаемся до того как это стало модным ) ))

ну тогда уж можно начинать говорить: сверхбольшие данные, непрерывные данные, галактика данных, монетизация галактики
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39497264
Yo.!
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
javajdbc...не то штоп религия не запрешает...сама идея биг-даты -- по слыслу есть ELT,
сначала загрузить а потом разбиратся... Агрегаты возможны если данные уже
про-анализированы, по факту : агрегаты уже есть модель.
А если мы говорим про пре-анализированые, уже смоделированые данные, то
что остается той Биг-Дате? скале-аут? так кластеры уже давно есть в
обычных реляционках...

кластеры то есть, только смысла от них считай ноль. EE лицензия на оракл $55k+$20k rac option + $20k партишенинг + 18% супорт. и так за каждое ядрышко. что толку с таких кластеров при таких ценах ?

javajdbcНу и вдобавок, агрегаты , по определению меньше исходных данных
и хотелось бы чтоб они лежали близко к аналитикам анд не размазаные по
сотням компютерам в сети...

неосилил глубокую столь мысль.

javajdbc...согласен, никаких трудностей : забил СКЛ с жоинтом и
можно пойти на обед... пока несколько джоинтов для регресивного
анализа вернется через мириарды нетворк-запросов...
можно спокойно пару гамбургеров с пивом уговорить....

ручки...
реально вот тесты tpc-ds на 10ТБ, джоинов там в запросиках полно, ответ в течении секунд. никаких проблем.
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39497345
Полковник.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Yo.!,

TPC-DS? Это не показатель, для тестов серверов и баз данных на задачи BI нужны тесты TPC-H. Да и джойны тоже разные бывают.
Как там у вас в бигдате с рекурсивным и оконными функциями, появились уже?
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39497363
Yo.!
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Полковник.TPC-DS? Это не показатель, для тестов серверов и баз данных на задачи BI нужны тесты TPC-H. Да и джойны тоже разные бывают.
Как там у вас в бигдате с рекурсивным и оконными функциями, появились уже?
глупости пишешь. tpc-ds для замены tpc-h и был создан, т.к. tpc-h уже лет 15 считается устаревшим. именно в tpc-ds обычные факты, дименсии именно те джоины, что присущи dwh. и вот именно они выдают результ за секунды.

аналитические функции с окнами есть, как раз недавно мерились кодом sparkSQL vs mapreduce
http://www.sql.ru/forum/actualutils.aspx?action=gotomsg&tid=1219227&msg=20604267

рекурсивных вроде в импале нет.
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39497568
RioMare
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Полковник.Как там у вас в бигдате с рекурсивным и оконными функциями, появились уже?

А зачем именно в бигдате ? И то, и другое есть в R, про коммерческий SAS/ETS можно не упоминать :)
Как пример : было измерение Customer с 20 аттрибутами - нормальная задача для любого нормального BI.
После того, как тут ( в ЕС ) очень сильно изменились нормативные акты в области KYC/AML эти 20 аттрибутов превратились в 120+ ( теоретически неограниченно - на реплику по теме "галактика данных" :) ) где у половины отношение one-to-many.
Вся мощь рекурсивных и оконных функций Oracle это дело конечно перемолола, но на выходе получиласть совершенно неработоспособная структура.
Что Yo! наверное хочет сказать - требования к количесву обрабатываемой информации меняются и поэтому технология обработки данных тоже меняется. В своем роде профанация, но скажем blockchain очень сильно изменили способы скачивания пиратского софта :))
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39497623
Полковник.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
RioMare,

Речь в данном месте идет о России. Что там у вас в EU мне, не ведомо.
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39497631
Полковник.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Yo.!
глупости пишешь. tpc-ds для замены tpc-h и был создан, т.к. tpc-h уже лет 15 считается устаревшим. именно в tpc-ds обычные факты, дименсии именно те джоины, что присущи dwh. и вот именно они выдают результ за секунды.

аналитические функции с окнами есть, как раз недавно мерились кодом sparkSQL vs mapreduce
http://www.sql.ru/forum/actualutils.aspx?action=gotomsg&tid=1219227&msg=20604267

рекурсивных вроде в импале нет.

это не я пишу глупости, это ты пытаешься притянуть за уши бигдату туда, где ее никто не ждет
tpc-h у тебя устарел, что у тебя еще там устарело, а то мужики то не знают? давай бухти дальше про космические корабли и большой театр
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39497670
RioMare
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Полковник.Дедушка,
Какие конкретные задачи на этой платформе собирается решать, к примеру банк ВТБ? Что за фигня, зачем они полезли туда?
Я далёк от ВТБ, но я бы сказал, что полезли они туда вот по этой причине - хотите работать на международных рынках, то пожалуйста будьте compliant, либо #давайдосвидания
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39497691
Yo.!
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
RioMareЧто Yo! наверное хочет сказать - требования к количесву обрабатываемой информации меняются и поэтому технология обработки данных тоже меняется. В своем роде профанация, но скажем blockchain очень сильно изменили способы скачивания пиратского софта :))
я хочу сказать, что технология реально работает и задешево заменяет dwh в реальных предприятиях. а сколько там данных не суть. потому все и носятся, потому что разница по деньгам невероятна.

Полковник.это не я пишу глупости, это ты пытаешься притянуть за уши бигдату туда, где ее никто не ждет
tpc-h у тебя устарел, что у тебя еще там устарело, а то мужики то не знают? давай бухти дальше про космические корабли и большой театр
да, да. я тот самый темный Лорд, который пропихнул хадуп во все крупные мировые банки и устроил весь этот хайп. в одиночку :)
ты можешь громко пукнуть от возмущения но это не изменит тот факт, что tpc-h устарел и на его замену выкатили tpc-ds.
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39497697
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
RioMareно скажем blockchain очень сильно изменили способы скачивания пиратского софта :))Че-че?
...
Рейтинг: 0 / 0
Что так все носятся с этой bigdata-ой?
    #39497842
RioMare
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Alexander Ryndin,

Offtop, но чего все носятся с торрентами, когда есть старый добрый FTP ? ( если по теме дискусии )
...
Рейтинг: 0 / 0
25 сообщений из 59, страница 2 из 3
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / Что так все носятся с этой bigdata-ой?
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]