powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / MSSQL 2016 или экзотика
25 сообщений из 29, страница 1 из 2
MSSQL 2016 или экзотика
    #39477431
кириллk
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Добрый день! Очень хочу услышать ваше мнение.

Есть OLTP на mssql 2016. Нужно сделать хранилище. объем несколько десятков ТБ с возможностью роста (перспектива)

Есть 2 варианта: 1. сделать на mssql columstore или на экзотике. (Вертика, кликхаус, Impala)

mssql
Плюсы
есть железо и админы и стабильность
Минусы: боссы хотят:
чтобы было современно =колоночную (mssql columstore)
чтобы было надолго. т.е. вариант сделать на mssql, а если не взлетит потом переходить на другое не хотят.

Вопрос с финансами сильно не стоит, т.е . готовы платить
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39477450
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
посчитайте объем,
посчитайте цену (вертика лицензируется за объем)
прикиньте доступность специалистов

если будете делать на mssql, то для приемлемой производительности ХД нужно делать чисто на инкременте, т.к. columstore очень медленно апдейтится
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39477489
Полковник.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
кириллk,

ХД какого плана ? Предполагается только вставка новых данных или перезагрузка данных / update задним числом?

Вертика например только вставка причем БАЛКЛОАДЕРОМ из чего то готового, например из стэйджинга на том же MS SQL, тогда вопрос если есть MS SQL нафига тогда вертика.

Если предполагается апдейт данных, постоянная перезаливка истории за неизвестный период - то только традиционные базы данных это oracle или ms sql.

Колоночное хранения иногда приносит вред а не пользу, с ними нужно быть очень осторожным в использовании, это не панацея а просто полезная фишка.
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39477506
Фотография Alex_496
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
exadata им продайте
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39477556
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
1. Хранилище в несколько TB на MSSQL редкость
2. По поводу Vertica все правильно сказали - если база довольно большая,то обычно через некоторое время приходят к тому, что перед MPP нужно поставить еще одну базу как stage/ODS
3. Как stage/ODS обычно используют Oracle.
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39477557
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Alexander Ryndin1. Хранилище в несколько TB на MSSQL редкость
2. По поводу Vertica все правильно сказали - если база довольно большая,то обычно через некоторое время приходят к тому, что перед MPP нужно поставить еще одну базу как stage/ODS
3. Как stage/ODS обычно используют Oracle.
1. В смысле хранилище в несколько десятко ТБ - редкость
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39477617
Фотография George Nordic
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Alex_496exadata им продайтеДобрый вы... Могли и терадату предложить.

По сути - не все же данные будут в поколонке хранится. Т.е разделяйте DHW и ADWH. Все данные можно и на sql хранить. Не все же "десятки ТБ" для аналитики нужны. Т.е. храните все в реляционке, потом переливаете с упорядочиванием в стейдж, а оттуда - балком в поколонку (sql, Vertica, greenplum - у него код открыли, кстати). Если данные упорядочены в соответствии с тем, как они будут хранится в мрр, они должны довольно быстро залетать. Такое вот гибридное хранение. Кстати, в DB2 тоже все это анонсировали.

С Уважением,
Георгий
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39477619
Фотография vikkiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
IMO - не хватает главной информации: нужно оно-то нужно, но для чего? какие цели преследуются? в каких пропорциях/приоритетах? при желании можно и в облако вынести - например в APS (PDW) возможно по необходимости динамически нарастить параллельно железа для ускорения процесса если вдруг что-то медленно работает / поздно стартануло и не успевают в SLA вложиться (к примеру что-то обычно считалось/грузилось за час и вдруг срочно надо за 5 минут)
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39479083
Sintetik
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
и как у вас распределены данные?
обычно 2 варианта
1. много-много предметных областей с более менее равномерным распределением размеров таблиц
2. 1-2-3 таблицы дающие 99,9% объема + куча мелких справочников дающих в сумме 0,1% размера от хранилища

во втором случае почти наверняка такие портянки никому не нужны реально, стараются максимально сагрегировать, а портянки пусть лежат на случай пересчета агрегатов.
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39480725
кириллk
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Большое спасибо за ответы.
Попробую ответить на все вопросы
Закзачик ретейлер

Значит хотят, продажи детальные, стоки по дням. вообщем классика. (рядом клиенты )

т.е. 3 большие таблицы которые должны дружить между собой.

Есть FTPS севрер, куда раз в стуки пишутся разные файлики. с продажами, стоками итд.
Данные могут меняться . тогда приходит новый файлик с исправленными данным

===
Разделит DHW и ADWH. не получится. стоки и продажи и нужны детальные для аналитики и занимают 70-75 места%
===
Разговор с терадатой и экзадатой был, по функционалу они похожи, но специалистов больше на oracle
===
Хранилище нужно всем и в магазинах и офисе.
только в магазинах достаточно "плоских" отчетов
А офис хочет растить своих "data scientist"
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39480726
кириллk
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
кириллk,

Забыл добавить у нас уже есть 2 сервера 1 ТБ оперативки и неограничено по дискам. правда не ssd а простые
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39480759
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
кириллkЕсть OLTP на mssql 2016
кириллkспециалистов больше на oracle

Делайте на одной платформе, зоопарк вряд-ли кому-то нужен.

У нас на MS SQL. DWH весит в общей сложности около 30Тб с page и columnstore-компрессией.
Это все слои хранилища, включая кубы. Все довольно неплохо работает.

Один сервер отдать под разработку, второй - продуктив.
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39480761
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39480766
Фотография Alex_496
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Критик,

осталось только эффективного ЛПР, а лучше ЛДПР найти, который(е) ведутся на такие картинки
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39480768
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
маркетинг конечно, но и отсюда можно полезную информацию извлечь )
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39481164
кириллk
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
[quot Критик]кириллkЕсть OLTP на mssql 2016
кириллkспециалистов больше на oracle

У нас на MS SQL. DWH весит в общей сложности около 30Тб с page и columnstore-компрессией.
Это все слои хранилища, включая кубы. Все довольно неплохо работает.


Честно говоря, я тоже склоняюсь, к mssql на columnstore
Если не секрет:
какое железо, есть ли кластер, сколько процесятся кубы?
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39481176
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
кириллk,

подробные спецификации запрещено раскрывать,
могу только сказать, что для кубов используем SSD-карточки, по ОЗУ у нас лучше, чем у вас, СХД с возможностью тиринга, то есть в ней имеется кусок на SSD, куда автоматически переползают активно используемые данные
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39482247
Фотография George Nordic
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
кириллkЗакзачик ретейлер
Значит хотят, продажи детальные, стоки по дням. вообщем классика. (рядом клиенты )
Не понял, а откуда клиенты у ритейлера? У них программа лояльности? Или это дистрибьютор?

Получится у вас побить на DWH и ADWH:

DWH будет хранить исторический данные из POS, на нем будет чековая аналитика, корзины и прогнозирование (результаты которого для удобства анализа также можно кидать в ADWH.
и ADWH будет для клиентской аналитики и ad-hoc запросов/отчетов.

Вести столько чеков в одной системе для чековой аналитики, анализа корзин и прогнозирования - бессмысленно для ритейлера с 30% движениям по SKU Y2Y, если там во весь рост не внедрен категорийный менеджмент. Т.е. данные анализы идут по потребительским свойствам товара, а не по SKU. А 1кг сахарного песка от ООО "Танечка" и ООО "Манечка" - это как раз разные SKU.

В общем, идите от бизнес-требований.

С Уважением,
Георгий.
...
Рейтинг: 0 / 0
Период между сообщениями больше года.
MSSQL 2016 или экзотика
    #39693568
кириллk
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DWH и ADWH

Есть предложение сделать

ODS = Datalake на hadoop, а data vault и витрины на greenplum
или
ODS = Datalake и data vault на hadoop , а витрины на greenplum
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39693593
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
кириллk,

по greenplum в 2018 году тут было может быть 2-3 вакансии,
уже подумали, где специалистов будете брать?
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39693602
Barclay
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
кириллk,
Если по железу нет ограничений, бери SAP HANA, работает колоночно и/или строчно + работает как OLTP и OLAP одновременно + всё держит in-memory.
Данные, которые не нужны, можно пометить как холодные, и держать в т.н. Near Line Storage (NLS) на hadoop, и они будут доступны для запросов. Остальные категории данных помечаются как горячие, и все поднимаются в in-memory (RAM).
Руководство хочет новое, дай им)
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39693663
Фотография George Nordic
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
кириллkDWH и ADWH
Ого! За год определились с архитектурой!
George NordicПолучится у вас побить на DWH и ADWH:
Согласен с Критиком, greenplum - редкий у нас зверь, но спецы знакомые есть.
Чистый Hadoop - тоже непросто запустить, обычно в пром идут поддерживаемые форки.
Посмотрите сюда . Вот базовый пример по анализу корзин (Hadoop->Spark->Qlik).
Могу свести с топовыми ритейлерами - спросите как у них все устроено. Магнит, правда, Teradata использует, но есть и множество других компаний.

Вообще, мне очень часто в голову приходит простой вопрос: вот есть же множество крупных компаний - ритейл, банки.. почему они не создадут сообщество, где на Open Source (ну или OS + что-нибудь проприетарное) не создать базовое решение, которым все будут пользоваться? Кстати, Hadoop + Qlik может подобным примером стать. Лично я готов вложиться по мере сил в подобный пилотный проект.

С Уважением,
Георгий
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39693691
Бумбараш
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
спецов можно брать с опытом в других мпп - Teradata, Vertica, etc. У нас на гринпламе большая часть рабочих вообще ни с каким мпп не работала, и нормально.

По поводу создать базовое решение на опенсурс - гринплам и так опенсурс. И уже насоздавали всяких кликахусов, тарантулов и т.п.
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39693707
кириллk
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
George NordicкириллkDWH и ADWH
Ого! За год определились с архитектурой!
George NordicПолучится у вас побить на DWH и ADWH:
Согласен с Критиком, greenplum - редкий у нас зверь, но спецы знакомые есть.
Чистый Hadoop - тоже непросто запустить, обычно в пром идут поддерживаемые форки.
Посмотрите сюда . Вот базовый пример по анализу корзин (Hadoop->Spark->Qlik).
Могу свести с топовыми ритейлерами - спросите как у них все устроено. Магнит, правда, Teradata использует, но есть и множество других компаний.

Вообще, мне очень часто в голову приходит простой вопрос: вот есть же множество крупных компаний - ритейл, банки.. почему они не создадут сообщество, где на Open Source (ну или OS + что-нибудь проприетарное) не создать базовое решение, которым все будут пользоваться? Кстати, Hadoop + Qlik может подобным примером стать. Лично я готов вложиться по мере сил в подобный пилотный проект.

С Уважением,
Георгий

Я правильно понимаю, что вы сейчас про унифицированную модель данных?
...
Рейтинг: 0 / 0
MSSQL 2016 или экзотика
    #39693709
кириллk
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Бумбарашспецов можно брать с опытом в других мпп - Teradata, Vertica, etc. У нас на гринпламе большая часть рабочих вообще ни с каким мпп не работала, и нормально.

По поводу создать базовое решение на опенсурс - гринплам и так опенсурс. И уже насоздавали всяких кликахусов, тарантулов и т.п.

и получается кстати неплохо
https://events.yandex.ru/events/b-konf/20-sept-2018/
Яндекс.Облако: аналитическая платформа
...
Рейтинг: 0 / 0
25 сообщений из 29, страница 1 из 2
Форумы / OLAP и DWH [игнор отключен] [закрыт для гостей] / MSSQL 2016 или экзотика
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]