|
|
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
Добрый день! Очень хочу услышать ваше мнение. Есть OLTP на mssql 2016. Нужно сделать хранилище. объем несколько десятков ТБ с возможностью роста (перспектива) Есть 2 варианта: 1. сделать на mssql columstore или на экзотике. (Вертика, кликхаус, Impala) mssql Плюсы есть железо и админы и стабильность Минусы: боссы хотят: чтобы было современно =колоночную (mssql columstore) чтобы было надолго. т.е. вариант сделать на mssql, а если не взлетит потом переходить на другое не хотят. Вопрос с финансами сильно не стоит, т.е . готовы платить ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.06.2017, 08:47 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
посчитайте объем, посчитайте цену (вертика лицензируется за объем) прикиньте доступность специалистов если будете делать на mssql, то для приемлемой производительности ХД нужно делать чисто на инкременте, т.к. columstore очень медленно апдейтится ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.06.2017, 09:16 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
кириллk, ХД какого плана ? Предполагается только вставка новых данных или перезагрузка данных / update задним числом? Вертика например только вставка причем БАЛКЛОАДЕРОМ из чего то готового, например из стэйджинга на том же MS SQL, тогда вопрос если есть MS SQL нафига тогда вертика. Если предполагается апдейт данных, постоянная перезаливка истории за неизвестный период - то только традиционные базы данных это oracle или ms sql. Колоночное хранения иногда приносит вред а не пользу, с ними нужно быть очень осторожным в использовании, это не панацея а просто полезная фишка. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.06.2017, 10:02 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
exadata им продайте ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.06.2017, 10:22 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
1. Хранилище в несколько TB на MSSQL редкость 2. По поводу Vertica все правильно сказали - если база довольно большая,то обычно через некоторое время приходят к тому, что перед MPP нужно поставить еще одну базу как stage/ODS 3. Как stage/ODS обычно используют Oracle. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.06.2017, 11:11 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
Alexander Ryndin1. Хранилище в несколько TB на MSSQL редкость 2. По поводу Vertica все правильно сказали - если база довольно большая,то обычно через некоторое время приходят к тому, что перед MPP нужно поставить еще одну базу как stage/ODS 3. Как stage/ODS обычно используют Oracle. 1. В смысле хранилище в несколько десятко ТБ - редкость ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.06.2017, 11:12 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
Alex_496exadata им продайтеДобрый вы... Могли и терадату предложить. По сути - не все же данные будут в поколонке хранится. Т.е разделяйте DHW и ADWH. Все данные можно и на sql хранить. Не все же "десятки ТБ" для аналитики нужны. Т.е. храните все в реляционке, потом переливаете с упорядочиванием в стейдж, а оттуда - балком в поколонку (sql, Vertica, greenplum - у него код открыли, кстати). Если данные упорядочены в соответствии с тем, как они будут хранится в мрр, они должны довольно быстро залетать. Такое вот гибридное хранение. Кстати, в DB2 тоже все это анонсировали. С Уважением, Георгий ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.06.2017, 12:13 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
IMO - не хватает главной информации: нужно оно-то нужно, но для чего? какие цели преследуются? в каких пропорциях/приоритетах? при желании можно и в облако вынести - например в APS (PDW) возможно по необходимости динамически нарастить параллельно железа для ускорения процесса если вдруг что-то медленно работает / поздно стартануло и не успевают в SLA вложиться (к примеру что-то обычно считалось/грузилось за час и вдруг срочно надо за 5 минут) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 26.06.2017, 12:18 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
и как у вас распределены данные? обычно 2 варианта 1. много-много предметных областей с более менее равномерным распределением размеров таблиц 2. 1-2-3 таблицы дающие 99,9% объема + куча мелких справочников дающих в сумме 0,1% размера от хранилища во втором случае почти наверняка такие портянки никому не нужны реально, стараются максимально сагрегировать, а портянки пусть лежат на случай пересчета агрегатов. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.06.2017, 14:48 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
Большое спасибо за ответы. Попробую ответить на все вопросы Закзачик ретейлер Значит хотят, продажи детальные, стоки по дням. вообщем классика. (рядом клиенты ) т.е. 3 большие таблицы которые должны дружить между собой. Есть FTPS севрер, куда раз в стуки пишутся разные файлики. с продажами, стоками итд. Данные могут меняться . тогда приходит новый файлик с исправленными данным === Разделит DHW и ADWH. не получится. стоки и продажи и нужны детальные для аналитики и занимают 70-75 места% === Разговор с терадатой и экзадатой был, по функционалу они похожи, но специалистов больше на oracle === Хранилище нужно всем и в магазинах и офисе. только в магазинах достаточно "плоских" отчетов А офис хочет растить своих "data scientist" ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.06.2017, 22:02 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
кириллk, Забыл добавить у нас уже есть 2 сервера 1 ТБ оперативки и неограничено по дискам. правда не ssd а простые ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.06.2017, 22:03 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
кириллkЕсть OLTP на mssql 2016 кириллkспециалистов больше на oracle Делайте на одной платформе, зоопарк вряд-ли кому-то нужен. У нас на MS SQL. DWH весит в общей сложности около 30Тб с page и columnstore-компрессией. Это все слои хранилища, включая кубы. Все довольно неплохо работает. Один сервер отдать под разработку, второй - продуктив. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 30.06.2017, 23:45 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
Критик, осталось только эффективного ЛПР, а лучше ЛДПР найти, который(е) ведутся на такие картинки ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.07.2017, 00:36 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
маркетинг конечно, но и отсюда можно полезную информацию извлечь ) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 01.07.2017, 00:42 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
[quot Критик]кириллkЕсть OLTP на mssql 2016 кириллkспециалистов больше на oracle У нас на MS SQL. DWH весит в общей сложности около 30Тб с page и columnstore-компрессией. Это все слои хранилища, включая кубы. Все довольно неплохо работает. Честно говоря, я тоже склоняюсь, к mssql на columnstore Если не секрет: какое железо, есть ли кластер, сколько процесятся кубы? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.07.2017, 13:54 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
кириллk, подробные спецификации запрещено раскрывать, могу только сказать, что для кубов используем SSD-карточки, по ОЗУ у нас лучше, чем у вас, СХД с возможностью тиринга, то есть в ней имеется кусок на SSD, куда автоматически переползают активно используемые данные ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 02.07.2017, 14:48 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
кириллkЗакзачик ретейлер Значит хотят, продажи детальные, стоки по дням. вообщем классика. (рядом клиенты ) Не понял, а откуда клиенты у ритейлера? У них программа лояльности? Или это дистрибьютор? Получится у вас побить на DWH и ADWH: DWH будет хранить исторический данные из POS, на нем будет чековая аналитика, корзины и прогнозирование (результаты которого для удобства анализа также можно кидать в ADWH. и ADWH будет для клиентской аналитики и ad-hoc запросов/отчетов. Вести столько чеков в одной системе для чековой аналитики, анализа корзин и прогнозирования - бессмысленно для ритейлера с 30% движениям по SKU Y2Y, если там во весь рост не внедрен категорийный менеджмент. Т.е. данные анализы идут по потребительским свойствам товара, а не по SKU. А 1кг сахарного песка от ООО "Танечка" и ООО "Манечка" - это как раз разные SKU. В общем, идите от бизнес-требований. С Уважением, Георгий. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.07.2017, 10:31 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
DWH и ADWH Есть предложение сделать ODS = Datalake на hadoop, а data vault и витрины на greenplum или ODS = Datalake и data vault на hadoop , а витрины на greenplum ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.08.2018, 10:39 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
кириллk, по greenplum в 2018 году тут было может быть 2-3 вакансии, уже подумали, где специалистов будете брать? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.08.2018, 11:34 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
кириллk, Если по железу нет ограничений, бери SAP HANA, работает колоночно и/или строчно + работает как OLTP и OLAP одновременно + всё держит in-memory. Данные, которые не нужны, можно пометить как холодные, и держать в т.н. Near Line Storage (NLS) на hadoop, и они будут доступны для запросов. Остальные категории данных помечаются как горячие, и все поднимаются в in-memory (RAM). Руководство хочет новое, дай им) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.08.2018, 11:44 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
кириллkDWH и ADWH Ого! За год определились с архитектурой! George NordicПолучится у вас побить на DWH и ADWH: Согласен с Критиком, greenplum - редкий у нас зверь, но спецы знакомые есть. Чистый Hadoop - тоже непросто запустить, обычно в пром идут поддерживаемые форки. Посмотрите сюда . Вот базовый пример по анализу корзин (Hadoop->Spark->Qlik). Могу свести с топовыми ритейлерами - спросите как у них все устроено. Магнит, правда, Teradata использует, но есть и множество других компаний. Вообще, мне очень часто в голову приходит простой вопрос: вот есть же множество крупных компаний - ритейл, банки.. почему они не создадут сообщество, где на Open Source (ну или OS + что-нибудь проприетарное) не создать базовое решение, которым все будут пользоваться? Кстати, Hadoop + Qlik может подобным примером стать. Лично я готов вложиться по мере сил в подобный пилотный проект. С Уважением, Георгий ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.08.2018, 13:04 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
спецов можно брать с опытом в других мпп - Teradata, Vertica, etc. У нас на гринпламе большая часть рабочих вообще ни с каким мпп не работала, и нормально. По поводу создать базовое решение на опенсурс - гринплам и так опенсурс. И уже насоздавали всяких кликахусов, тарантулов и т.п. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.08.2018, 13:34 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
George NordicкириллkDWH и ADWH Ого! За год определились с архитектурой! George NordicПолучится у вас побить на DWH и ADWH: Согласен с Критиком, greenplum - редкий у нас зверь, но спецы знакомые есть. Чистый Hadoop - тоже непросто запустить, обычно в пром идут поддерживаемые форки. Посмотрите сюда . Вот базовый пример по анализу корзин (Hadoop->Spark->Qlik). Могу свести с топовыми ритейлерами - спросите как у них все устроено. Магнит, правда, Teradata использует, но есть и множество других компаний. Вообще, мне очень часто в голову приходит простой вопрос: вот есть же множество крупных компаний - ритейл, банки.. почему они не создадут сообщество, где на Open Source (ну или OS + что-нибудь проприетарное) не создать базовое решение, которым все будут пользоваться? Кстати, Hadoop + Qlik может подобным примером стать. Лично я готов вложиться по мере сил в подобный пилотный проект. С Уважением, Георгий Я правильно понимаю, что вы сейчас про унифицированную модель данных? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.08.2018, 13:55 |
|
||
|
MSSQL 2016 или экзотика
|
|||
|---|---|---|---|
|
#18+
Бумбарашспецов можно брать с опытом в других мпп - Teradata, Vertica, etc. У нас на гринпламе большая часть рабочих вообще ни с каким мпп не работала, и нормально. По поводу создать базовое решение на опенсурс - гринплам и так опенсурс. И уже насоздавали всяких кликахусов, тарантулов и т.п. и получается кстати неплохо https://events.yandex.ru/events/b-konf/20-sept-2018/ Яндекс.Облако: аналитическая платформа ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.08.2018, 13:57 |
|
||
|
|

start [/forum/topic.php?fid=49&fpage=20&tid=1857789]: |
0ms |
get settings: |
11ms |
get forum list: |
15ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
65ms |
get topic data: |
11ms |
get forum data: |
2ms |
get page messages: |
63ms |
get tp. blocked users: |
2ms |
| others: | 14ms |
| total: | 191ms |

| 0 / 0 |

Извините, этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
... ля, ля, ля ...