powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / Oracle exadata vs MSSQL
61 сообщений из 61, показаны все 3 страниц
Oracle exadata vs MSSQL
    #38874288
Azul
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Доброго времени суток
вопрос может показаться тупым и дилетантским, прошу сильно не травить
суть в чем? я работаю в крупном коммерческом банке, и как сами понимаете объем операций, и как следствие записей в БД
очень большой. Ну на вскидочку миллионов 300 уникальных записей в год.
Банк работает уже 20 лет, следовательно речь идет о 6 миллиардах записей в БД.
Сейчас необходима общая база по всем операциям которые раскиданы по разным системам автоматизированных банковских дней.
Пригласили одну фирму, которая предложила за очень хорошие деньги этот проект реализовать.
Реализовать на базе решения Oracle Exadata, и как они расписывают - что даже огромные запросы - к примеру выписки за 10 лет будут крутиться за секунды. Благодаря сохранению часто запрашиваемых данных в флеш памяти, аппаратной компрессии и т.д.
Я хотел спросить - а что действительно решения Оракл такие быстрые и оптимизированные?
По производительности неужели MSSQL так сильно отстает?
Я честно говоря всю жизнь работаю на 2003-2005 версиях, поэтому всех возможностей далеко не знаю.
Вообще есть ли отставание или все эти прогнозы насчет нескольких секунд достигаются за счет аппаратной составляющей?
Спасибо
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874291
babona
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
сравнивать нужно сравниваемое. Ехадата - это аппаратное решение, поверх которого обычный Оракл, потому и цена недешевая.
Вот посостязаться бы Ехадата с Терадата
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874295
Фотография alexeyvg
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AzulПо производительности неужели MSSQL так сильно отстает?Последний десяток лет - примерно одинаково. На одинаковом железе разницы не будет.
Решения с аппаратной составляющей у MSSQL тоже есть, см. PDW
Использование SSD в хранилищах - обычное дело, и для высокой производительности это даже дешевле обычных HDD. Банки не генерят много данных, так что самое оно. Сколько это там, 6 миллиардов записей, несколько террабайт?
Память в сотни гигабайт тоже совсем не редкость.
AzulБанк работает уже 20 лет, следовательно речь идет о 6 миллиардах записей в БД.У меня в день такие цифры, но храним только несколько месяцев, жмётся клиент на хранилища (впрочем, ему и не нужно больше). MS сейчас базы меньше 100тб не считает большими, группы, поддерживающие большие решения, от стольких только начинают рассматривать.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874296
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AzulДоброго времени суток
вопрос может показаться тупым и дилетантским, прошу сильно не травить
суть в чем? я работаю в крупном коммерческом банке, и как сами понимаете объем операций, и как следствие записей в БД
очень большой. Ну на вскидочку миллионов 300 уникальных записей в год.
Банк работает уже 20 лет, следовательно речь идет о 6 миллиардах записей в БД.


6 миллиардов записей для современных СУБД -- немного. Для специальных, конечно, СУБД, в основном это columnstore, не MSSQL и не Oracle, про Exadata не знаю.


AzulСейчас необходима общая база по всем операциям которые раскиданы по разным системам автоматизированных банковских дней.


Так смотря что с этими данными надо делать.
Вы-то это не раскрываете, а от людей просите совета. А это ОЧЕНЬ зависит от того, что надо с данными делать.

AzulПригласили одну фирму, которая предложила за очень хорошие деньги этот проект реализовать.
Реализовать на базе решения Oracle Exadata, и как они расписывают - что даже огромные запросы - к примеру выписки за 10 лет будут крутиться за секунды.


Кому нужны выписки за 10 лет ?

У меня была БД в 55 милиардов записей, и запросы некоторые по ней проходили за несколько сот миллисекунд.
Это конечно кластер был из 8 нод, но для масштаба можно 55 на 8 поделить.
Но это были запросы на выборки, или точечные (маленькие) аргрегации.
Если нужна агрегация данных за 10 лет без доп. фильтров -- это большие объёмы, и это сделать быстро, естественно, невозможно.
Тогда решения -- предагрегации (но теряется универсальность и растут объёмы), или ещё что-то, но магии там всё равно нет.
Вы должны понимать, за счёт чего это будет достигаться, если не понимаете, или вам не могут объяснить -- значит, врут.

Azul Благодаря сохранению часто запрашиваемых данных в флеш памяти, аппаратной компрессии и т.д.


Кэши работают и в обычных СУБД, они не решают тут. нужны другие технологии ещё сверх этого.
Компрессия -- да, это здорово. Аппаратная или программная -- в общем, неважно.

AzulЯ хотел спросить - а что действительно решения Оракл такие быстрые и оптимизированные?


Это не решение Оракл, это решение Exadata. Но, ещё раз, если вам чего-то говорят, они должны уметь объяснить, за счёт чего
это происходит.
Ну и очень сильно это зависит и от данных, и от запросов, которые надо делать.

AzulПо производительности неужели MSSQL так сильно отстает?


Он не отстаёт, MSSQL -- это универсальная СУБД, ориентированная на OLTP и , с некоторыми добавками, на OLAP.
Но для больших хранилищ данных она просто не подходит.

Там вот Vertica, Exadata, Teradata, ещё может быть что-то.

Кстати, на таких объёмах можно попробовать тот же Virtuoso, он есть в бесплатном OpenSource -варианте (6ая версия),
но без кластера (а тут он не нужен, это как раз типичный объём БД для безкластерного решения).
Или ещё есть MonetDB (тоже бесплатный).
Ну и ещё дофига всяких есть решений, бесплатных. Т.е. в принципе можно пробовать и другие "более дешёвые" решения.
Но естественно со всеми надо будет РАБОТАТЬ, т.е. разбираться досконально в предметной области и постановке, и
в технологиях конкретной СУБД.


AzulВообще есть ли отставание или все эти прогнозы насчет нескольких секунд достигаются за счет аппаратной составляющей?


даже если там и есть аппаратная компрессия, то скорее всего она не играет решающую роль тут. Больше будут играть columnstore, сжатие данных, векторная обработка, и, конечно, старое доброе кэширование и индексирование.

Я думаю, что скорее инженеры Экзадаты просто выпендрились, имея возможность сделать что-то аппаратно, и оно там хоть и
ускоряет само сжатие раз в 100, но всё же в СУБД основные затратные операции -- это чтение диска и сканирование данных, они в 1000-10000 раз затратнее, чем любое сжатие в памяти (на чём и стоит отрасль columnstore).
Возможно, я неправ.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874297
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Сори, ещё из решающих технологий надо, естественно, указать параллельные и распределённые вычисления.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874301
Фотография alexeyvg
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
MasterZivMSSQL -- это универсальная СУБД, ориентированная на OLTP и , с некоторыми добавками, на OLAP.
Но для больших хранилищ данных она просто не подходит.

Там вот Vertica, Exadata, Teradata, ещё может быть что-то.

Кстати, на таких объёмах можно попробовать тот же VirtuosoДа какие тут большие объёмы?
Действительно:MasterZiv6 миллиардов записей для современных СУБД -- немного
MasterZivДля специальных, конечно, СУБД, в основном это columnstore, не MSSQL и не Oracle, про Exadata не знаю.Для обычных БД это немного, зачем специальные? Специальные - слишком жирно для таких объёмов.

Кстати, MSSQL тоже с некоторых пор columnstore, не знаю, как там у Oracle с этим.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874302
Фотография alexeyvg
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Azulдаже огромные запросы - к примеру выписки за 10 лет будут крутиться за секундыИ действительно задачи важны.

Выписка за 10 лет по одному клиенту должны крутиться за миллисекунды, без всяких экзадат. А вот если нужна выписка по всему банку за 10 лет... :-)

Модератор: Тема перенесена из форума "Microsoft SQL Server".
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874364
Azul
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Спасибо огромное за ответы,
дело в том что на вскидочку все решение аппаратная составляющая + решение компании + лицензия будет стоить 1,5 - 2 млн. долларов
это многовато...
суть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительности

а что делать с данными?
ну во первых их нужно собрать из разрозненных источников (базы MSSQL, DBF файлы, текстовые файлы и т.д.)
затем каждый раз подкачивать из схожих источников
затем из них должны формироваться отчеты
еще они должны быть доступны через пользовательский интерфейс (пользователи не программисты) для формирования отчетов и составления новых отчетных форм
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874368
Azul
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
в общем, я так понял MSSQL не совсем для этого...
дайте пожалуйста направление - в какую сторону смотреть, что почитать по этому вопросу
очень благодарен
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874382
SERG1257
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Azul в общем, я так понял MSSQL не совсем для этогоНе правильно понял
Azul предложила за очень хорошие деньги этот проект реализоватьЭто был ключевой момент.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874383
mad_nazgul
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AzulСпасибо огромное за ответы,
дело в том что на вскидочку все решение аппаратная составляющая + решение компании + лицензия будет стоить 1,5 - 2 млн. долларов
это многовато...


Да не это нормально.
Программно-аппаратное решение от MS не думаю что будет стоит сильно дешево, может пару тысяч скинут, а может и нет.
Как договорятся.

Azulсуть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительности


Можно. Но не на пропиетарных технологиях, т.е. OpenSource.
Сэкономите в лучшем случае половину, а так основная стоимость будет железо(где-то 2/3 - 3/4 от вашей суммы).
Поэтому не советую.
"Еще не уволили ни одного менеджера, за покупку решения от IBM" (c) не мой. ;-)

Azulа что делать с данными?
ну во первых их нужно собрать из разрозненных источников (базы MSSQL, DBF файлы, текстовые файлы и т.д.)
затем каждый раз подкачивать из схожих источников


Вот это как раз не проблема, а стандартная задача, для которой есть решение как у MS, так и у Oracle и OpenSource.
Читать про ETL.

Azulзатем из них должны формироваться отчеты
еще они должны быть доступны через пользовательский интерфейс (пользователи не программисты) для формирования отчетов и составления новых отчетных форм

Опять же это стандартная задача.
Читать про OLAP.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874407
Фотография SergSuper
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Azulдело в том что на вскидочку все решение аппаратная составляющая + решение компании + лицензия будет стоить 1,5 - 2 млн. долларов
это многовато...
суть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительности"это" - всё-таки что это? если только посмотреть выписку, то наверное можно и раз в 10 дешевле, если нужна полноценная банковская система, то мне кажется маловато

я так понял речь идет об узбекском банке, не знаю насколько там учет отличается и подойдут ли какие российские АБС, но на ЦФТ по-моему несколько узбекских банков работает
http://bank.uz/publish/doc/text61391_innovacionnye_resheniya_dlya_bankov_respubliki_uzbekistan
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874475
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
[quot alexeyvg]Да какие тут большие объёмы?
Действительно:MasterZiv6 миллиардов записей для современных СУБД -- немного

Обычные СУБД, я бы сказал, работают с БД до миллиарда записей. Конечно, всё ещё сильно зависит от задач.


MasterZivКстати, MSSQL тоже с некоторых пор columnstore, не знаю, как там у Oracle с этим.

Ну, возможно, тогда и MSSQL можно попробовать.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874479
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AzulСпасибо огромное за ответы,
дело в том что на вскидочку все решение аппаратная составляющая + решение компании + лицензия будет стоить 1,5 - 2 млн. долларов
это многовато...
суть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительности


Можно точно. Тем более за такие деньги.

Azulа что делать с данными?
ну во первых их нужно собрать из разрозненных источников (базы MSSQL, DBF файлы, текстовые файлы и т.д.)
затем каждый раз подкачивать из схожих источников
затем из них должны формироваться отчеты


Это всё можно.

А вот это :

Azulеще они должны быть доступны через пользовательский интерфейс (пользователи не программисты) для формирования отчетов и составления новых отчетных форм

-- утопия. Без программистов ничего не работает никогда. Вам будут конечно всякие sales man ы лапшу на уши вешать, но не слушайте.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874487
Yo.!
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Azulсуть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительности

без шансов. не слушайте форумных хомячков, сходите на сайт оракла почитайте в чем суть exadata. вся соль в том, что у exadata сторидж не отдает все блоки базе, а интегрирован с субд и на стороне сториджа еще занимается фильрацией данных. т.е. там где мсскл поднимет 6 млрд записей с дисков, exadata отфильтрует большую часть, не нужную для отчета. аппаратную часть собрать на коленках не проблема, вся соль exadata именно в софте, в интеллектуальном сторидже.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874541
db2man
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
AzulСпасибо огромное за ответы,
дело в том что на вскидочку все решение аппаратная составляющая + решение компании + лицензия будет стоить 1,5 - 2 млн. долларов
это многовато...
Поинтересуйтесь у Oracle-поставщика сколько будет стоить ежегодный суппорт на выбранную экзадату (quarter rack ? судя по цене), ну чтоб потом не было сюрпризов.
суть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительности
Раз у вас еcть опыт с MSSQL, то сделайте свой внутренний пилот на 2014-ом (там появились clustered column-store indexes), загоните туда свои 6 ярдов до покрутите (на нормальном железе), чтобы иметь хотя бы какой-то baseline от которого уже и отталкиваться. А то может вам вообще стандартный MSSQL SSAS подойдет.

Со своей колокольни : если не ограничены только MS/Oracle, то можно попробовать IBM DB2 BLU (колоночный in-memory-оптимизированный движок специально для DWH/BI/OLAP c возможностью потеррабайтного лицензирования за 60K$/TB (макс. 4 сокета) или 100K$/TB (безлимит) )
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874611
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Сколько "специалистов" по Oracle набежало из форума MSSQL. Просто ппц какой-то.

В двух словах про Exadata:

1) Во-первых, это софт+вся аппаратка (сервера СУБД, storage, сеть). Поскольку storage в Exadata - это не тупая полка с дисками, а, по сути, продолжение СУБД, то storage сам выполняет большУю часть операций, освобождая сервера баз данных. Другое следствие того, что storage умный - это пониженная нагрузка на канал между базой данных и storage. Раньше при полном сканировании таблицы мы должны были в память сервера грузить все данных, а теперь storage сам применяет фильтрацию и отсев столбцов

2) Во-вторых, Exadata - это гибридное поколоночное сжатие. Т.е. поколоночное, но не совсем. Поколоночное хранение хорошо, если есть только запросы на чтение - оно быстрое и хорошо жмет данные. Но чуть только кто-то что-то начинает менять данные - тут же возникают огромные проблемы. В Exadata, при построении хранилища, обычно делается таблица из двух частей: исторической и оперативной. История жмется в 5-10 раз, а оперативная часть жмется в 2-3 раза. Убиваем двух зайцев: все летает, но и данные подливаются легко - вплоть до real-time. Да, и расжатие, действительно, делается на уровне storage, а не базой данных.

3) Флеш память хороша во многих случаях, но ее основной выигрыш - это обеспечение большого количество IOPS. При этом, по-умолчанию флеш работает на Exadata как еще один уровень кэша. А значит включается автоматически. Делать вообще ничего не надо.

Из недавнего, что появилось в Exadata:
1) Конфигурация стала гибкой. Если нужно мало пространства на диске, но много CPU, то можно, скажем, взять 3 ячейки storage и 10 database server. Если узкое место - storage, то ставим 10 ячеек storage и 2 сервера СУБД
2) Появилась поддержка виртуализации, что позволяет гибко оптимизировать лицензирование
3) Сжатие во flash cache.

По поводу верить в это или не верить... Попросите показать.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874707
Azul
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
читаю, очень интересно,
кстати кажется не смог объяснить - речь идет чисто об информационной системе - не автоматизированный банковский день
только подкачка из основных баз - типа архив, но целостный, быстродоступный и оперативный
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874710
Azul
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Alexander Ryndin,
зачем вы в ковычках слово специалисты пишете =(
я например даже близко этого не знал
люди помогают, спасибо за это
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874714
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Azulчитаю, очень интересно,
кстати кажется не смог объяснить - речь идет чисто об информационной системе - не автоматизированный банковский день
только подкачка из основных баз - типа архив, но целостный, быстродоступный и оперативныйЕсли так, то у вас выбор из следующих систем
1) Обычная база, обязательно неблокировочник (Oracle, MSSQL, DB2, etc)
2) Exadata - с одной стороны это MPP, с другой стороны прекрасно справляется с архивацией (поколочное сжатие до 10 раз), целостное (нормальные транзакции, нет грязных чтения, читатели не мешают писателем), быстрое (см. мой пост выше), оперативное (за счет партиционирования и флеша его можно обновлять в real-time)

Классические MPP-платформы вам не подойдут почти по всем критериям.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874720
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AzulAlexander Ryndin,
зачем вы в ковычках слово специалисты пишете =(
я например даже близко этого не знал
люди помогают, спасибо за этоНе люблю, когда люди пишут о чем-то, не имея достаточной экспертизы. Вот я не люблю рассуждать о MSSQL, т.к. основная моя область работы - это Oracle. А с MSSQL у меня нет достаточной экспертизы уже лет 7-8.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874721
Ivan Durak
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Alexander Ryndin Раньше при полном сканировании таблицы мы должны были в память сервера грузить все данных, а теперь storage сам применяет фильтрацию и отсев столбцов

Какую фильтрацию при фулскане?? И какой аппаратный отсев столбцов если и так колумнсторе?

А вообще главный вопрос - это таки mpp или нет?? Паралельный джоин,группировку,сортировку локально на узлах умеет делать не передавая по сети данные??
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874728
Вася Уткин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Alexander RyndinСколько "специалистов" по Oracle набежало из форума MSSQL. Просто ппц какой-то.

В двух словах про Exadata:

1) Во-первых, это софт+вся аппаратка (сервера СУБД, storage, сеть). Поскольку storage в Exadata - это не тупая полка с дисками, а, по сути, продолжение СУБД, то storage сам выполняет большУю часть операций, освобождая сервера баз данных. Другое следствие того, что storage умный - это пониженная нагрузка на канал между базой данных и storage. Раньше при полном сканировании таблицы мы должны были в память сервера грузить все данных, а теперь storage сам применяет фильтрацию и отсев столбцов
Важно добавить, что Exadata - это тоже сервера + диски, причем Exadata берет на себя часть задач с серверов Oracle (фильтрацию по предикатам - Smart Scan/Storage Index, и сжатие - Hybrid Columnar Compression), а лицензирование серверов Exadata дешевле, чем лицензирование Oracle Enterprise Edition или тем более EE+RAC. Т.е. с Exadata удельная единица производительности получается дешевле, чем без него.

Alexander Ryndin2) Во-вторых, Exadata - это гибридное поколоночное сжатие. Т.е. поколоночное, но не совсем . Поколоночное хранение хорошо, если есть только запросы на чтение - оно быстрое и хорошо жмет данные. Но чуть только кто-то что-то начинает менять данные - тут же возникают огромные проблемы. В Exadata, при построении хранилища, обычно делается таблица из двух частей: исторической и оперативной. История жмется в 5-10 раз, а оперативная часть жмется в 2-3 раза . Убиваем двух зайцев: все летает, но и данные подливаются легко - вплоть до real-time. Да, и расжатие, действительно, делается на уровне storage, а не базой данных.
Вы хотите сказать, что оперативные данные просто сжимаются более легким и быстрым алгоритмом, или к тому же хранятся в row-oriented формате?

Alexander Ryndin3) Флеш память хороша во многих случаях, но ее основной выигрыш - это обеспечение большого количество IOPS. При этом, по-умолчанию флеш работает на Exadata как еще один уровень кэша. А значит включается автоматически. Делать вообще ничего не надо.
Кстати, в стандартной конфигурации Exadata уже входят PCIe-SSD (не SATA) и если да, то какие SLC/MLC, gen2/gen3, X4/8/16?
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874733
Вася Уткин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
alexeyvgКстати, MSSQL тоже с некоторых пор columnstore
Он теперь только columnstore, или может и row и column, и кто это решает, СУБД автоматически или разработчик прописывая в DDL каждой таблицы?
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874738
Вася Уткин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Ivan DurakА вообще главный вопрос - это таки mpp или нет?? Паралельный джоин,группировку,сортировку локально на узлах умеет делать не передавая по сети данные??
Не умеет. В Exadata только отсев по предикатам WHERE за счет SS/SI, и лишние столбцы не грузит за счет column-oriented.
Если нужны "Паралельный джоин,группировку,сортировку локально на узлах" - то это Oracle RAC, с соответствующей ценой :)
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874747
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ivan DurakAlexander Ryndin Раньше при полном сканировании таблицы мы должны были в память сервера грузить все данных, а теперь storage сам применяет фильтрацию и отсев столбцов

Какую фильтрацию при фулскане?? И какой аппаратный отсев столбцов если и так колумнсторе?Фильтрацию обычную. Вот такую, например, SELECT emp_id WEHER sal>100;
Exadata - это не "колумнсторе"
Ivan DurakА вообще главный вопрос - это таки mpp или нет?? Паралельный джоин,группировку,сортировку локально на узлах умеет делать не передавая по сети данные??Exadata это частично MPP. Все операции на ячейках это MPP. Join на ячейках делается только частично. Сортировка и группировка делается на серверах базы данных, которые также ее распараллеливают.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874756
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вася УткинAlexander Ryndin2) Во-вторых, Exadata - это гибридное поколоночное сжатие. Т.е. поколоночное, но не совсем . Поколоночное хранение хорошо, если есть только запросы на чтение - оно быстрое и хорошо жмет данные. Но чуть только кто-то что-то начинает менять данные - тут же возникают огромные проблемы. В Exadata, при построении хранилища, обычно делается таблица из двух частей: исторической и оперативной. История жмется в 5-10 раз, а оперативная часть жмется в 2-3 раза . Убиваем двух зайцев: все летает, но и данные подливаются легко - вплоть до real-time. Да, и расжатие, действительно, делается на уровне storage, а не базой данных.
Вы хотите сказать, что оперативные данные просто сжимаются более легким и быстрым алгоритмом, или к тому же хранятся в row-oriented формате?Все верно. Данные сжимаются более легким и быстрым алгоритмом и хранятся в row-oriented формате
Вася УткинAlexander Ryndin3) Флеш память хороша во многих случаях, но ее основной выигрыш - это обеспечение большого количество IOPS. При этом, по-умолчанию флеш работает на Exadata как еще один уровень кэша. А значит включается автоматически. Делать вообще ничего не надо.
Кстати, в стандартной конфигурации Exadata уже входят PCIe-SSD (не SATA) и если да, то какие SLC/MLC, gen2/gen3, X4/8/16?[/quot]Да, верно. В стандартной конфигурации стоят Flash Accelerator F160 PCIe Card. В минимальной конфигурации Exadata (1/8) это 9,6 Tb сырого пространства. А вот что это не знаю.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874778
Вася Уткин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Alexander RyndinДа, верно. В стандартной конфигурации стоят Flash Accelerator F160 PCIe Card. В минимальной конфигурации Exadata (1/8) это 9,6 Tb сырого пространства. А вот что это не знаю.
А по сколько F80 PCIe Card на одном сервере Exadata?

Sun Flash Accelerator F80 PCIe Card Specifications :
800 GB

e MLC

Random Read IOPS (8K) 155,193

PCI Express 2.0 (x8) - 2 GB/sec

4 x 6Gb/s SAS/SATA2 controllers (1 per domain) - прям в нем же контроллер на 4 SATA диска

Типичный 2.5'' HDD 10K-rpm имеет 100 MB/sec и 150 IOPS.
Т.е. Exadata-вский F80 PCIe Card по IOPS-ам как 1000 HDD (для random-read/write), а по Bandwidth как 20 HDD (для sequential-read/write).
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874791
exaora
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Alexander Ryndin. В стандартной конфигурации стоят Flash Accelerator F160 PCIe Card. В минимальной конфигурации Exadata (1/8) это 9,6 Tb сырого пространства. А вот что это не знаю.
Intel DC P3600 ;-)
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874809
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
exaoraAlexander Ryndin. В стандартной конфигурации стоят Flash Accelerator F160 PCIe Card. В минимальной конфигурации Exadata (1/8) это 9,6 Tb сырого пространства. А вот что это не знаю.
Intel DC P3600 ;-)Гыгы. А я ищу по тексту фразу, а там картинка. Прикольно, спасибо.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874812
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вася УткинТипичный 2.5'' HDD 10K-rpm имеет 100 MB/sec и 150 IOPS.
Т.е. Exadata-вский F80 PCIe Card по IOPS-ам как 1000 HDD (для random-read/write), а по Bandwidth как 20 HDD (для sequential-read/write). Сейчас в 1/4 Exadata стоит 12 flash-карт и 36 дисков.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874818
Вася Уткин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
exaoraAlexander Ryndin. В стандартной конфигурации стоят Flash Accelerator F160 PCIe Card. В минимальной конфигурации Exadata (1/8) это 9,6 Tb сырого пространства. А вот что это не знаю.
Intel DC P3600 ;-)
http://www.intel.com/content/dam/www/public/us/en/documents/product-specifications/ssd-dc-p3600-spec.pdf
Flash Accelerator F160 PCIe Card (Intel DC P3600) по IOPS-ам на read раза в 3 поболее, чем Flash Accelerator F80 PCIe Card (Sun).
А вот последовательные операции поменяли шило на мыло, с 2 до 2.6 GB/sec. А интерфейс так вообще той же скорости оставили PCIe gen2 8X на PCIe gen3 4X, странные они товарищи :)

http://www.oracle.com/technetwork/database/exadata/exadata-x5-2-ds-2406241.pdf Full Rack - 14 x Exadata Storage Servers X5-2 - 56 PCI flash cards with 89.6 TB (raw) Exadata Smart Flash Cache, 168 x 4 TB 7,200 RPM High Capacity disks.
Т.е. на 1 сервер Exadata приходится:
4 диска PCIe(gen3 4x) SSD 1.6 TB 2GB/sec 450K IOPS

12 дисков 4TB HDD 7200 rpm

И в FullRack 14 таких двухсокетных серверов.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874850
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вася УткинFlash Accelerator F160 PCIe Card (Intel DC P3600) по IOPS-ам на read раза в 3 поболее, чем Flash Accelerator F80 PCIe Card (Sun).
А вот последовательные операции поменяли шило на мыло, с 2 до 2.6 GB/sec. А интерфейс так вообще той же скорости оставили PCIe gen2 8X на PCIe gen3 4X, странные они товарищи :)Из собственного опыта этот флэш важен именно как кэш мелких OLTP-операций. Например, когда GoldenGate со страшной силой льет данные в real-time в одну Exadata из десятка разных банковских систем. Ну и еще для индексного доступа. Все-таки хранилище живет не одними full-scanами. Есть и выборки, возвращающие, скажем, по 0,5% данных. Есть и join, которые иногда дешевле делать через index. Есть и адовы PL/SQL, которые курсорами обрабатывают данные. Есть и гибридные системы, когда в одной системе живет и OLTP, и online-отчетность. Так что, лично я, не вижу необходимости в увеличении пропускной способности. А вот кол-во IOPS это да.
http://www.oracle.com/technetwork/database/exadata/exadata-x5-2-ds-2406241.pdf Full Rack - 14 x Exadata Storage Servers X5-2 - 56 PCI flash cards with 89.6 TB (raw) Exadata Smart Flash Cache, 168 x 4 TB 7,200 RPM High Capacity disks.
Вася УткинТ.е. на 1 сервер Exadata приходится:
4 диска PCIe(gen3 4x) SSD 1.6 TB 2GB/sec 450K IOPS

12 дисков 4TB HDD 7200 rpm

И в FullRack 14 таких двухсокетных серверов.
Ну не надо забывать, что еще появился вариант Extreme Performance.
Там вообще никакого SATA нет. В ячейке есть только 24 x 1.6 TB NVMe PCI Flash Drives. Я бы такую конфигурацию для OLTP брал. Ну и повторюсь, сейчас стало возможным делать любую набивку - сначала ставите 2 db server+3 storage, а потом добавляете, что душе угодно.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874908
Вася Уткин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Alexander RyndinВася УткинFlash Accelerator F160 PCIe Card (Intel DC P3600) по IOPS-ам на read раза в 3 поболее, чем Flash Accelerator F80 PCIe Card (Sun).
А вот последовательные операции поменяли шило на мыло, с 2 до 2.6 GB/sec. А интерфейс так вообще той же скорости оставили PCIe gen2 8X на PCIe gen3 4X, странные они товарищи :)Из собственного опыта этот флэш важен именно как кэш мелких OLTP-операций. Например, когда GoldenGate со страшной силой льет данные в real-time в одну Exadata из десятка разных банковских систем. Ну и еще для индексного доступа. Все-таки хранилище живет не одними full-scanами. Есть и выборки, возвращающие, скажем, по 0,5% данных. Есть и join, которые иногда дешевле делать через index. Есть и адовы PL/SQL, которые курсорами обрабатывают данные. Есть и гибридные системы, когда в одной системе живет и OLTP, и online-отчетность. Так что, лично я, не вижу необходимости в увеличении пропускной способности. А вот кол-во IOPS это да.
А заливка через Golden Gate в real-time всегда приводит к random-write (записи блоками меньше 1 MB) и batch mode не спасает?
И потом, это в F160 по сравнению с F80 в 3 раза random-read увеличился с 150K до 450K, а random-write наоборот упал, со 130K до 50K
Хотя здесь сложно сравнивать, в первом случае блоки по 4 KB, а во втором по 8 KB.

Насчет Index Seek, Join(NLJ), Cursors - и других прелестей OLTP...
С одной стороны да, с другой посмотрите на тренды.
Когда только внедрили Falsh Cache - между сервером Exadata и 3-мя дисками 2.5'' HDD 7.2K-rpm (в сумме 300 IOPS, 300 MB/sec) поставили Flash Accelerator F80 PCIe Card (150K IOPS, 2000 MB/sec), то подняли:
в 500 раз IOPS-ы

в 7 раз Bandwidth

По сравнению с 500 раз, ещё в 3 раза поднять IOPS-ы это уже не так значимо, как если бы уже в 7 раз ускоренный bandwidth ускорили бы ещё в 6 раз, увеличив количество flash-чипов на SSD и подняв скорость интерфейса PCIe c gen3 4x до gen3 16x - до 12 GB/sec.

Но видимо действительно пытаются заточить Exadata уже не столько под DWH, сколько под OLTP.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38874980
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Вася УткинА заливка через Golden Gate в real-time всегда приводит к random-write (записи блоками меньше 1 MB) и batch mode не спасает?Случаю бывают разные, но в общем случае не спасает. Batch Mode - это лишь более крупные транзакции (ниже нагрузка на LGWR) и операции выполняются не по одной, а массивами (меньше кол-во round-trip на сервер). Но если все 1000 сгруппированных операций меняют 1000 разных блоков данных, то нам все равно придется сделать 1000 IOPS, а если быть точным, то как минимум 2000 IOPS, ибо доступ по индексу. Ну это, конечно, важно, если активный набор данных не вмещается в оперативку.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38875000
Ivan Durak
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Alexander RyndinВася УткинА заливка через Golden Gate в real-time всегда приводит к random-write (записи блоками меньше 1 MB) и batch mode не спасает?Случаю бывают разные, но в общем случае не спасает. Batch Mode - это лишь более крупные транзакции (ниже нагрузка на LGWR) и операции выполняются не по одной, а массивами (меньше кол-во round-trip на сервер). Но если все 1000 сгруппированных операций меняют 1000 разных блоков данных, то нам все равно придется сделать 1000 IOPS, а если быть точным, то как минимум 2000 IOPS, ибо доступ по индексу. Ну это, конечно, важно, если активный набор данных не вмещается в оперативку.
решается отдельным сервером для репликации. Все равно 90% хранилища читают раз в сутки, когда реал-тайм не нужен.
Отдельный сервак чисто с репликой справляется, а основное хранилище читает из него раз в сутки, и не имеет олтп нагрузки.
И все счастливы.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38875078
Azul
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
можно вопрос?
наши купили для одной из АБС вот такую вот серверную стойку
ну я так думаю она будет на 50% мощности задействована
если поднять тут один виртуальный сервер
может ли что то путное получится по описанной выше задаче?
спасибо!

Серверный комплекс системы управления базами данных на базе серверов Hewlett Packard HP BL460c (P/N 735151-B21), в составе:

(P/N 735151-B21) HP BL460c Gen8 E5-v2 10Gb FLB CTO CPU 2хE5-2630v2, DDR 64Gb, HDD 2x300GB 6G SAS 15K, Flex Fabric 10Gb 2P 534FLB, Smart Array P220i Controller / сервер – 8 шт.

(P/N 589257-B21) MS WS08 R2 Ent Ed 10CAL ROK E F S SW

/ программное обеспечение – 8 шт.

(P/N 681844-B21) Blade HP BLc7000 CTO 3 IN LCD Plat Enclosure

/ серверное шасси – 1 шт.

(P/N BW904A) HP 642 1075mm Shock Intelligent Rack

/ серверная стойка – 1 шт.

(P/N 735151-B21) HP BL460c Gen8 E5-v2 10Gb FLB CTO CPU 2хE5-2667v2, DDR 64Gb, HDD 2x300GB 6G SAS 15K, Flex Fabric 10Gb2P 534FLB, Smart Array P220i Controller / сервер - 2 шт.

(P/N 589257-B21) MS WS08 R2 Ent Ed 10CAL ROK E F S SW

/ программное обеспечение – 2 шт.

(P/N 735151-B21) HP BL460c Gen8 E5-v2 10/20Gb CTO Blade CPU 2хE5-2609v2, DDR 48Gb, HDD 2x300GB 6G SAS 15K, Flex Fabric 10Gb 2P 534FLB, HP Smart Array P220i Controller / сервер - 1 шт.

(P/N 7NQ-00584) SQLSvrStdCore 2014 RUS OLP 2Lic C Gov CoreLic / /программное обеспечение – 16 шт.

(P/N AP880A) HP D2200sb Storage Blade 12 x 600GB 6G SAS 10K

/ система резервного копирования – 1 шт.

(P/N QR482A) HP 3PAR StoreServ 7200 2-N Storage Base, 2 x 3PAR 7000 4-pt 8Gb/s FC Adapter, HDD 8 x M6710 900GB 6G SAS 10K,2 x 8/8 Base (0) e-port SAN Switch, M6720 3.5in 4U SAS Drive Enclosure, 12 x M6720 2TB 6G SAS 7.2K 3.5in NL HDD

/ дисковая система хранения данных - 1 шт.

(P/N AJ836A) HP 5m Multi-mode OM3 LC/LC FC Cable

/ интерфейсный кабель – 16 шт.

(P/N AJ716B) HP 8Gb Short Wave B-Series SFP+1 Pack / трансивер – 20 шт.

(P/N C0H19A) HP 1/8 G2 LTO-6 Ult 6250 FC Autoloader

/ ленточная система резервного копирования – 1 шт.

(P/N QK734A) HP Premier Flex LC/LC OM4 2f 5m Cbl

/ интерфейсный кабель – 1 шт.

(P/N C7976A) HP LTO-6 Ultrium 6.25TB MP RW Data Tape

/ картридж данных для ленточного накопителя - 8 х 10 шт.

(P/N J9726A) HP 2920-24G Switch / сетевой коммутатор – 2 шт.

(P/N J9731A) HP 2920 2-port 10GbE SFP+ Module / трансивер – 2 шт.

(P/N J9735A) HP 2920 1.0m Stacking Cable / интерфейсный кабель - 2шт.

(P/N J9283B) HP X242 10G SFP+ SFP+ 3m DAC Cable / трансивер – 4 шт.

(P/N J9806A) HP 640 EPS/RPS 1m Cable / интерфейсный кабель – 2 шт.

(P/N AF463A) HP R7KVA UPS 4U IEC-32A HV Intl Kit

/ источник бесперебойного питания -2 шт.

Moxa NPort 6610-8 8-port RS-232 secure device server, 100 to 240 VAC power input / 8-портовый асинхронный сервер RS-232 – 2 шт.

(P/N AW-USB-14) Digi Anywhere USB/14

/ сетевой концентратор USB-портов – 2 шт.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38875232
Фотография kdv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Azul,

вы думаете, кто-то будет вчитываться в вываленный копипастом список запчастей? Да еще с дублями по софту?
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38875321
mad_nazgul
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Azulможно вопрос?
наши купили для одной из АБС вот такую вот серверную стойку
ну я так думаю она будет на 50% мощности задействована
если поднять тут один виртуальный сервер
может ли что то путное получится по описанной выше задаче?
спасибо!


А риски падения системы и простоя вы будете оплачивать?
Когда система не выдержит пиковой нагрузки, то виноваты будете вы.
А так пока "виноват" консалт, т.к. не правильно посчитал пиковую нагрузку. ;-)
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38875377
Yo.!
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Azulможно вопрос?
наши купили для одной из АБС вот такую вот серверную стойку
ну я так думаю она будет на 50% мощности задействована
если поднять тут один виртуальный сервер
может ли что то путное получится по описанной выше задаче?
спасибо!

без шансов. во первых никто вам резерв не отдаст, он не ради развлечения покупается. во вторых сервер явно краденый из музея, там в стойке 10К и 7.5К диски и 64гб рам. у четертинки exadata только у сториджа в разы рама больше :)
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38875934
Вася Уткин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Yo.!сервер явно краденый из музея, там в стойке 10К и 7.5К диски
Только не 7.5K, а 7.2K rpm, и в Exadata такие же, а какие должны быть, чтобы не из музея?
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38875969
Azul,

добрый день.
Готовы проконсультировать вас по поводу решений для хранилищ на основе IBM Netezza (PureData for Analytics). Это классчиеское MPP решение для хранилищ данных, которое подходит для описанной вами задачи.

+79857665487
vgrabeln@ru.ibm.com
Всеволод Грабельников. Технический консультант по Netezza/BigData решениям компании IBM
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38876440
Фотография alexeyvg
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Azulсуть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительностиПро ЭТО нужно рассказать подробнее. Может, там 100500 запросов в секунду?

Azulну во первых их нужно собрать из разрозненных источников (базы MSSQL, DBF файлы, текстовые файлы и т.д.)
затем каждый раз подкачивать из схожих источников
затем из них должны формироваться отчеты
еще они должны быть доступны через пользовательский интерфейс (пользователи не программисты) для формирования отчетов и составления новых отчетных формВ MSSQL для этого есть все инструменты. MSSQL, SSIS, SSRS, + у MS есть решения для разработки клиентов, при необходимости.

Тут вопрос не в возможностях (повторю, продукты основных игроков сейчас достаточно близки), и даже не d ценt (MSSQL получится подешевле - но не на порядки), а на имеющуюся инфораструктуру, специалистов, лицензионные программы, политику компании по деверсификации рисков - вот это ключевые критерии.

А так, по технологиям - если остальное устраивает, то технологически решения на основе MSSQL вполне подойдут, там будет весь комплекс технологий "в одном флаконе".
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38876449
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
alexeyvgТут вопрос не в возможностях (повторю, продукты основных игроков сейчас достаточно близки)Человек, всю жизнь ездящий на жигули, рассказывает всем, что и Ягуар, и Феррари, и Формула, и его "копейка" - это все очень близкие продукты основных игроков. И его "копейка" еще и подешевле будет.

P.S. сравнение MSSQL и Exadata - это вообще из разряда сравнения самоката и самолета. Оба они "само", но в остальном сходства не наблюдается. Ибо MSSQL - это софт, а Exadata это программно-аппаратный комплекс. Так что не надо тут рассказывать про "продукты основных игроков сейчас достаточно близки"... У Microsoft просто нет такого решения как класса.
P.S.S. другое дело, что человеку Exadata может быть просто не нужна... но это мы, увы, сказать не можем
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38876468
Фотография alexeyvg
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Azulможно вопрос?
наши купили для одной из АБС вот такую вот серверную стойку
ну я так думаю она будет на 50% мощности задействована
если поднять тут один виртуальный сервер
может ли что то путное получится по описанной выше задаче?
спасибо!Вы ршили сделать систему, потратив в 100 раз меньше денег, чем предложила та компания?

Это бесперспективно. Вы про**ёте решение, испортите себе карьеру, несостоявшийся конкурент

Съэкономить можно много, но всё таки не в 100 раз :-)

По железкам - не знаю, какая нагрузка планируется, но видно, что ваше "лишнее" оборудование слабое. Диски слабые, а это главное для СУБД
Вы рассказываете про супер-решения с огромной памятью, SSD, кешами - и тут же хотите откусить часть производительности у рейда с 8 дисками - смех. Этого рейда мало для сервера СУБД с одним процессором, а к нему подключили 8 серверов :-)
А, или там 8х8 дисков? Тогда да, для одного сервера из восьми хватит, но не больше.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38876470
Фотография alexeyvg
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Alexander RyndinP.S. сравнение MSSQL и Exadata - это вообще из разряда сравнения самоката и самолета. Оба они "само", но в остальном сходства не наблюдается. Ибо MSSQL - это софт, а Exadata это программно-аппаратный комплексНадо же, а PDW - это не программно-аппаратный комплекс?
Рассказывайте про решения, которые вы знаете.
Я уж не говорю, что поставка в комплекте с железом не делает решение нарантированно оптимальным или даже просто подходящим.
Alexander RyndinЧеловек, всю жизнь ездящий на жигули, рассказывает всем, что и Ягуар, и Феррари, и Формула, и его "копейка" - это все очень близкие продукты основных игроковНу, вот такое мнение рынка.
А я, как и вы, не могу выступать экспертом для всех существующих продуктов. Может, ваш Oracle и Exadata - жигули, но тоже имеют свою рыночную нишу.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38876496
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
alexeyvgAlexander RyndinP.S. сравнение MSSQL и Exadata - это вообще из разряда сравнения самоката и самолета. Оба они "само", но в остальном сходства не наблюдается. Ибо MSSQL - это софт, а Exadata это программно-аппаратный комплексНадо же, а PDW - это не программно-аппаратный комплекс?
Рассказывайте про решения, которые вы знаете.
Я уж не говорю, что поставка в комплекте с железом не делает решение нарантированно оптимальным или даже просто подходящим.Ок. Это не совсем то же самое, что и Exadata, но похоже. Сравнивать тогда нужно с Exadata. Насторожило:
- Microsoft has added features to unify the query and administrative experiences of SQL Server 2012 PDW with those of SQL Server 2012 Enterprise Edition (т.е. это все-таки разные системы, насколько я понял это бывшая DataAllegro)
- Почему-то до сих пор нет MS PDW 2014?
- Зачем-то внутрь запихнули Hadoop, который может быть нафиг не нужен
alexeyvgAlexander RyndinЧеловек, всю жизнь ездящий на жигули, рассказывает всем, что и Ягуар, и Феррари, и Формула, и его "копейка" - это все очень близкие продукты основных игроковНу, вот такое мнение рынка.
А я, как и вы, не могу выступать экспертом для всех существующих продуктов. Может, ваш Oracle и Exadata - жигули, но тоже имеют свою рыночную нишу.[/quot]Не ерничайте. Вы меня прекрасно поняли. СУБД MSSQL нужно сравнивать с Oracle, а Microsoft SQL PDW с Oracle Exadata. Я пока на российском рынке не встречал PDW. Хотя пользователи Microsoft-продуктов это отдельная вселенная.

Интересно было посмотреть, как PDW себя ведет при попытке лить и читать данные одновременно. Для многих современных MPP это серьезная проблема. И как там с переносом обычной базы данных MSSQL? Можно ли перенести один в один? Насколько хорошо себя ведет на adhoc-запросах? Но на эти вопросы я вряд ли получу ответ. Или нет?
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38876584
Фотография alexeyvg
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Alexander RyndinОк. Это не совсем то же самое, что и Exadata, но похоже. Сравнивать тогда нужно с Exadata. Насторожило:
- Microsoft has added features to unify the query and administrative experiences of SQL Server 2012 PDW with those of SQL Server 2012 Enterprise Edition (т.е. это все-таки разные системы, насколько я понял это бывшая DataAllegro)
- Почему-то до сих пор нет MS PDW 2014?
- Зачем-то внутрь запихнули Hadoop, который может быть нафиг не нужен- Да, система другая. Это не MSSQL, который поставляется в комплекте с железом. PDW в общем несколько по другому программируется.
- Не выпустили ещё.
- Hadoop там - это просто дополнительная возможность. PDW расчитан на большие хранилища, а там есть такой модный Hadoop - ну вот его туда и впихнули.
Alexander RyndinСУБД MSSQL нужно сравнивать с Oracle, а Microsoft SQL PDW с Oracle Exadata. Я пока на российском рынке не встречал PDW. Хотя пользователи Microsoft-продуктов это отдельная вселенная.

Интересно было посмотреть, как PDW себя ведет при попытке лить и читать данные одновременно. Для многих современных MPP это серьезная проблема. И как там с переносом обычной базы данных MSSQL? Можно ли перенести один в один? Насколько хорошо себя ведет на adhoc-запросах? Но на эти вопросы я вряд ли получу ответ. Или нет?А Oracle Exadata на российском рынке встречали (просто интересно)? ИМХО мало таких систем на рынке. Одно внедрение PDW точно идёт (у моих знакомых), есть ли ещё - не в курсе...

Насчёт "лить и читать одновременно" не знаю, я сам плотно с ним не работал.

"Просто перенести" нельзя, PDW требует отдельных подходов (код нужно менять, и модель днных); как я выше уже написал, PDW - это не поставка MSSQL в комплекте с железом.
MS не видит причин делать такие поставки - есть тесное сотрудничество с основными вендорами, у них есть мощнейшие суперсерверы, системы хранения, в т.ч. многоуровневые, у MS есть некие алгоритмы выбра сбалансированного железа для одстижения высокой производительности (не смог быстро найти, не помню точное название).

А PDW - это именно другой подход к построению хранилищь. Честно говоря, я думал, что Exadata - тоже другой подход, а не комплект желехо+СУБД.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38876704
Фотография SergSuper
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
alexeyvgА Oracle Exadata на российском рынке встречали (просто интересно)?
знаю что банк "Санкт-Петербург" использует
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38876727
Ivan Durak
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Alexander RyndinИнтересно было посмотреть, как PDW себя ведет при попытке лить и читать данные одновременно. Для многих современных MPP это серьезная проблема.
В чем и кого проблема?
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38876958
Вася Уткин
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
alexeyvgу MS есть некие алгоритмы выбра сбалансированного железа для одстижения высокой производительности ( не смог быстро найти , не помню точное название).
Не только вы, но и большинство пользователей MS SQL, учитывая, что большинство знает меньше, чем вы :)
Exadata хороша тем, что клиент не сможет облажаться набрав кучу несбалансированного "добра".

А как часто вы видели кэш на чтение на SSD и разную степень сжатия частей одной таблицы - применимо для MS SQL?
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38877026
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
alexeyvg, прежде всего спасибо за ответы.

alexeyvg1) Да, система другая. Это не MSSQL, который поставляется в комплекте с железом. PDW в общем несколько по другому программируется.
2) (PDW 2014) Не выпустили ещё.
3) Hadoop там - это просто дополнительная возможность. PDW расчитан на большие хранилища, а там есть такой модный Hadoop - ну вот его туда и впихнули.
Я подозреваю, что 2) следует из 1). У Oracle с Exadata другая история. Бинарники базы данных ничем не отличается от обычного Oracle. Отличая, по сути, в одном параметре, который разрешает или запрещает уникальные функции Exadata. Эти уникальные функции реализованы в Exadata Software.
alexeyvgMS не видит причин делать такие поставки - есть тесное сотрудничество с основными вендорами, у них есть мощнейшие суперсерверы, системы хранения, в т.ч. многоуровневые, у MS есть некие алгоритмы выбра сбалансированного железа для одстижения высокой производительности (не смог быстро найти, не помню точное название).У Orale есть такое. Называется Oracle Optimized Warehouse . Но это совсем не то.

alexeyvg4) "Просто перенести" нельзя, PDW требует отдельных подходов (код нужно менять, и модель днных); как я выше уже написал, PDW - это не поставка MSSQL в комплекте с железом.
А PDW - это именно другой подход к построению хранилищь. Честно говоря, я думал, что Exadata - тоже другой подход, а не комплект желехо+СУБД.Exadata - состоит из обычной СУБД Oracle, железа и главное, Exadata Software (основной profit для хранилища создает именно Exadata Software)

alexeyvgА Oracle Exadata на российском рынке встречали (просто интересно)? ИМХО мало таких систем на рынке. Одно внедрение PDW точно идёт (у моих знакомых), есть ли ещё - не в курсе...Exadat в России уже очень много. Цифры называть не могу, сорри. Публичная информация вот тут есть, например.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38877045
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ivan DurakAlexander RyndinИнтересно было посмотреть, как PDW себя ведет при попытке лить и читать данные одновременно. Для многих современных MPP это серьезная проблема.
В чем и кого проблема?Сейчас многие хранилища строится согласно вот такой архитектуре (привожу от Oracle, но то же самое есть и у других вендоров). Ниже картинка.
Если посмотрите, то
- данные льются в stage, в том числе в real-time
- внизу есть такая штука как Analytical Discovery, которая ходит в том числе и к stage
- на рисунке не показано, но есть еще и оперативная отчетность, которая работает с данными, не обработанными ETL, ибо нужно real-time, а на источниках такую отчетность запускать нежелательно
- в больших хранилищах большую часть загрузки стараются делать из stage, наполняемого CDC, а не ETL. Связано это в том числе с режимом 24/7 на источниках. У многих сейчас уже не хватает ночного batch window для полной проливки хранилища, а всем хочется иметь хранилище -1, а не -2.

Вот и возникает потребность одновременно писать данные в stage с помощью того же GoldenGate и параллельно анализировать их в Online Reporting, Discovery, а также без проблем забирать данные в следующие слои хранилища в любой момент времени.

.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38877047
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ну да, главное. Exadata спокойно работает в такое режиме, ибо Oracle.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38877736
Ivan Durak
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Alexander RyndinНу да, главное. Exadata спокойно работает в такое режиме, ибо Oracle.
ммм. правильная архитектура такая:
Репликация из источника льется в не в основное хранилище, а в отдельную базу. Причем можно даже не в mpp, ибо они к oltp загрузке не оптимизированы, а хоть даже в оракл или как у нас в постгрес даже. Ну и уже из него тянет и онлайн и не онлайн etl загрузку в основной stage и онлайн аналитика на него смотрит. А в вашей архитектуре mpp аналитичсеская субд нагружена oltp нагрузкой из источников, причем из мноооогих одновременно. Зачем ей такая нагрузка?? Да и дорого лишние объемы держать на дорогом mpp когда их можно на бесплатный постгрес реплицировать (что мы и делаем к примеру).
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38877921
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ivan Durak,

Отличие вашей архитектуры в дополнительной промежуточной oltp. Плюс между этой oltp и stage появляется довольно нетривиальный etl (он ведь должен уметь делать online). Stage у вас, как я понял, по прежнему на mpp. Он нужен для оперативной отчётности, а значит вряд ли вы там что агрегируете. Отсев ненужных данных делается ещё на источнике при захвате репликацией. Да и железо под вашу реплику вряд ли будет дешёвое.

По поводу дороговизны хранения на mpp. Минимальная exadata (1/8) уже имеет на борту 72 Tb сырого пространства.

А oltp нагрузка для неё семечки за счёт большого флеш кэша
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38878014
Ivan Durak
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Alexander RyndinIvan Durak,

Отличие вашей архитектуры в дополнительной промежуточной oltp. Плюс между этой oltp и stage появляется довольно нетривиальный etl (он ведь должен уметь делать online).

Во-первых это етл ни чем не сложнее чем если бы реплика писала нам прямо в mpp !! Он такой же, только источник лежит подальше.
А во-вторых. Эта архитектура так же прекрасно подходит и для обычных батчевых ежедневных хранилищ,
все плюсы сохраняются: меньше oltp нагрузки на основной mpp сервер + меньше стораджа надо на mpp.

Stage у вас, как я понял, по прежнему на mpp. Он нужен для оперативной отчётности, а значит вряд ли вы там что агрегируете. Отсев ненужных данных делается ещё на источнике при захвате репликацией. Да и железо под вашу реплику вряд ли будет дешёвое.

Железо под оракл или постгрес в разы дешевле чем железо под нетизу или ексадату !! Вам ли не знать.

По поводу дороговизны хранения на mpp. Минимальная exadata (1/8) уже имеет на борту 72 Tb сырого пространства.
А oltp нагрузка для неё семечки за счёт большого флеш кэша

72 тб не так уж и много, а у какой-нить нитиззы вообще расширение объема не предусмотрено - целиком менять все.
Во-вторых рад за эксадату конечно (хотя опять же не вижу смысла нагружать ее этими онлайн репликами), но пардон в доброй половине mpp даже индексов нет, а апдейты с делитами ложат перформанс в ноль. А у какой0нить вертики и не предусмотрены вообще.
а в третьих наша архитектура универсальна и удобна и масштабируема
реплику можно писать и не на один сервер, а хоть на столько сколько источников и даже больше.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38878179
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ivan DurakВо-первых это етл ни чем не сложнее чем если бы реплика писала нам прямо в mpp !! Он такой же, только источник лежит подальше.Стоп, стоп, стоп. Если я делаю репликацию с помощью GoldenGate, то копию базы плюс историю на Exadata я получаю вообще не делая никакого ETL. 2 дня работы. Вам же, чтобы вынести отчетность на нормальную базу с Intraquery-параллелизмом приходится наворачивать ETL.
Ivan Durak Stage у вас, как я понял, по прежнему на mpp. Он нужен для оперативной отчётности, а значит вряд ли вы там что агрегируете. Отсев ненужных данных делается ещё на источнике при захвате репликацией. Да и железо под вашу реплику вряд ли будет дешёвое.

Железо под оракл или постгрес в разы дешевле чем железо под нетизу или ексадату !! Вам ли не знать.Подождите. Ну вы ведь все равно держите stage на mpp, который является источником для оперативной отчетности? Вы просто впереди ставите еще одну железку, с еще одной базой.

Ivan DurakПо поводу дороговизны хранения на mpp. Минимальная exadata (1/8) уже имеет на борту 72 Tb сырого пространства.
А oltp нагрузка для неё семечки за счёт большого флеш кэша
72 тб не так уж и много, а у какой-нить нитиззы вообще расширение объема не предусмотрено - целиком менять все.
Во-вторых рад за эксадату конечно (хотя опять же не вижу смысла нагружать ее этими онлайн репликами), но пардон в доброй половине mpp даже индексов нет, а апдейты с делитами ложат перформанс в ноль. А у какой0нить вертики и не предусмотрены вообще.Ну я согласен про классические MPP. В них нельзя делать прямую репликацию.
72 ТБ, по моему, очень даже неплохо, если еще и учесть, что холодны данные жмутся поколоночно, что сокращает данные раз 5-8. Не так уж и много на территории бывшего СССР хранилищ такого объема. Да и, опять таки, 72 Тб - это 1/8, которая парой команд превращается в 1/4. Либо в любой другой объем в online.
Ivan Durakа в третьих наша архитектура универсальна и удобна и масштабируема
реплику можно писать и не на один сервер, а хоть на столько сколько источников и даже больше.Обычно универсальность - это обратное сторона низкой производительности.
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38878392
Ivan Durak
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Alexander RyndinIvan DurakВо-первых это етл ни чем не сложнее чем если бы реплика писала нам прямо в mpp !! Он такой же, только источник лежит подальше.Стоп, стоп, стоп. Если я делаю репликацию с помощью GoldenGate, то копию базы плюс историю на Exadata я получаю вообще не делая никакого ETL. 2 дня работы. Вам же, чтобы вынести отчетность на нормальную базу с Intraquery-параллелизмом приходится наворачивать ETL.
Так вы отчетность напрямую на cdc строите?? не-не-не. Такого мы не делаем. Стэйд у нас уже агрегированный с нужной историей нужной гранулярности!! Вот благодаря этому и етл такой же и экономия места.


Ivan Durakа в третьих наша архитектура универсальна и удобна и масштабируема
реплику можно писать и не на один сервер, а хоть на столько сколько источников и даже больше.Обычно универсальность - это обратное сторона низкой производительности.[/quot]
производительность наоборот возрастает. mpp разгружаем от лишней несвойственной да еще и постоянной нагрузки!
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38878596
Фотография Apex
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ivan DurakAlexander RyndinИнтересно было посмотреть, как PDW себя ведет при попытке лить и читать данные одновременно. Для многих современных MPP это серьезная проблема.
В чем и кого проблема?
для тех, которые блокировочники в силу тех или иных исторических причин
...
Рейтинг: 0 / 0
Oracle exadata vs MSSQL
    #38907596
## do diezz ##
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Вася УткинalexeyvgКстати, MSSQL тоже с некоторых пор columnstore
Он теперь только columnstore, или может и row и column, и кто это решает, СУБД автоматически или разработчик прописывая в DDL каждой таблицы?

"... может и row и column..."

"... разработчик, прописывая в DDL каждой таблицы..."
...
Рейтинг: 0 / 0
61 сообщений из 61, показаны все 3 страниц
Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / Oracle exadata vs MSSQL
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]