|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Доброго времени суток вопрос может показаться тупым и дилетантским, прошу сильно не травить суть в чем? я работаю в крупном коммерческом банке, и как сами понимаете объем операций, и как следствие записей в БД очень большой. Ну на вскидочку миллионов 300 уникальных записей в год. Банк работает уже 20 лет, следовательно речь идет о 6 миллиардах записей в БД. Сейчас необходима общая база по всем операциям которые раскиданы по разным системам автоматизированных банковских дней. Пригласили одну фирму, которая предложила за очень хорошие деньги этот проект реализовать. Реализовать на базе решения Oracle Exadata, и как они расписывают - что даже огромные запросы - к примеру выписки за 10 лет будут крутиться за секунды. Благодаря сохранению часто запрашиваемых данных в флеш памяти, аппаратной компрессии и т.д. Я хотел спросить - а что действительно решения Оракл такие быстрые и оптимизированные? По производительности неужели MSSQL так сильно отстает? Я честно говоря всю жизнь работаю на 2003-2005 версиях, поэтому всех возможностей далеко не знаю. Вообще есть ли отставание или все эти прогнозы насчет нескольких секунд достигаются за счет аппаратной составляющей? Спасибо ... |
|||
:
Нравится:
Не нравится:
|
|||
08.02.2015, 21:52 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
сравнивать нужно сравниваемое. Ехадата - это аппаратное решение, поверх которого обычный Оракл, потому и цена недешевая. Вот посостязаться бы Ехадата с Терадата ... |
|||
:
Нравится:
Не нравится:
|
|||
08.02.2015, 22:04 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
AzulПо производительности неужели MSSQL так сильно отстает?Последний десяток лет - примерно одинаково. На одинаковом железе разницы не будет. Решения с аппаратной составляющей у MSSQL тоже есть, см. PDW Использование SSD в хранилищах - обычное дело, и для высокой производительности это даже дешевле обычных HDD. Банки не генерят много данных, так что самое оно. Сколько это там, 6 миллиардов записей, несколько террабайт? Память в сотни гигабайт тоже совсем не редкость. AzulБанк работает уже 20 лет, следовательно речь идет о 6 миллиардах записей в БД.У меня в день такие цифры, но храним только несколько месяцев, жмётся клиент на хранилища (впрочем, ему и не нужно больше). MS сейчас базы меньше 100тб не считает большими, группы, поддерживающие большие решения, от стольких только начинают рассматривать. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.02.2015, 22:16 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
AzulДоброго времени суток вопрос может показаться тупым и дилетантским, прошу сильно не травить суть в чем? я работаю в крупном коммерческом банке, и как сами понимаете объем операций, и как следствие записей в БД очень большой. Ну на вскидочку миллионов 300 уникальных записей в год. Банк работает уже 20 лет, следовательно речь идет о 6 миллиардах записей в БД. 6 миллиардов записей для современных СУБД -- немного. Для специальных, конечно, СУБД, в основном это columnstore, не MSSQL и не Oracle, про Exadata не знаю. AzulСейчас необходима общая база по всем операциям которые раскиданы по разным системам автоматизированных банковских дней. Так смотря что с этими данными надо делать. Вы-то это не раскрываете, а от людей просите совета. А это ОЧЕНЬ зависит от того, что надо с данными делать. AzulПригласили одну фирму, которая предложила за очень хорошие деньги этот проект реализовать. Реализовать на базе решения Oracle Exadata, и как они расписывают - что даже огромные запросы - к примеру выписки за 10 лет будут крутиться за секунды. Кому нужны выписки за 10 лет ? У меня была БД в 55 милиардов записей, и запросы некоторые по ней проходили за несколько сот миллисекунд. Это конечно кластер был из 8 нод, но для масштаба можно 55 на 8 поделить. Но это были запросы на выборки, или точечные (маленькие) аргрегации. Если нужна агрегация данных за 10 лет без доп. фильтров -- это большие объёмы, и это сделать быстро, естественно, невозможно. Тогда решения -- предагрегации (но теряется универсальность и растут объёмы), или ещё что-то, но магии там всё равно нет. Вы должны понимать, за счёт чего это будет достигаться, если не понимаете, или вам не могут объяснить -- значит, врут. Azul Благодаря сохранению часто запрашиваемых данных в флеш памяти, аппаратной компрессии и т.д. Кэши работают и в обычных СУБД, они не решают тут. нужны другие технологии ещё сверх этого. Компрессия -- да, это здорово. Аппаратная или программная -- в общем, неважно. AzulЯ хотел спросить - а что действительно решения Оракл такие быстрые и оптимизированные? Это не решение Оракл, это решение Exadata. Но, ещё раз, если вам чего-то говорят, они должны уметь объяснить, за счёт чего это происходит. Ну и очень сильно это зависит и от данных, и от запросов, которые надо делать. AzulПо производительности неужели MSSQL так сильно отстает? Он не отстаёт, MSSQL -- это универсальная СУБД, ориентированная на OLTP и , с некоторыми добавками, на OLAP. Но для больших хранилищ данных она просто не подходит. Там вот Vertica, Exadata, Teradata, ещё может быть что-то. Кстати, на таких объёмах можно попробовать тот же Virtuoso, он есть в бесплатном OpenSource -варианте (6ая версия), но без кластера (а тут он не нужен, это как раз типичный объём БД для безкластерного решения). Или ещё есть MonetDB (тоже бесплатный). Ну и ещё дофига всяких есть решений, бесплатных. Т.е. в принципе можно пробовать и другие "более дешёвые" решения. Но естественно со всеми надо будет РАБОТАТЬ, т.е. разбираться досконально в предметной области и постановке, и в технологиях конкретной СУБД. AzulВообще есть ли отставание или все эти прогнозы насчет нескольких секунд достигаются за счет аппаратной составляющей? даже если там и есть аппаратная компрессия, то скорее всего она не играет решающую роль тут. Больше будут играть columnstore, сжатие данных, векторная обработка, и, конечно, старое доброе кэширование и индексирование. Я думаю, что скорее инженеры Экзадаты просто выпендрились, имея возможность сделать что-то аппаратно, и оно там хоть и ускоряет само сжатие раз в 100, но всё же в СУБД основные затратные операции -- это чтение диска и сканирование данных, они в 1000-10000 раз затратнее, чем любое сжатие в памяти (на чём и стоит отрасль columnstore). Возможно, я неправ. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.02.2015, 22:18 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Сори, ещё из решающих технологий надо, естественно, указать параллельные и распределённые вычисления. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.02.2015, 22:21 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
MasterZivMSSQL -- это универсальная СУБД, ориентированная на OLTP и , с некоторыми добавками, на OLAP. Но для больших хранилищ данных она просто не подходит. Там вот Vertica, Exadata, Teradata, ещё может быть что-то. Кстати, на таких объёмах можно попробовать тот же VirtuosoДа какие тут большие объёмы? Действительно:MasterZiv6 миллиардов записей для современных СУБД -- немного MasterZivДля специальных, конечно, СУБД, в основном это columnstore, не MSSQL и не Oracle, про Exadata не знаю.Для обычных БД это немного, зачем специальные? Специальные - слишком жирно для таких объёмов. Кстати, MSSQL тоже с некоторых пор columnstore, не знаю, как там у Oracle с этим. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.02.2015, 22:41 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Azulдаже огромные запросы - к примеру выписки за 10 лет будут крутиться за секундыИ действительно задачи важны. Выписка за 10 лет по одному клиенту должны крутиться за миллисекунды, без всяких экзадат. А вот если нужна выписка по всему банку за 10 лет... :-) Модератор: Тема перенесена из форума "Microsoft SQL Server". ... |
|||
:
Нравится:
Не нравится:
|
|||
08.02.2015, 22:45 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Спасибо огромное за ответы, дело в том что на вскидочку все решение аппаратная составляющая + решение компании + лицензия будет стоить 1,5 - 2 млн. долларов это многовато... суть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительности а что делать с данными? ну во первых их нужно собрать из разрозненных источников (базы MSSQL, DBF файлы, текстовые файлы и т.д.) затем каждый раз подкачивать из схожих источников затем из них должны формироваться отчеты еще они должны быть доступны через пользовательский интерфейс (пользователи не программисты) для формирования отчетов и составления новых отчетных форм ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 06:07 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
в общем, я так понял MSSQL не совсем для этого... дайте пожалуйста направление - в какую сторону смотреть, что почитать по этому вопросу очень благодарен ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 06:17 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Azul в общем, я так понял MSSQL не совсем для этогоНе правильно понял Azul предложила за очень хорошие деньги этот проект реализоватьЭто был ключевой момент. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 07:02 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
AzulСпасибо огромное за ответы, дело в том что на вскидочку все решение аппаратная составляющая + решение компании + лицензия будет стоить 1,5 - 2 млн. долларов это многовато... Да не это нормально. Программно-аппаратное решение от MS не думаю что будет стоит сильно дешево, может пару тысяч скинут, а может и нет. Как договорятся. Azulсуть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительности Можно. Но не на пропиетарных технологиях, т.е. OpenSource. Сэкономите в лучшем случае половину, а так основная стоимость будет железо(где-то 2/3 - 3/4 от вашей суммы). Поэтому не советую. "Еще не уволили ни одного менеджера, за покупку решения от IBM" (c) не мой. ;-) Azulа что делать с данными? ну во первых их нужно собрать из разрозненных источников (базы MSSQL, DBF файлы, текстовые файлы и т.д.) затем каждый раз подкачивать из схожих источников Вот это как раз не проблема, а стандартная задача, для которой есть решение как у MS, так и у Oracle и OpenSource. Читать про ETL. Azulзатем из них должны формироваться отчеты еще они должны быть доступны через пользовательский интерфейс (пользователи не программисты) для формирования отчетов и составления новых отчетных форм Опять же это стандартная задача. Читать про OLAP. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 07:07 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Azulдело в том что на вскидочку все решение аппаратная составляющая + решение компании + лицензия будет стоить 1,5 - 2 млн. долларов это многовато... суть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительности"это" - всё-таки что это? если только посмотреть выписку, то наверное можно и раз в 10 дешевле, если нужна полноценная банковская система, то мне кажется маловато я так понял речь идет об узбекском банке, не знаю насколько там учет отличается и подойдут ли какие российские АБС, но на ЦФТ по-моему несколько узбекских банков работает http://bank.uz/publish/doc/text61391_innovacionnye_resheniya_dlya_bankov_respubliki_uzbekistan ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 08:35 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
[quot alexeyvg]Да какие тут большие объёмы? Действительно:MasterZiv6 миллиардов записей для современных СУБД -- немного Обычные СУБД, я бы сказал, работают с БД до миллиарда записей. Конечно, всё ещё сильно зависит от задач. MasterZivКстати, MSSQL тоже с некоторых пор columnstore, не знаю, как там у Oracle с этим. Ну, возможно, тогда и MSSQL можно попробовать. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 09:56 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
AzulСпасибо огромное за ответы, дело в том что на вскидочку все решение аппаратная составляющая + решение компании + лицензия будет стоить 1,5 - 2 млн. долларов это многовато... суть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительности Можно точно. Тем более за такие деньги. Azulа что делать с данными? ну во первых их нужно собрать из разрозненных источников (базы MSSQL, DBF файлы, текстовые файлы и т.д.) затем каждый раз подкачивать из схожих источников затем из них должны формироваться отчеты Это всё можно. А вот это : Azulеще они должны быть доступны через пользовательский интерфейс (пользователи не программисты) для формирования отчетов и составления новых отчетных форм -- утопия. Без программистов ничего не работает никогда. Вам будут конечно всякие sales man ы лапшу на уши вешать, но не слушайте. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 09:59 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Azulсуть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительности без шансов. не слушайте форумных хомячков, сходите на сайт оракла почитайте в чем суть exadata. вся соль в том, что у exadata сторидж не отдает все блоки базе, а интегрирован с субд и на стороне сториджа еще занимается фильрацией данных. т.е. там где мсскл поднимет 6 млрд записей с дисков, exadata отфильтрует большую часть, не нужную для отчета. аппаратную часть собрать на коленках не проблема, вся соль exadata именно в софте, в интеллектуальном сторидже. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 10:06 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
AzulСпасибо огромное за ответы, дело в том что на вскидочку все решение аппаратная составляющая + решение компании + лицензия будет стоить 1,5 - 2 млн. долларов это многовато... Поинтересуйтесь у Oracle-поставщика сколько будет стоить ежегодный суппорт на выбранную экзадату (quarter rack ? судя по цене), ну чтоб потом не было сюрпризов. суть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительности Раз у вас еcть опыт с MSSQL, то сделайте свой внутренний пилот на 2014-ом (там появились clustered column-store indexes), загоните туда свои 6 ярдов до покрутите (на нормальном железе), чтобы иметь хотя бы какой-то baseline от которого уже и отталкиваться. А то может вам вообще стандартный MSSQL SSAS подойдет. Со своей колокольни : если не ограничены только MS/Oracle, то можно попробовать IBM DB2 BLU (колоночный in-memory-оптимизированный движок специально для DWH/BI/OLAP c возможностью потеррабайтного лицензирования за 60K$/TB (макс. 4 сокета) или 100K$/TB (безлимит) ) ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 10:51 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Сколько "специалистов" по Oracle набежало из форума MSSQL. Просто ппц какой-то. В двух словах про Exadata: 1) Во-первых, это софт+вся аппаратка (сервера СУБД, storage, сеть). Поскольку storage в Exadata - это не тупая полка с дисками, а, по сути, продолжение СУБД, то storage сам выполняет большУю часть операций, освобождая сервера баз данных. Другое следствие того, что storage умный - это пониженная нагрузка на канал между базой данных и storage. Раньше при полном сканировании таблицы мы должны были в память сервера грузить все данных, а теперь storage сам применяет фильтрацию и отсев столбцов 2) Во-вторых, Exadata - это гибридное поколоночное сжатие. Т.е. поколоночное, но не совсем. Поколоночное хранение хорошо, если есть только запросы на чтение - оно быстрое и хорошо жмет данные. Но чуть только кто-то что-то начинает менять данные - тут же возникают огромные проблемы. В Exadata, при построении хранилища, обычно делается таблица из двух частей: исторической и оперативной. История жмется в 5-10 раз, а оперативная часть жмется в 2-3 раза. Убиваем двух зайцев: все летает, но и данные подливаются легко - вплоть до real-time. Да, и расжатие, действительно, делается на уровне storage, а не базой данных. 3) Флеш память хороша во многих случаях, но ее основной выигрыш - это обеспечение большого количество IOPS. При этом, по-умолчанию флеш работает на Exadata как еще один уровень кэша. А значит включается автоматически. Делать вообще ничего не надо. Из недавнего, что появилось в Exadata: 1) Конфигурация стала гибкой. Если нужно мало пространства на диске, но много CPU, то можно, скажем, взять 3 ячейки storage и 10 database server. Если узкое место - storage, то ставим 10 ячеек storage и 2 сервера СУБД 2) Появилась поддержка виртуализации, что позволяет гибко оптимизировать лицензирование 3) Сжатие во flash cache. По поводу верить в это или не верить... Попросите показать. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 11:57 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
читаю, очень интересно, кстати кажется не смог объяснить - речь идет чисто об информационной системе - не автоматизированный банковский день только подкачка из основных баз - типа архив, но целостный, быстродоступный и оперативный ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 13:01 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Alexander Ryndin, зачем вы в ковычках слово специалисты пишете =( я например даже близко этого не знал люди помогают, спасибо за это ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 13:02 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Azulчитаю, очень интересно, кстати кажется не смог объяснить - речь идет чисто об информационной системе - не автоматизированный банковский день только подкачка из основных баз - типа архив, но целостный, быстродоступный и оперативныйЕсли так, то у вас выбор из следующих систем 1) Обычная база, обязательно неблокировочник (Oracle, MSSQL, DB2, etc) 2) Exadata - с одной стороны это MPP, с другой стороны прекрасно справляется с архивацией (поколочное сжатие до 10 раз), целостное (нормальные транзакции, нет грязных чтения, читатели не мешают писателем), быстрое (см. мой пост выше), оперативное (за счет партиционирования и флеша его можно обновлять в real-time) Классические MPP-платформы вам не подойдут почти по всем критериям. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 13:08 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
AzulAlexander Ryndin, зачем вы в ковычках слово специалисты пишете =( я например даже близко этого не знал люди помогают, спасибо за этоНе люблю, когда люди пишут о чем-то, не имея достаточной экспертизы. Вот я не люблю рассуждать о MSSQL, т.к. основная моя область работы - это Oracle. А с MSSQL у меня нет достаточной экспертизы уже лет 7-8. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 13:11 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Alexander Ryndin Раньше при полном сканировании таблицы мы должны были в память сервера грузить все данных, а теперь storage сам применяет фильтрацию и отсев столбцов Какую фильтрацию при фулскане?? И какой аппаратный отсев столбцов если и так колумнсторе? А вообще главный вопрос - это таки mpp или нет?? Паралельный джоин,группировку,сортировку локально на узлах умеет делать не передавая по сети данные?? ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 13:12 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Alexander RyndinСколько "специалистов" по Oracle набежало из форума MSSQL. Просто ппц какой-то. В двух словах про Exadata: 1) Во-первых, это софт+вся аппаратка (сервера СУБД, storage, сеть). Поскольку storage в Exadata - это не тупая полка с дисками, а, по сути, продолжение СУБД, то storage сам выполняет большУю часть операций, освобождая сервера баз данных. Другое следствие того, что storage умный - это пониженная нагрузка на канал между базой данных и storage. Раньше при полном сканировании таблицы мы должны были в память сервера грузить все данных, а теперь storage сам применяет фильтрацию и отсев столбцов Важно добавить, что Exadata - это тоже сервера + диски, причем Exadata берет на себя часть задач с серверов Oracle (фильтрацию по предикатам - Smart Scan/Storage Index, и сжатие - Hybrid Columnar Compression), а лицензирование серверов Exadata дешевле, чем лицензирование Oracle Enterprise Edition или тем более EE+RAC. Т.е. с Exadata удельная единица производительности получается дешевле, чем без него. Alexander Ryndin2) Во-вторых, Exadata - это гибридное поколоночное сжатие. Т.е. поколоночное, но не совсем . Поколоночное хранение хорошо, если есть только запросы на чтение - оно быстрое и хорошо жмет данные. Но чуть только кто-то что-то начинает менять данные - тут же возникают огромные проблемы. В Exadata, при построении хранилища, обычно делается таблица из двух частей: исторической и оперативной. История жмется в 5-10 раз, а оперативная часть жмется в 2-3 раза . Убиваем двух зайцев: все летает, но и данные подливаются легко - вплоть до real-time. Да, и расжатие, действительно, делается на уровне storage, а не базой данных. Вы хотите сказать, что оперативные данные просто сжимаются более легким и быстрым алгоритмом, или к тому же хранятся в row-oriented формате? Alexander Ryndin3) Флеш память хороша во многих случаях, но ее основной выигрыш - это обеспечение большого количество IOPS. При этом, по-умолчанию флеш работает на Exadata как еще один уровень кэша. А значит включается автоматически. Делать вообще ничего не надо. Кстати, в стандартной конфигурации Exadata уже входят PCIe-SSD (не SATA) и если да, то какие SLC/MLC, gen2/gen3, X4/8/16? ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 13:19 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
alexeyvgКстати, MSSQL тоже с некоторых пор columnstore Он теперь только columnstore, или может и row и column, и кто это решает, СУБД автоматически или разработчик прописывая в DDL каждой таблицы? ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 13:24 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Ivan DurakА вообще главный вопрос - это таки mpp или нет?? Паралельный джоин,группировку,сортировку локально на узлах умеет делать не передавая по сети данные?? Не умеет. В Exadata только отсев по предикатам WHERE за счет SS/SI, и лишние столбцы не грузит за счет column-oriented. Если нужны "Паралельный джоин,группировку,сортировку локально на узлах" - то это Oracle RAC, с соответствующей ценой :) ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 13:31 |
|
|
start [/forum/topic.php?fid=35&msg=38874291&tid=1552340]: |
0ms |
get settings: |
12ms |
get forum list: |
15ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
56ms |
get topic data: |
10ms |
get forum data: |
3ms |
get page messages: |
64ms |
get tp. blocked users: |
1ms |
others: | 244ms |
total: | 413ms |
0 / 0 |