|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Доброго времени суток вопрос может показаться тупым и дилетантским, прошу сильно не травить суть в чем? я работаю в крупном коммерческом банке, и как сами понимаете объем операций, и как следствие записей в БД очень большой. Ну на вскидочку миллионов 300 уникальных записей в год. Банк работает уже 20 лет, следовательно речь идет о 6 миллиардах записей в БД. Сейчас необходима общая база по всем операциям которые раскиданы по разным системам автоматизированных банковских дней. Пригласили одну фирму, которая предложила за очень хорошие деньги этот проект реализовать. Реализовать на базе решения Oracle Exadata, и как они расписывают - что даже огромные запросы - к примеру выписки за 10 лет будут крутиться за секунды. Благодаря сохранению часто запрашиваемых данных в флеш памяти, аппаратной компрессии и т.д. Я хотел спросить - а что действительно решения Оракл такие быстрые и оптимизированные? По производительности неужели MSSQL так сильно отстает? Я честно говоря всю жизнь работаю на 2003-2005 версиях, поэтому всех возможностей далеко не знаю. Вообще есть ли отставание или все эти прогнозы насчет нескольких секунд достигаются за счет аппаратной составляющей? Спасибо ... |
|||
:
Нравится:
Не нравится:
|
|||
08.02.2015, 21:52 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
сравнивать нужно сравниваемое. Ехадата - это аппаратное решение, поверх которого обычный Оракл, потому и цена недешевая. Вот посостязаться бы Ехадата с Терадата ... |
|||
:
Нравится:
Не нравится:
|
|||
08.02.2015, 22:04 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
AzulПо производительности неужели MSSQL так сильно отстает?Последний десяток лет - примерно одинаково. На одинаковом железе разницы не будет. Решения с аппаратной составляющей у MSSQL тоже есть, см. PDW Использование SSD в хранилищах - обычное дело, и для высокой производительности это даже дешевле обычных HDD. Банки не генерят много данных, так что самое оно. Сколько это там, 6 миллиардов записей, несколько террабайт? Память в сотни гигабайт тоже совсем не редкость. AzulБанк работает уже 20 лет, следовательно речь идет о 6 миллиардах записей в БД.У меня в день такие цифры, но храним только несколько месяцев, жмётся клиент на хранилища (впрочем, ему и не нужно больше). MS сейчас базы меньше 100тб не считает большими, группы, поддерживающие большие решения, от стольких только начинают рассматривать. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.02.2015, 22:16 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
AzulДоброго времени суток вопрос может показаться тупым и дилетантским, прошу сильно не травить суть в чем? я работаю в крупном коммерческом банке, и как сами понимаете объем операций, и как следствие записей в БД очень большой. Ну на вскидочку миллионов 300 уникальных записей в год. Банк работает уже 20 лет, следовательно речь идет о 6 миллиардах записей в БД. 6 миллиардов записей для современных СУБД -- немного. Для специальных, конечно, СУБД, в основном это columnstore, не MSSQL и не Oracle, про Exadata не знаю. AzulСейчас необходима общая база по всем операциям которые раскиданы по разным системам автоматизированных банковских дней. Так смотря что с этими данными надо делать. Вы-то это не раскрываете, а от людей просите совета. А это ОЧЕНЬ зависит от того, что надо с данными делать. AzulПригласили одну фирму, которая предложила за очень хорошие деньги этот проект реализовать. Реализовать на базе решения Oracle Exadata, и как они расписывают - что даже огромные запросы - к примеру выписки за 10 лет будут крутиться за секунды. Кому нужны выписки за 10 лет ? У меня была БД в 55 милиардов записей, и запросы некоторые по ней проходили за несколько сот миллисекунд. Это конечно кластер был из 8 нод, но для масштаба можно 55 на 8 поделить. Но это были запросы на выборки, или точечные (маленькие) аргрегации. Если нужна агрегация данных за 10 лет без доп. фильтров -- это большие объёмы, и это сделать быстро, естественно, невозможно. Тогда решения -- предагрегации (но теряется универсальность и растут объёмы), или ещё что-то, но магии там всё равно нет. Вы должны понимать, за счёт чего это будет достигаться, если не понимаете, или вам не могут объяснить -- значит, врут. Azul Благодаря сохранению часто запрашиваемых данных в флеш памяти, аппаратной компрессии и т.д. Кэши работают и в обычных СУБД, они не решают тут. нужны другие технологии ещё сверх этого. Компрессия -- да, это здорово. Аппаратная или программная -- в общем, неважно. AzulЯ хотел спросить - а что действительно решения Оракл такие быстрые и оптимизированные? Это не решение Оракл, это решение Exadata. Но, ещё раз, если вам чего-то говорят, они должны уметь объяснить, за счёт чего это происходит. Ну и очень сильно это зависит и от данных, и от запросов, которые надо делать. AzulПо производительности неужели MSSQL так сильно отстает? Он не отстаёт, MSSQL -- это универсальная СУБД, ориентированная на OLTP и , с некоторыми добавками, на OLAP. Но для больших хранилищ данных она просто не подходит. Там вот Vertica, Exadata, Teradata, ещё может быть что-то. Кстати, на таких объёмах можно попробовать тот же Virtuoso, он есть в бесплатном OpenSource -варианте (6ая версия), но без кластера (а тут он не нужен, это как раз типичный объём БД для безкластерного решения). Или ещё есть MonetDB (тоже бесплатный). Ну и ещё дофига всяких есть решений, бесплатных. Т.е. в принципе можно пробовать и другие "более дешёвые" решения. Но естественно со всеми надо будет РАБОТАТЬ, т.е. разбираться досконально в предметной области и постановке, и в технологиях конкретной СУБД. AzulВообще есть ли отставание или все эти прогнозы насчет нескольких секунд достигаются за счет аппаратной составляющей? даже если там и есть аппаратная компрессия, то скорее всего она не играет решающую роль тут. Больше будут играть columnstore, сжатие данных, векторная обработка, и, конечно, старое доброе кэширование и индексирование. Я думаю, что скорее инженеры Экзадаты просто выпендрились, имея возможность сделать что-то аппаратно, и оно там хоть и ускоряет само сжатие раз в 100, но всё же в СУБД основные затратные операции -- это чтение диска и сканирование данных, они в 1000-10000 раз затратнее, чем любое сжатие в памяти (на чём и стоит отрасль columnstore). Возможно, я неправ. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.02.2015, 22:18 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Сори, ещё из решающих технологий надо, естественно, указать параллельные и распределённые вычисления. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.02.2015, 22:21 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
MasterZivMSSQL -- это универсальная СУБД, ориентированная на OLTP и , с некоторыми добавками, на OLAP. Но для больших хранилищ данных она просто не подходит. Там вот Vertica, Exadata, Teradata, ещё может быть что-то. Кстати, на таких объёмах можно попробовать тот же VirtuosoДа какие тут большие объёмы? Действительно:MasterZiv6 миллиардов записей для современных СУБД -- немного MasterZivДля специальных, конечно, СУБД, в основном это columnstore, не MSSQL и не Oracle, про Exadata не знаю.Для обычных БД это немного, зачем специальные? Специальные - слишком жирно для таких объёмов. Кстати, MSSQL тоже с некоторых пор columnstore, не знаю, как там у Oracle с этим. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.02.2015, 22:41 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Azulдаже огромные запросы - к примеру выписки за 10 лет будут крутиться за секундыИ действительно задачи важны. Выписка за 10 лет по одному клиенту должны крутиться за миллисекунды, без всяких экзадат. А вот если нужна выписка по всему банку за 10 лет... :-) Модератор: Тема перенесена из форума "Microsoft SQL Server". ... |
|||
:
Нравится:
Не нравится:
|
|||
08.02.2015, 22:45 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Спасибо огромное за ответы, дело в том что на вскидочку все решение аппаратная составляющая + решение компании + лицензия будет стоить 1,5 - 2 млн. долларов это многовато... суть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительности а что делать с данными? ну во первых их нужно собрать из разрозненных источников (базы MSSQL, DBF файлы, текстовые файлы и т.д.) затем каждый раз подкачивать из схожих источников затем из них должны формироваться отчеты еще они должны быть доступны через пользовательский интерфейс (пользователи не программисты) для формирования отчетов и составления новых отчетных форм ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 06:07 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
в общем, я так понял MSSQL не совсем для этого... дайте пожалуйста направление - в какую сторону смотреть, что почитать по этому вопросу очень благодарен ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 06:17 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Azul в общем, я так понял MSSQL не совсем для этогоНе правильно понял Azul предложила за очень хорошие деньги этот проект реализоватьЭто был ключевой момент. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 07:02 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
AzulСпасибо огромное за ответы, дело в том что на вскидочку все решение аппаратная составляющая + решение компании + лицензия будет стоить 1,5 - 2 млн. долларов это многовато... Да не это нормально. Программно-аппаратное решение от MS не думаю что будет стоит сильно дешево, может пару тысяч скинут, а может и нет. Как договорятся. Azulсуть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительности Можно. Но не на пропиетарных технологиях, т.е. OpenSource. Сэкономите в лучшем случае половину, а так основная стоимость будет железо(где-то 2/3 - 3/4 от вашей суммы). Поэтому не советую. "Еще не уволили ни одного менеджера, за покупку решения от IBM" (c) не мой. ;-) Azulа что делать с данными? ну во первых их нужно собрать из разрозненных источников (базы MSSQL, DBF файлы, текстовые файлы и т.д.) затем каждый раз подкачивать из схожих источников Вот это как раз не проблема, а стандартная задача, для которой есть решение как у MS, так и у Oracle и OpenSource. Читать про ETL. Azulзатем из них должны формироваться отчеты еще они должны быть доступны через пользовательский интерфейс (пользователи не программисты) для формирования отчетов и составления новых отчетных форм Опять же это стандартная задача. Читать про OLAP. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 07:07 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Azulдело в том что на вскидочку все решение аппаратная составляющая + решение компании + лицензия будет стоить 1,5 - 2 млн. долларов это многовато... суть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительности"это" - всё-таки что это? если только посмотреть выписку, то наверное можно и раз в 10 дешевле, если нужна полноценная банковская система, то мне кажется маловато я так понял речь идет об узбекском банке, не знаю насколько там учет отличается и подойдут ли какие российские АБС, но на ЦФТ по-моему несколько узбекских банков работает http://bank.uz/publish/doc/text61391_innovacionnye_resheniya_dlya_bankov_respubliki_uzbekistan ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 08:35 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
[quot alexeyvg]Да какие тут большие объёмы? Действительно:MasterZiv6 миллиардов записей для современных СУБД -- немного Обычные СУБД, я бы сказал, работают с БД до миллиарда записей. Конечно, всё ещё сильно зависит от задач. MasterZivКстати, MSSQL тоже с некоторых пор columnstore, не знаю, как там у Oracle с этим. Ну, возможно, тогда и MSSQL можно попробовать. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 09:56 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
AzulСпасибо огромное за ответы, дело в том что на вскидочку все решение аппаратная составляющая + решение компании + лицензия будет стоить 1,5 - 2 млн. долларов это многовато... суть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительности Можно точно. Тем более за такие деньги. Azulа что делать с данными? ну во первых их нужно собрать из разрозненных источников (базы MSSQL, DBF файлы, текстовые файлы и т.д.) затем каждый раз подкачивать из схожих источников затем из них должны формироваться отчеты Это всё можно. А вот это : Azulеще они должны быть доступны через пользовательский интерфейс (пользователи не программисты) для формирования отчетов и составления новых отчетных форм -- утопия. Без программистов ничего не работает никогда. Вам будут конечно всякие sales man ы лапшу на уши вешать, но не слушайте. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 09:59 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Azulсуть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительности без шансов. не слушайте форумных хомячков, сходите на сайт оракла почитайте в чем суть exadata. вся соль в том, что у exadata сторидж не отдает все блоки базе, а интегрирован с субд и на стороне сториджа еще занимается фильрацией данных. т.е. там где мсскл поднимет 6 млрд записей с дисков, exadata отфильтрует большую часть, не нужную для отчета. аппаратную часть собрать на коленках не проблема, вся соль exadata именно в софте, в интеллектуальном сторидже. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 10:06 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
AzulСпасибо огромное за ответы, дело в том что на вскидочку все решение аппаратная составляющая + решение компании + лицензия будет стоить 1,5 - 2 млн. долларов это многовато... Поинтересуйтесь у Oracle-поставщика сколько будет стоить ежегодный суппорт на выбранную экзадату (quarter rack ? судя по цене), ну чтоб потом не было сюрпризов. суть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительности Раз у вас еcть опыт с MSSQL, то сделайте свой внутренний пилот на 2014-ом (там появились clustered column-store indexes), загоните туда свои 6 ярдов до покрутите (на нормальном железе), чтобы иметь хотя бы какой-то baseline от которого уже и отталкиваться. А то может вам вообще стандартный MSSQL SSAS подойдет. Со своей колокольни : если не ограничены только MS/Oracle, то можно попробовать IBM DB2 BLU (колоночный in-memory-оптимизированный движок специально для DWH/BI/OLAP c возможностью потеррабайтного лицензирования за 60K$/TB (макс. 4 сокета) или 100K$/TB (безлимит) ) ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 10:51 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Сколько "специалистов" по Oracle набежало из форума MSSQL. Просто ппц какой-то. В двух словах про Exadata: 1) Во-первых, это софт+вся аппаратка (сервера СУБД, storage, сеть). Поскольку storage в Exadata - это не тупая полка с дисками, а, по сути, продолжение СУБД, то storage сам выполняет большУю часть операций, освобождая сервера баз данных. Другое следствие того, что storage умный - это пониженная нагрузка на канал между базой данных и storage. Раньше при полном сканировании таблицы мы должны были в память сервера грузить все данных, а теперь storage сам применяет фильтрацию и отсев столбцов 2) Во-вторых, Exadata - это гибридное поколоночное сжатие. Т.е. поколоночное, но не совсем. Поколоночное хранение хорошо, если есть только запросы на чтение - оно быстрое и хорошо жмет данные. Но чуть только кто-то что-то начинает менять данные - тут же возникают огромные проблемы. В Exadata, при построении хранилища, обычно делается таблица из двух частей: исторической и оперативной. История жмется в 5-10 раз, а оперативная часть жмется в 2-3 раза. Убиваем двух зайцев: все летает, но и данные подливаются легко - вплоть до real-time. Да, и расжатие, действительно, делается на уровне storage, а не базой данных. 3) Флеш память хороша во многих случаях, но ее основной выигрыш - это обеспечение большого количество IOPS. При этом, по-умолчанию флеш работает на Exadata как еще один уровень кэша. А значит включается автоматически. Делать вообще ничего не надо. Из недавнего, что появилось в Exadata: 1) Конфигурация стала гибкой. Если нужно мало пространства на диске, но много CPU, то можно, скажем, взять 3 ячейки storage и 10 database server. Если узкое место - storage, то ставим 10 ячеек storage и 2 сервера СУБД 2) Появилась поддержка виртуализации, что позволяет гибко оптимизировать лицензирование 3) Сжатие во flash cache. По поводу верить в это или не верить... Попросите показать. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 11:57 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
читаю, очень интересно, кстати кажется не смог объяснить - речь идет чисто об информационной системе - не автоматизированный банковский день только подкачка из основных баз - типа архив, но целостный, быстродоступный и оперативный ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 13:01 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Alexander Ryndin, зачем вы в ковычках слово специалисты пишете =( я например даже близко этого не знал люди помогают, спасибо за это ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 13:02 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Azulчитаю, очень интересно, кстати кажется не смог объяснить - речь идет чисто об информационной системе - не автоматизированный банковский день только подкачка из основных баз - типа архив, но целостный, быстродоступный и оперативныйЕсли так, то у вас выбор из следующих систем 1) Обычная база, обязательно неблокировочник (Oracle, MSSQL, DB2, etc) 2) Exadata - с одной стороны это MPP, с другой стороны прекрасно справляется с архивацией (поколочное сжатие до 10 раз), целостное (нормальные транзакции, нет грязных чтения, читатели не мешают писателем), быстрое (см. мой пост выше), оперативное (за счет партиционирования и флеша его можно обновлять в real-time) Классические MPP-платформы вам не подойдут почти по всем критериям. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 13:08 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
AzulAlexander Ryndin, зачем вы в ковычках слово специалисты пишете =( я например даже близко этого не знал люди помогают, спасибо за этоНе люблю, когда люди пишут о чем-то, не имея достаточной экспертизы. Вот я не люблю рассуждать о MSSQL, т.к. основная моя область работы - это Oracle. А с MSSQL у меня нет достаточной экспертизы уже лет 7-8. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 13:11 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Alexander Ryndin Раньше при полном сканировании таблицы мы должны были в память сервера грузить все данных, а теперь storage сам применяет фильтрацию и отсев столбцов Какую фильтрацию при фулскане?? И какой аппаратный отсев столбцов если и так колумнсторе? А вообще главный вопрос - это таки mpp или нет?? Паралельный джоин,группировку,сортировку локально на узлах умеет делать не передавая по сети данные?? ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 13:12 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Alexander RyndinСколько "специалистов" по Oracle набежало из форума MSSQL. Просто ппц какой-то. В двух словах про Exadata: 1) Во-первых, это софт+вся аппаратка (сервера СУБД, storage, сеть). Поскольку storage в Exadata - это не тупая полка с дисками, а, по сути, продолжение СУБД, то storage сам выполняет большУю часть операций, освобождая сервера баз данных. Другое следствие того, что storage умный - это пониженная нагрузка на канал между базой данных и storage. Раньше при полном сканировании таблицы мы должны были в память сервера грузить все данных, а теперь storage сам применяет фильтрацию и отсев столбцов Важно добавить, что Exadata - это тоже сервера + диски, причем Exadata берет на себя часть задач с серверов Oracle (фильтрацию по предикатам - Smart Scan/Storage Index, и сжатие - Hybrid Columnar Compression), а лицензирование серверов Exadata дешевле, чем лицензирование Oracle Enterprise Edition или тем более EE+RAC. Т.е. с Exadata удельная единица производительности получается дешевле, чем без него. Alexander Ryndin2) Во-вторых, Exadata - это гибридное поколоночное сжатие. Т.е. поколоночное, но не совсем . Поколоночное хранение хорошо, если есть только запросы на чтение - оно быстрое и хорошо жмет данные. Но чуть только кто-то что-то начинает менять данные - тут же возникают огромные проблемы. В Exadata, при построении хранилища, обычно делается таблица из двух частей: исторической и оперативной. История жмется в 5-10 раз, а оперативная часть жмется в 2-3 раза . Убиваем двух зайцев: все летает, но и данные подливаются легко - вплоть до real-time. Да, и расжатие, действительно, делается на уровне storage, а не базой данных. Вы хотите сказать, что оперативные данные просто сжимаются более легким и быстрым алгоритмом, или к тому же хранятся в row-oriented формате? Alexander Ryndin3) Флеш память хороша во многих случаях, но ее основной выигрыш - это обеспечение большого количество IOPS. При этом, по-умолчанию флеш работает на Exadata как еще один уровень кэша. А значит включается автоматически. Делать вообще ничего не надо. Кстати, в стандартной конфигурации Exadata уже входят PCIe-SSD (не SATA) и если да, то какие SLC/MLC, gen2/gen3, X4/8/16? ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 13:19 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
alexeyvgКстати, MSSQL тоже с некоторых пор columnstore Он теперь только columnstore, или может и row и column, и кто это решает, СУБД автоматически или разработчик прописывая в DDL каждой таблицы? ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 13:24 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Ivan DurakА вообще главный вопрос - это таки mpp или нет?? Паралельный джоин,группировку,сортировку локально на узлах умеет делать не передавая по сети данные?? Не умеет. В Exadata только отсев по предикатам WHERE за счет SS/SI, и лишние столбцы не грузит за счет column-oriented. Если нужны "Паралельный джоин,группировку,сортировку локально на узлах" - то это Oracle RAC, с соответствующей ценой :) ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 13:31 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Ivan DurakAlexander Ryndin Раньше при полном сканировании таблицы мы должны были в память сервера грузить все данных, а теперь storage сам применяет фильтрацию и отсев столбцов Какую фильтрацию при фулскане?? И какой аппаратный отсев столбцов если и так колумнсторе?Фильтрацию обычную. Вот такую, например, SELECT emp_id WEHER sal>100; Exadata - это не "колумнсторе" Ivan DurakА вообще главный вопрос - это таки mpp или нет?? Паралельный джоин,группировку,сортировку локально на узлах умеет делать не передавая по сети данные??Exadata это частично MPP. Все операции на ячейках это MPP. Join на ячейках делается только частично. Сортировка и группировка делается на серверах базы данных, которые также ее распараллеливают. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 13:38 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Вася УткинAlexander Ryndin2) Во-вторых, Exadata - это гибридное поколоночное сжатие. Т.е. поколоночное, но не совсем . Поколоночное хранение хорошо, если есть только запросы на чтение - оно быстрое и хорошо жмет данные. Но чуть только кто-то что-то начинает менять данные - тут же возникают огромные проблемы. В Exadata, при построении хранилища, обычно делается таблица из двух частей: исторической и оперативной. История жмется в 5-10 раз, а оперативная часть жмется в 2-3 раза . Убиваем двух зайцев: все летает, но и данные подливаются легко - вплоть до real-time. Да, и расжатие, действительно, делается на уровне storage, а не базой данных. Вы хотите сказать, что оперативные данные просто сжимаются более легким и быстрым алгоритмом, или к тому же хранятся в row-oriented формате?Все верно. Данные сжимаются более легким и быстрым алгоритмом и хранятся в row-oriented формате Вася УткинAlexander Ryndin3) Флеш память хороша во многих случаях, но ее основной выигрыш - это обеспечение большого количество IOPS. При этом, по-умолчанию флеш работает на Exadata как еще один уровень кэша. А значит включается автоматически. Делать вообще ничего не надо. Кстати, в стандартной конфигурации Exadata уже входят PCIe-SSD (не SATA) и если да, то какие SLC/MLC, gen2/gen3, X4/8/16?[/quot]Да, верно. В стандартной конфигурации стоят Flash Accelerator F160 PCIe Card. В минимальной конфигурации Exadata (1/8) это 9,6 Tb сырого пространства. А вот что это не знаю. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 13:46 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Alexander RyndinДа, верно. В стандартной конфигурации стоят Flash Accelerator F160 PCIe Card. В минимальной конфигурации Exadata (1/8) это 9,6 Tb сырого пространства. А вот что это не знаю. А по сколько F80 PCIe Card на одном сервере Exadata? Sun Flash Accelerator F80 PCIe Card Specifications : 800 GB e MLC Random Read IOPS (8K) 155,193 PCI Express 2.0 (x8) - 2 GB/sec 4 x 6Gb/s SAS/SATA2 controllers (1 per domain) - прям в нем же контроллер на 4 SATA диска Типичный 2.5'' HDD 10K-rpm имеет 100 MB/sec и 150 IOPS. Т.е. Exadata-вский F80 PCIe Card по IOPS-ам как 1000 HDD (для random-read/write), а по Bandwidth как 20 HDD (для sequential-read/write). ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 14:04 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Alexander Ryndin. В стандартной конфигурации стоят Flash Accelerator F160 PCIe Card. В минимальной конфигурации Exadata (1/8) это 9,6 Tb сырого пространства. А вот что это не знаю. Intel DC P3600 ;-) ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 14:13 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
exaoraAlexander Ryndin. В стандартной конфигурации стоят Flash Accelerator F160 PCIe Card. В минимальной конфигурации Exadata (1/8) это 9,6 Tb сырого пространства. А вот что это не знаю. Intel DC P3600 ;-)Гыгы. А я ищу по тексту фразу, а там картинка. Прикольно, спасибо. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 14:25 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Вася УткинТипичный 2.5'' HDD 10K-rpm имеет 100 MB/sec и 150 IOPS. Т.е. Exadata-вский F80 PCIe Card по IOPS-ам как 1000 HDD (для random-read/write), а по Bandwidth как 20 HDD (для sequential-read/write). Сейчас в 1/4 Exadata стоит 12 flash-карт и 36 дисков. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 14:28 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
exaoraAlexander Ryndin. В стандартной конфигурации стоят Flash Accelerator F160 PCIe Card. В минимальной конфигурации Exadata (1/8) это 9,6 Tb сырого пространства. А вот что это не знаю. Intel DC P3600 ;-) http://www.intel.com/content/dam/www/public/us/en/documents/product-specifications/ssd-dc-p3600-spec.pdf Flash Accelerator F160 PCIe Card (Intel DC P3600) по IOPS-ам на read раза в 3 поболее, чем Flash Accelerator F80 PCIe Card (Sun). А вот последовательные операции поменяли шило на мыло, с 2 до 2.6 GB/sec. А интерфейс так вообще той же скорости оставили PCIe gen2 8X на PCIe gen3 4X, странные они товарищи :) http://www.oracle.com/technetwork/database/exadata/exadata-x5-2-ds-2406241.pdf Full Rack - 14 x Exadata Storage Servers X5-2 - 56 PCI flash cards with 89.6 TB (raw) Exadata Smart Flash Cache, 168 x 4 TB 7,200 RPM High Capacity disks. Т.е. на 1 сервер Exadata приходится: 4 диска PCIe(gen3 4x) SSD 1.6 TB 2GB/sec 450K IOPS 12 дисков 4TB HDD 7200 rpm И в FullRack 14 таких двухсокетных серверов. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 14:38 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Вася УткинFlash Accelerator F160 PCIe Card (Intel DC P3600) по IOPS-ам на read раза в 3 поболее, чем Flash Accelerator F80 PCIe Card (Sun). А вот последовательные операции поменяли шило на мыло, с 2 до 2.6 GB/sec. А интерфейс так вообще той же скорости оставили PCIe gen2 8X на PCIe gen3 4X, странные они товарищи :)Из собственного опыта этот флэш важен именно как кэш мелких OLTP-операций. Например, когда GoldenGate со страшной силой льет данные в real-time в одну Exadata из десятка разных банковских систем. Ну и еще для индексного доступа. Все-таки хранилище живет не одними full-scanами. Есть и выборки, возвращающие, скажем, по 0,5% данных. Есть и join, которые иногда дешевле делать через index. Есть и адовы PL/SQL, которые курсорами обрабатывают данные. Есть и гибридные системы, когда в одной системе живет и OLTP, и online-отчетность. Так что, лично я, не вижу необходимости в увеличении пропускной способности. А вот кол-во IOPS это да. http://www.oracle.com/technetwork/database/exadata/exadata-x5-2-ds-2406241.pdf Full Rack - 14 x Exadata Storage Servers X5-2 - 56 PCI flash cards with 89.6 TB (raw) Exadata Smart Flash Cache, 168 x 4 TB 7,200 RPM High Capacity disks. Вася УткинТ.е. на 1 сервер Exadata приходится: 4 диска PCIe(gen3 4x) SSD 1.6 TB 2GB/sec 450K IOPS 12 дисков 4TB HDD 7200 rpm И в FullRack 14 таких двухсокетных серверов. Ну не надо забывать, что еще появился вариант Extreme Performance. Там вообще никакого SATA нет. В ячейке есть только 24 x 1.6 TB NVMe PCI Flash Drives. Я бы такую конфигурацию для OLTP брал. Ну и повторюсь, сейчас стало возможным делать любую набивку - сначала ставите 2 db server+3 storage, а потом добавляете, что душе угодно. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 15:00 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Alexander RyndinВася УткинFlash Accelerator F160 PCIe Card (Intel DC P3600) по IOPS-ам на read раза в 3 поболее, чем Flash Accelerator F80 PCIe Card (Sun). А вот последовательные операции поменяли шило на мыло, с 2 до 2.6 GB/sec. А интерфейс так вообще той же скорости оставили PCIe gen2 8X на PCIe gen3 4X, странные они товарищи :)Из собственного опыта этот флэш важен именно как кэш мелких OLTP-операций. Например, когда GoldenGate со страшной силой льет данные в real-time в одну Exadata из десятка разных банковских систем. Ну и еще для индексного доступа. Все-таки хранилище живет не одними full-scanами. Есть и выборки, возвращающие, скажем, по 0,5% данных. Есть и join, которые иногда дешевле делать через index. Есть и адовы PL/SQL, которые курсорами обрабатывают данные. Есть и гибридные системы, когда в одной системе живет и OLTP, и online-отчетность. Так что, лично я, не вижу необходимости в увеличении пропускной способности. А вот кол-во IOPS это да. А заливка через Golden Gate в real-time всегда приводит к random-write (записи блоками меньше 1 MB) и batch mode не спасает? И потом, это в F160 по сравнению с F80 в 3 раза random-read увеличился с 150K до 450K, а random-write наоборот упал, со 130K до 50K Хотя здесь сложно сравнивать, в первом случае блоки по 4 KB, а во втором по 8 KB. Насчет Index Seek, Join(NLJ), Cursors - и других прелестей OLTP... С одной стороны да, с другой посмотрите на тренды. Когда только внедрили Falsh Cache - между сервером Exadata и 3-мя дисками 2.5'' HDD 7.2K-rpm (в сумме 300 IOPS, 300 MB/sec) поставили Flash Accelerator F80 PCIe Card (150K IOPS, 2000 MB/sec), то подняли: в 500 раз IOPS-ы в 7 раз Bandwidth По сравнению с 500 раз, ещё в 3 раза поднять IOPS-ы это уже не так значимо, как если бы уже в 7 раз ускоренный bandwidth ускорили бы ещё в 6 раз, увеличив количество flash-чипов на SSD и подняв скорость интерфейса PCIe c gen3 4x до gen3 16x - до 12 GB/sec. Но видимо действительно пытаются заточить Exadata уже не столько под DWH, сколько под OLTP. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 15:35 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Вася УткинА заливка через Golden Gate в real-time всегда приводит к random-write (записи блоками меньше 1 MB) и batch mode не спасает?Случаю бывают разные, но в общем случае не спасает. Batch Mode - это лишь более крупные транзакции (ниже нагрузка на LGWR) и операции выполняются не по одной, а массивами (меньше кол-во round-trip на сервер). Но если все 1000 сгруппированных операций меняют 1000 разных блоков данных, то нам все равно придется сделать 1000 IOPS, а если быть точным, то как минимум 2000 IOPS, ибо доступ по индексу. Ну это, конечно, важно, если активный набор данных не вмещается в оперативку. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 16:29 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Alexander RyndinВася УткинА заливка через Golden Gate в real-time всегда приводит к random-write (записи блоками меньше 1 MB) и batch mode не спасает?Случаю бывают разные, но в общем случае не спасает. Batch Mode - это лишь более крупные транзакции (ниже нагрузка на LGWR) и операции выполняются не по одной, а массивами (меньше кол-во round-trip на сервер). Но если все 1000 сгруппированных операций меняют 1000 разных блоков данных, то нам все равно придется сделать 1000 IOPS, а если быть точным, то как минимум 2000 IOPS, ибо доступ по индексу. Ну это, конечно, важно, если активный набор данных не вмещается в оперативку. решается отдельным сервером для репликации. Все равно 90% хранилища читают раз в сутки, когда реал-тайм не нужен. Отдельный сервак чисто с репликой справляется, а основное хранилище читает из него раз в сутки, и не имеет олтп нагрузки. И все счастливы. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 16:58 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
можно вопрос? наши купили для одной из АБС вот такую вот серверную стойку ну я так думаю она будет на 50% мощности задействована если поднять тут один виртуальный сервер может ли что то путное получится по описанной выше задаче? спасибо! Серверный комплекс системы управления базами данных на базе серверов Hewlett Packard HP BL460c (P/N 735151-B21), в составе: (P/N 735151-B21) HP BL460c Gen8 E5-v2 10Gb FLB CTO CPU 2хE5-2630v2, DDR 64Gb, HDD 2x300GB 6G SAS 15K, Flex Fabric 10Gb 2P 534FLB, Smart Array P220i Controller / сервер – 8 шт. (P/N 589257-B21) MS WS08 R2 Ent Ed 10CAL ROK E F S SW / программное обеспечение – 8 шт. (P/N 681844-B21) Blade HP BLc7000 CTO 3 IN LCD Plat Enclosure / серверное шасси – 1 шт. (P/N BW904A) HP 642 1075mm Shock Intelligent Rack / серверная стойка – 1 шт. (P/N 735151-B21) HP BL460c Gen8 E5-v2 10Gb FLB CTO CPU 2хE5-2667v2, DDR 64Gb, HDD 2x300GB 6G SAS 15K, Flex Fabric 10Gb2P 534FLB, Smart Array P220i Controller / сервер - 2 шт. (P/N 589257-B21) MS WS08 R2 Ent Ed 10CAL ROK E F S SW / программное обеспечение – 2 шт. (P/N 735151-B21) HP BL460c Gen8 E5-v2 10/20Gb CTO Blade CPU 2хE5-2609v2, DDR 48Gb, HDD 2x300GB 6G SAS 15K, Flex Fabric 10Gb 2P 534FLB, HP Smart Array P220i Controller / сервер - 1 шт. (P/N 7NQ-00584) SQLSvrStdCore 2014 RUS OLP 2Lic C Gov CoreLic / /программное обеспечение – 16 шт. (P/N AP880A) HP D2200sb Storage Blade 12 x 600GB 6G SAS 10K / система резервного копирования – 1 шт. (P/N QR482A) HP 3PAR StoreServ 7200 2-N Storage Base, 2 x 3PAR 7000 4-pt 8Gb/s FC Adapter, HDD 8 x M6710 900GB 6G SAS 10K,2 x 8/8 Base (0) e-port SAN Switch, M6720 3.5in 4U SAS Drive Enclosure, 12 x M6720 2TB 6G SAS 7.2K 3.5in NL HDD / дисковая система хранения данных - 1 шт. (P/N AJ836A) HP 5m Multi-mode OM3 LC/LC FC Cable / интерфейсный кабель – 16 шт. (P/N AJ716B) HP 8Gb Short Wave B-Series SFP+1 Pack / трансивер – 20 шт. (P/N C0H19A) HP 1/8 G2 LTO-6 Ult 6250 FC Autoloader / ленточная система резервного копирования – 1 шт. (P/N QK734A) HP Premier Flex LC/LC OM4 2f 5m Cbl / интерфейсный кабель – 1 шт. (P/N C7976A) HP LTO-6 Ultrium 6.25TB MP RW Data Tape / картридж данных для ленточного накопителя - 8 х 10 шт. (P/N J9726A) HP 2920-24G Switch / сетевой коммутатор – 2 шт. (P/N J9731A) HP 2920 2-port 10GbE SFP+ Module / трансивер – 2 шт. (P/N J9735A) HP 2920 1.0m Stacking Cable / интерфейсный кабель - 2шт. (P/N J9283B) HP X242 10G SFP+ SFP+ 3m DAC Cable / трансивер – 4 шт. (P/N J9806A) HP 640 EPS/RPS 1m Cable / интерфейсный кабель – 2 шт. (P/N AF463A) HP R7KVA UPS 4U IEC-32A HV Intl Kit / источник бесперебойного питания -2 шт. Moxa NPort 6610-8 8-port RS-232 secure device server, 100 to 240 VAC power input / 8-портовый асинхронный сервер RS-232 – 2 шт. (P/N AW-USB-14) Digi Anywhere USB/14 / сетевой концентратор USB-портов – 2 шт. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 18:07 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Azul, вы думаете, кто-то будет вчитываться в вываленный копипастом список запчастей? Да еще с дублями по софту? ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 23:08 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Azulможно вопрос? наши купили для одной из АБС вот такую вот серверную стойку ну я так думаю она будет на 50% мощности задействована если поднять тут один виртуальный сервер может ли что то путное получится по описанной выше задаче? спасибо! А риски падения системы и простоя вы будете оплачивать? Когда система не выдержит пиковой нагрузки, то виноваты будете вы. А так пока "виноват" консалт, т.к. не правильно посчитал пиковую нагрузку. ;-) ... |
|||
:
Нравится:
Не нравится:
|
|||
10.02.2015, 06:48 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Azulможно вопрос? наши купили для одной из АБС вот такую вот серверную стойку ну я так думаю она будет на 50% мощности задействована если поднять тут один виртуальный сервер может ли что то путное получится по описанной выше задаче? спасибо! без шансов. во первых никто вам резерв не отдаст, он не ради развлечения покупается. во вторых сервер явно краденый из музея, там в стойке 10К и 7.5К диски и 64гб рам. у четертинки exadata только у сториджа в разы рама больше :) ... |
|||
:
Нравится:
Не нравится:
|
|||
10.02.2015, 08:54 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Yo.!сервер явно краденый из музея, там в стойке 10К и 7.5К диски Только не 7.5K, а 7.2K rpm, и в Exadata такие же, а какие должны быть, чтобы не из музея? ... |
|||
:
Нравится:
Не нравится:
|
|||
10.02.2015, 14:17 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Azul, добрый день. Готовы проконсультировать вас по поводу решений для хранилищ на основе IBM Netezza (PureData for Analytics). Это классчиеское MPP решение для хранилищ данных, которое подходит для описанной вами задачи. +79857665487 vgrabeln@ru.ibm.com Всеволод Грабельников. Технический консультант по Netezza/BigData решениям компании IBM ... |
|||
:
Нравится:
Не нравится:
|
|||
10.02.2015, 14:43 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Azulсуть вопроса - можно ли реализовать это гораздо дешевле и приближенно по производительностиПро ЭТО нужно рассказать подробнее. Может, там 100500 запросов в секунду? Azulну во первых их нужно собрать из разрозненных источников (базы MSSQL, DBF файлы, текстовые файлы и т.д.) затем каждый раз подкачивать из схожих источников затем из них должны формироваться отчеты еще они должны быть доступны через пользовательский интерфейс (пользователи не программисты) для формирования отчетов и составления новых отчетных формВ MSSQL для этого есть все инструменты. MSSQL, SSIS, SSRS, + у MS есть решения для разработки клиентов, при необходимости. Тут вопрос не в возможностях (повторю, продукты основных игроков сейчас достаточно близки), и даже не d ценt (MSSQL получится подешевле - но не на порядки), а на имеющуюся инфораструктуру, специалистов, лицензионные программы, политику компании по деверсификации рисков - вот это ключевые критерии. А так, по технологиям - если остальное устраивает, то технологически решения на основе MSSQL вполне подойдут, там будет весь комплекс технологий "в одном флаконе". ... |
|||
:
Нравится:
Не нравится:
|
|||
10.02.2015, 23:54 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
alexeyvgТут вопрос не в возможностях (повторю, продукты основных игроков сейчас достаточно близки)Человек, всю жизнь ездящий на жигули, рассказывает всем, что и Ягуар, и Феррари, и Формула, и его "копейка" - это все очень близкие продукты основных игроков. И его "копейка" еще и подешевле будет. P.S. сравнение MSSQL и Exadata - это вообще из разряда сравнения самоката и самолета. Оба они "само", но в остальном сходства не наблюдается. Ибо MSSQL - это софт, а Exadata это программно-аппаратный комплекс. Так что не надо тут рассказывать про "продукты основных игроков сейчас достаточно близки"... У Microsoft просто нет такого решения как класса. P.S.S. другое дело, что человеку Exadata может быть просто не нужна... но это мы, увы, сказать не можем ... |
|||
:
Нравится:
Не нравится:
|
|||
11.02.2015, 00:24 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Azulможно вопрос? наши купили для одной из АБС вот такую вот серверную стойку ну я так думаю она будет на 50% мощности задействована если поднять тут один виртуальный сервер может ли что то путное получится по описанной выше задаче? спасибо!Вы ршили сделать систему, потратив в 100 раз меньше денег, чем предложила та компания? Это бесперспективно. Вы про**ёте решение, испортите себе карьеру, несостоявшийся конкурент Съэкономить можно много, но всё таки не в 100 раз :-) По железкам - не знаю, какая нагрузка планируется, но видно, что ваше "лишнее" оборудование слабое. Диски слабые, а это главное для СУБД Вы рассказываете про супер-решения с огромной памятью, SSD, кешами - и тут же хотите откусить часть производительности у рейда с 8 дисками - смех. Этого рейда мало для сервера СУБД с одним процессором, а к нему подключили 8 серверов :-) А, или там 8х8 дисков? Тогда да, для одного сервера из восьми хватит, но не больше. ... |
|||
:
Нравится:
Не нравится:
|
|||
11.02.2015, 01:05 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Alexander RyndinP.S. сравнение MSSQL и Exadata - это вообще из разряда сравнения самоката и самолета. Оба они "само", но в остальном сходства не наблюдается. Ибо MSSQL - это софт, а Exadata это программно-аппаратный комплексНадо же, а PDW - это не программно-аппаратный комплекс? Рассказывайте про решения, которые вы знаете. Я уж не говорю, что поставка в комплекте с железом не делает решение нарантированно оптимальным или даже просто подходящим. Alexander RyndinЧеловек, всю жизнь ездящий на жигули, рассказывает всем, что и Ягуар, и Феррари, и Формула, и его "копейка" - это все очень близкие продукты основных игроковНу, вот такое мнение рынка. А я, как и вы, не могу выступать экспертом для всех существующих продуктов. Может, ваш Oracle и Exadata - жигули, но тоже имеют свою рыночную нишу. ... |
|||
:
Нравится:
Не нравится:
|
|||
11.02.2015, 01:12 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
alexeyvgAlexander RyndinP.S. сравнение MSSQL и Exadata - это вообще из разряда сравнения самоката и самолета. Оба они "само", но в остальном сходства не наблюдается. Ибо MSSQL - это софт, а Exadata это программно-аппаратный комплексНадо же, а PDW - это не программно-аппаратный комплекс? Рассказывайте про решения, которые вы знаете. Я уж не говорю, что поставка в комплекте с железом не делает решение нарантированно оптимальным или даже просто подходящим.Ок. Это не совсем то же самое, что и Exadata, но похоже. Сравнивать тогда нужно с Exadata. Насторожило: - Microsoft has added features to unify the query and administrative experiences of SQL Server 2012 PDW with those of SQL Server 2012 Enterprise Edition (т.е. это все-таки разные системы, насколько я понял это бывшая DataAllegro) - Почему-то до сих пор нет MS PDW 2014? - Зачем-то внутрь запихнули Hadoop, который может быть нафиг не нужен alexeyvgAlexander RyndinЧеловек, всю жизнь ездящий на жигули, рассказывает всем, что и Ягуар, и Феррари, и Формула, и его "копейка" - это все очень близкие продукты основных игроковНу, вот такое мнение рынка. А я, как и вы, не могу выступать экспертом для всех существующих продуктов. Может, ваш Oracle и Exadata - жигули, но тоже имеют свою рыночную нишу.[/quot]Не ерничайте. Вы меня прекрасно поняли. СУБД MSSQL нужно сравнивать с Oracle, а Microsoft SQL PDW с Oracle Exadata. Я пока на российском рынке не встречал PDW. Хотя пользователи Microsoft-продуктов это отдельная вселенная. Интересно было посмотреть, как PDW себя ведет при попытке лить и читать данные одновременно. Для многих современных MPP это серьезная проблема. И как там с переносом обычной базы данных MSSQL? Можно ли перенести один в один? Насколько хорошо себя ведет на adhoc-запросах? Но на эти вопросы я вряд ли получу ответ. Или нет? ... |
|||
:
Нравится:
Не нравится:
|
|||
11.02.2015, 03:35 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Alexander RyndinОк. Это не совсем то же самое, что и Exadata, но похоже. Сравнивать тогда нужно с Exadata. Насторожило: - Microsoft has added features to unify the query and administrative experiences of SQL Server 2012 PDW with those of SQL Server 2012 Enterprise Edition (т.е. это все-таки разные системы, насколько я понял это бывшая DataAllegro) - Почему-то до сих пор нет MS PDW 2014? - Зачем-то внутрь запихнули Hadoop, который может быть нафиг не нужен- Да, система другая. Это не MSSQL, который поставляется в комплекте с железом. PDW в общем несколько по другому программируется. - Не выпустили ещё. - Hadoop там - это просто дополнительная возможность. PDW расчитан на большие хранилища, а там есть такой модный Hadoop - ну вот его туда и впихнули. Alexander RyndinСУБД MSSQL нужно сравнивать с Oracle, а Microsoft SQL PDW с Oracle Exadata. Я пока на российском рынке не встречал PDW. Хотя пользователи Microsoft-продуктов это отдельная вселенная. Интересно было посмотреть, как PDW себя ведет при попытке лить и читать данные одновременно. Для многих современных MPP это серьезная проблема. И как там с переносом обычной базы данных MSSQL? Можно ли перенести один в один? Насколько хорошо себя ведет на adhoc-запросах? Но на эти вопросы я вряд ли получу ответ. Или нет?А Oracle Exadata на российском рынке встречали (просто интересно)? ИМХО мало таких систем на рынке. Одно внедрение PDW точно идёт (у моих знакомых), есть ли ещё - не в курсе... Насчёт "лить и читать одновременно" не знаю, я сам плотно с ним не работал. "Просто перенести" нельзя, PDW требует отдельных подходов (код нужно менять, и модель днных); как я выше уже написал, PDW - это не поставка MSSQL в комплекте с железом. MS не видит причин делать такие поставки - есть тесное сотрудничество с основными вендорами, у них есть мощнейшие суперсерверы, системы хранения, в т.ч. многоуровневые, у MS есть некие алгоритмы выбра сбалансированного железа для одстижения высокой производительности (не смог быстро найти, не помню точное название). А PDW - это именно другой подход к построению хранилищь. Честно говоря, я думал, что Exadata - тоже другой подход, а не комплект желехо+СУБД. ... |
|||
:
Нравится:
Не нравится:
|
|||
11.02.2015, 09:21 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
alexeyvgА Oracle Exadata на российском рынке встречали (просто интересно)? знаю что банк "Санкт-Петербург" использует ... |
|||
:
Нравится:
Не нравится:
|
|||
11.02.2015, 11:07 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Alexander RyndinИнтересно было посмотреть, как PDW себя ведет при попытке лить и читать данные одновременно. Для многих современных MPP это серьезная проблема. В чем и кого проблема? ... |
|||
:
Нравится:
Не нравится:
|
|||
11.02.2015, 11:19 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
alexeyvgу MS есть некие алгоритмы выбра сбалансированного железа для одстижения высокой производительности ( не смог быстро найти , не помню точное название). Не только вы, но и большинство пользователей MS SQL, учитывая, что большинство знает меньше, чем вы :) Exadata хороша тем, что клиент не сможет облажаться набрав кучу несбалансированного "добра". А как часто вы видели кэш на чтение на SSD и разную степень сжатия частей одной таблицы - применимо для MS SQL? ... |
|||
:
Нравится:
Не нравится:
|
|||
11.02.2015, 13:40 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
alexeyvg, прежде всего спасибо за ответы. alexeyvg1) Да, система другая. Это не MSSQL, который поставляется в комплекте с железом. PDW в общем несколько по другому программируется. 2) (PDW 2014) Не выпустили ещё. 3) Hadoop там - это просто дополнительная возможность. PDW расчитан на большие хранилища, а там есть такой модный Hadoop - ну вот его туда и впихнули. Я подозреваю, что 2) следует из 1). У Oracle с Exadata другая история. Бинарники базы данных ничем не отличается от обычного Oracle. Отличая, по сути, в одном параметре, который разрешает или запрещает уникальные функции Exadata. Эти уникальные функции реализованы в Exadata Software. alexeyvgMS не видит причин делать такие поставки - есть тесное сотрудничество с основными вендорами, у них есть мощнейшие суперсерверы, системы хранения, в т.ч. многоуровневые, у MS есть некие алгоритмы выбра сбалансированного железа для одстижения высокой производительности (не смог быстро найти, не помню точное название).У Orale есть такое. Называется Oracle Optimized Warehouse . Но это совсем не то. alexeyvg4) "Просто перенести" нельзя, PDW требует отдельных подходов (код нужно менять, и модель днных); как я выше уже написал, PDW - это не поставка MSSQL в комплекте с железом. А PDW - это именно другой подход к построению хранилищь. Честно говоря, я думал, что Exadata - тоже другой подход, а не комплект желехо+СУБД.Exadata - состоит из обычной СУБД Oracle, железа и главное, Exadata Software (основной profit для хранилища создает именно Exadata Software) alexeyvgА Oracle Exadata на российском рынке встречали (просто интересно)? ИМХО мало таких систем на рынке. Одно внедрение PDW точно идёт (у моих знакомых), есть ли ещё - не в курсе...Exadat в России уже очень много. Цифры называть не могу, сорри. Публичная информация вот тут есть, например. ... |
|||
:
Нравится:
Не нравится:
|
|||
11.02.2015, 14:29 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Ivan DurakAlexander RyndinИнтересно было посмотреть, как PDW себя ведет при попытке лить и читать данные одновременно. Для многих современных MPP это серьезная проблема. В чем и кого проблема?Сейчас многие хранилища строится согласно вот такой архитектуре (привожу от Oracle, но то же самое есть и у других вендоров). Ниже картинка. Если посмотрите, то - данные льются в stage, в том числе в real-time - внизу есть такая штука как Analytical Discovery, которая ходит в том числе и к stage - на рисунке не показано, но есть еще и оперативная отчетность, которая работает с данными, не обработанными ETL, ибо нужно real-time, а на источниках такую отчетность запускать нежелательно - в больших хранилищах большую часть загрузки стараются делать из stage, наполняемого CDC, а не ETL. Связано это в том числе с режимом 24/7 на источниках. У многих сейчас уже не хватает ночного batch window для полной проливки хранилища, а всем хочется иметь хранилище -1, а не -2. Вот и возникает потребность одновременно писать данные в stage с помощью того же GoldenGate и параллельно анализировать их в Online Reporting, Discovery, а также без проблем забирать данные в следующие слои хранилища в любой момент времени. . ... |
|||
:
Нравится:
Не нравится:
|
|||
11.02.2015, 14:43 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Ну да, главное. Exadata спокойно работает в такое режиме, ибо Oracle. ... |
|||
:
Нравится:
Не нравится:
|
|||
11.02.2015, 14:44 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Alexander RyndinНу да, главное. Exadata спокойно работает в такое режиме, ибо Oracle. ммм. правильная архитектура такая: Репликация из источника льется в не в основное хранилище, а в отдельную базу. Причем можно даже не в mpp, ибо они к oltp загрузке не оптимизированы, а хоть даже в оракл или как у нас в постгрес даже. Ну и уже из него тянет и онлайн и не онлайн etl загрузку в основной stage и онлайн аналитика на него смотрит. А в вашей архитектуре mpp аналитичсеская субд нагружена oltp нагрузкой из источников, причем из мноооогих одновременно. Зачем ей такая нагрузка?? Да и дорого лишние объемы держать на дорогом mpp когда их можно на бесплатный постгрес реплицировать (что мы и делаем к примеру). ... |
|||
:
Нравится:
Не нравится:
|
|||
12.02.2015, 11:08 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Ivan Durak, Отличие вашей архитектуры в дополнительной промежуточной oltp. Плюс между этой oltp и stage появляется довольно нетривиальный etl (он ведь должен уметь делать online). Stage у вас, как я понял, по прежнему на mpp. Он нужен для оперативной отчётности, а значит вряд ли вы там что агрегируете. Отсев ненужных данных делается ещё на источнике при захвате репликацией. Да и железо под вашу реплику вряд ли будет дешёвое. По поводу дороговизны хранения на mpp. Минимальная exadata (1/8) уже имеет на борту 72 Tb сырого пространства. А oltp нагрузка для неё семечки за счёт большого флеш кэша ... |
|||
:
Нравится:
Не нравится:
|
|||
12.02.2015, 12:57 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Alexander RyndinIvan Durak, Отличие вашей архитектуры в дополнительной промежуточной oltp. Плюс между этой oltp и stage появляется довольно нетривиальный etl (он ведь должен уметь делать online). Во-первых это етл ни чем не сложнее чем если бы реплика писала нам прямо в mpp !! Он такой же, только источник лежит подальше. А во-вторых. Эта архитектура так же прекрасно подходит и для обычных батчевых ежедневных хранилищ, все плюсы сохраняются: меньше oltp нагрузки на основной mpp сервер + меньше стораджа надо на mpp. Stage у вас, как я понял, по прежнему на mpp. Он нужен для оперативной отчётности, а значит вряд ли вы там что агрегируете. Отсев ненужных данных делается ещё на источнике при захвате репликацией. Да и железо под вашу реплику вряд ли будет дешёвое. Железо под оракл или постгрес в разы дешевле чем железо под нетизу или ексадату !! Вам ли не знать. По поводу дороговизны хранения на mpp. Минимальная exadata (1/8) уже имеет на борту 72 Tb сырого пространства. А oltp нагрузка для неё семечки за счёт большого флеш кэша 72 тб не так уж и много, а у какой-нить нитиззы вообще расширение объема не предусмотрено - целиком менять все. Во-вторых рад за эксадату конечно (хотя опять же не вижу смысла нагружать ее этими онлайн репликами), но пардон в доброй половине mpp даже индексов нет, а апдейты с делитами ложат перформанс в ноль. А у какой0нить вертики и не предусмотрены вообще. а в третьих наша архитектура универсальна и удобна и масштабируема реплику можно писать и не на один сервер, а хоть на столько сколько источников и даже больше. ... |
|||
:
Нравится:
Не нравится:
|
|||
12.02.2015, 13:50 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Ivan DurakВо-первых это етл ни чем не сложнее чем если бы реплика писала нам прямо в mpp !! Он такой же, только источник лежит подальше.Стоп, стоп, стоп. Если я делаю репликацию с помощью GoldenGate, то копию базы плюс историю на Exadata я получаю вообще не делая никакого ETL. 2 дня работы. Вам же, чтобы вынести отчетность на нормальную базу с Intraquery-параллелизмом приходится наворачивать ETL. Ivan Durak Stage у вас, как я понял, по прежнему на mpp. Он нужен для оперативной отчётности, а значит вряд ли вы там что агрегируете. Отсев ненужных данных делается ещё на источнике при захвате репликацией. Да и железо под вашу реплику вряд ли будет дешёвое. Железо под оракл или постгрес в разы дешевле чем железо под нетизу или ексадату !! Вам ли не знать.Подождите. Ну вы ведь все равно держите stage на mpp, который является источником для оперативной отчетности? Вы просто впереди ставите еще одну железку, с еще одной базой. Ivan DurakПо поводу дороговизны хранения на mpp. Минимальная exadata (1/8) уже имеет на борту 72 Tb сырого пространства. А oltp нагрузка для неё семечки за счёт большого флеш кэша 72 тб не так уж и много, а у какой-нить нитиззы вообще расширение объема не предусмотрено - целиком менять все. Во-вторых рад за эксадату конечно (хотя опять же не вижу смысла нагружать ее этими онлайн репликами), но пардон в доброй половине mpp даже индексов нет, а апдейты с делитами ложат перформанс в ноль. А у какой0нить вертики и не предусмотрены вообще.Ну я согласен про классические MPP. В них нельзя делать прямую репликацию. 72 ТБ, по моему, очень даже неплохо, если еще и учесть, что холодны данные жмутся поколоночно, что сокращает данные раз 5-8. Не так уж и много на территории бывшего СССР хранилищ такого объема. Да и, опять таки, 72 Тб - это 1/8, которая парой команд превращается в 1/4. Либо в любой другой объем в online. Ivan Durakа в третьих наша архитектура универсальна и удобна и масштабируема реплику можно писать и не на один сервер, а хоть на столько сколько источников и даже больше.Обычно универсальность - это обратное сторона низкой производительности. ... |
|||
:
Нравится:
Не нравится:
|
|||
12.02.2015, 15:20 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Alexander RyndinIvan DurakВо-первых это етл ни чем не сложнее чем если бы реплика писала нам прямо в mpp !! Он такой же, только источник лежит подальше.Стоп, стоп, стоп. Если я делаю репликацию с помощью GoldenGate, то копию базы плюс историю на Exadata я получаю вообще не делая никакого ETL. 2 дня работы. Вам же, чтобы вынести отчетность на нормальную базу с Intraquery-параллелизмом приходится наворачивать ETL. Так вы отчетность напрямую на cdc строите?? не-не-не. Такого мы не делаем. Стэйд у нас уже агрегированный с нужной историей нужной гранулярности!! Вот благодаря этому и етл такой же и экономия места. Ivan Durakа в третьих наша архитектура универсальна и удобна и масштабируема реплику можно писать и не на один сервер, а хоть на столько сколько источников и даже больше.Обычно универсальность - это обратное сторона низкой производительности.[/quot] производительность наоборот возрастает. mpp разгружаем от лишней несвойственной да еще и постоянной нагрузки! ... |
|||
:
Нравится:
Не нравится:
|
|||
12.02.2015, 17:29 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Ivan DurakAlexander RyndinИнтересно было посмотреть, как PDW себя ведет при попытке лить и читать данные одновременно. Для многих современных MPP это серьезная проблема. В чем и кого проблема? для тех, которые блокировочники в силу тех или иных исторических причин ... |
|||
:
Нравится:
Не нравится:
|
|||
12.02.2015, 23:26 |
|
Oracle exadata vs MSSQL
|
|||
---|---|---|---|
#18+
Вася УткинalexeyvgКстати, MSSQL тоже с некоторых пор columnstore Он теперь только columnstore, или может и row и column, и кто это решает, СУБД автоматически или разработчик прописывая в DDL каждой таблицы? "... может и row и column..." "... разработчик, прописывая в DDL каждой таблицы..." ... |
|||
:
Нравится:
Не нравится:
|
|||
17.03.2015, 21:36 |
|
|
start [/forum/topic.php?all=1&fid=35&tid=1552340]: |
0ms |
get settings: |
11ms |
get forum list: |
15ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
48ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
82ms |
get tp. blocked users: |
2ms |
others: | 11ms |
total: | 191ms |
0 / 0 |