|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
Добрый день! Есть вялотекущий проект, первоначально в котором предполагалось использовать Oracle SE и RAC. Сейчас в 19с RAC это платная опция и доступна в EE. Подрядчик предполагает вместо этого использовать БД в VmWare c Fault Tolerance (грубо - репликация состояния виртуальной машины и файлов БД на другой хост кластера VmWare и запуск БД в случае аварии первого хоста, как рекламируют - без потерь) У кого-нибудь есть опыт такого использования? Хотелось бы услышать плюсы/минусы для такого использования БД. Все что гуглится по данному вопросу - из последних 2017 год, и в основном это от VmWare. Чего-то у меня сильные сомнения в этом решении для обеспечения отказоустойчивости БД, особенно если БД сильно нагружена ... |
|||
:
Нравится:
Не нравится:
|
|||
14.07.2021, 15:39 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
Чисто теоретически, сам с subj не сталкивался: А Oracle уже сертифицировал VmWare для использования с СУБД ? На мой взгляд Fault Tolerance и не сертифицированная (не поддерживаямая) комбинация софта - как-то в одном предложение выглядит взаимопротиворечиво. для такого использования БД а какая разница БД или не БД (например MS Word) ? Если VmWare гарантирует, что при сбоях оборудования виртуалка без потерь мигрирует на другой хост, то что СУБД, что не СУБД - разницы то никакой. Чего-то у меня сильные сомнения в этом решении для обеспечения отказоустойчивости БД, особенно если БД сильно нагружена тут скорее вопросы: 1. насколько быстро упавший хост мигрирует 2. что считать "упавшим". Какие ошибки железа/софта считаются допустимыми, какие будут приводить к миграции. Скорее всего софтовые ошибки VmWare не заметит. Т.ч. СУБД вполне сможет упасть, а fault tolerance по железу никак не поможет. Например, я за свою жизнь очень редко видел упавшее железо/упавшие базы по вине железа. Но очень часто видел софтовые ошибки/упавшие базы по вине админов, кривого софта, в том числе кривой настройки реплик. Когда реплики не помогали избежать проблем, а наоборот их провоцировали. Возникла кратковременная проблема /например с сетью/, автоматом запустилось переключение не реплику, криво настроена админом/не отлажено -> все упало и пару дней админы с матом реплики обратно переключают. По крайне мере, видел проект, когда раз в 2-3 месяца (т.е. часто) именно из-за неотлаженности железной реплики и настроект базы/прикладного софта, регулярно все вставали. Только через 1.5-2 года реплику более-менее нормально настроили. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.07.2021, 15:57 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
Leonid Kudryavtsev, Здесь дело не в миграции, мигрирует все нормально в онлайне на работающей БД. Тут именно репликация состояния ВМ. Т е на одном хосте работает ВМ с БД и ее состояние(память, процессы, состояния vCPU и т п, диски) в реалтайм синхронизируются с другим хостом. если первый падает, то на втором уже должна быть копия с состоянием памяти и т п и она просто акивируется. За счет реалтайм, там ограничения - в Enterprise Plus - не более 8 VCPU. Для файлопомоек вопросов нет - файлы и память меняются относительно медленно. А вот для БД - вопрос. Вопрос не в сертификации, а в технологии и производительности. Опять же, если первый упал, а второй активировал слепок и БД встала. Чего делать? Куда бежать? Да и пишут - включение FT сильно влияет на латенси при доступе к ВМ. Т е это мне не очень нравится, поэтому и хотел узнать поподробнее - мб у кого-то был опыт ... |
|||
:
Нравится:
Не нравится:
|
|||
14.07.2021, 16:26 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
landy на другой хост кластера VmWare и запуск БД в случае аварии первого хоста, как рекламируют - без потерь) Лицензии oracle rdbms уже посчитали? По EE на wmvare cluster очень жестко получалось. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.07.2021, 16:50 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
landy Опять же, если первый упал, а второй активировал слепок и БД встала. Чего делать? Куда бежать? К админу. Куда же еще? landy Да и пишут - включение FT сильно влияет на латенси при доступе к ВМ. нагрузочное тестирование. На конретном приложении, на конкретных задачах. Согласовывать сценарий, проводить тестирование. Как еще? ... |
|||
:
Нравится:
Не нравится:
|
|||
14.07.2021, 17:01 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
У заказчика был настроена блочная репликация между дисковыми массивами (по моему тогда это называлось HP Data Continues). Ну что сказать, работала несколько лет. Но все рухнуло, когда заработал фоновый дефрагментатор на одном из массивов, про который внятно было написано очень мало. Под VMWare Вы не сможете лицензировать все CPU vSphere, банально лицензия SE имеет ограничения на ФИЗИЧЕСКУЮ конфигурацию сервера. Где вы сейчас найдете 2-х socket сервер? КМК, оптимально использовать разделяемый том между двумя серверами При условии, что второй сервер не будет работать более 10 дней в год, его лицензировать не нужно. Лицензия SE2 очень жесткая: Database Licensing ... Oracle Database Standard Edition 2 may only be licensed on servers that have a maximum capacity of 2 sockets. In addition, notwithstanding any provision in Your Oracle license agreement to the contrary, each Oracle Database Standard Edition 2 database may use a maximum of 16 CPU threads at any time. The minimums when licensing by Named User Plus (NUP) metric are 10 NUP licenses per server. ... When licensing Oracle programs with Standard Edition One, Standard Edition 2or Standard Edition in the product name, a processor is counted equivalent to a socket; however, in the case of multi-chip modules, each chip in the multi-chip module is counted as one occupied socket. ... SE2 запрещено устанавливать на физический сервер с количеством socket > 2, то есть Вы можете установить VM с Oracle Database SE2 только на физический сервер с 2-мя sockets Лицензирование в виртуальной среде Лицензирование в виртуальной среде описано в документе: Oracle Partitioning Policy Тут нужно пояснить, существуют hard и soft партиции (VM) soft партиция, требует лицензирование всех физических CPU сервера(или кластера VM Environment если этот сервер в кластере) где развернута VM с базой данных Oracle: ... Unless explicitly stated elsewhere in this document,soft partitioning (includingfeatures/functionality of any technologies listed as examples above) is not permitted as a means to determine or limit the number of software licenses required for any given server or cluster of servers. ... При использовании Oracle VM или KVM, при определенных настройках (см. документ), возможно лицензирование части CPU, но для Standard Edition, это не актуально, так как она лицензирует CPU Sockets а не ядра. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.07.2021, 18:36 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
andrey_anonymous, Вопрос не про лицензии, вопрос про технологию, как это работает в реальных условиях, а не на бумаге ... |
|||
:
Нравится:
Не нравится:
|
|||
14.07.2021, 18:37 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
Vadim Lejnin, Про лиценззирование SE2 я тут спрашивал с полгода назад - все время приводили эту цитату. 16 потоков - это захардкожено в SE2, т е если у нас 2 сокета по 12 ядер - суммарная нагрузка не будет превышать 16 потоков, т е 24 потока будут загружены максимум на 66 % в пике. Там по моему ссылка была на тесты этого момента, у себя я проверял - именно так это и работает. У нас есть официальный ответ от поддержки Oracle - лицензирования SE2 в кластере VmWare - лицензируются все 2-х сокетные хосты(2 сокета с ЦПУ в каждом из хостов) кластера по сокетам, независимо от того сколько в них ядер/потоков. Число инстансов БД в виртуалках не ограничено(разве что мощностью хостов). Т е для лицензирования 4-х хостов в кластере VmWare по 2 сокета каждый нужно прикупить 4*2=8 лицензий SE2. В деньгах это примерно 8 *16000$+25% поддержки первого года без учета скидок. В реале это может быть дешевле - где-то на 50%. Где возьмут 2-х сокетные хосты? - не знаю, да это и не важно - вытащат и оставят 2 ЦПУ. Еще раз - я про технологию без привязки к правильности лицензирования и стоимости лицензий на все это ПО. Т е это рабочее или нет - или это все только "веселые картинки"? ... |
|||
:
Нравится:
Не нравится:
|
|||
14.07.2021, 18:59 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
Вот про 16 потоков SE2 - https://blog.dbi-services.com/standard-edition-2-testing-the-16-thread-limitation/ ... |
|||
:
Нравится:
Не нравится:
|
|||
14.07.2021, 19:08 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
Vadim Lejnin Где вы сейчас найдете 2-х socket сервер? Подавляющее большинство современных серверов на Intel Xeon имеют именно 2 (два) сокета. Ни больше и не меньше. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.07.2021, 19:34 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
landy Где возьмут 2-х сокетные хосты? - не знаю, да это и не важно - вытащат и оставят 2 ЦПУ . Такой вариант для Standard Edition не разрешен. В сервере конструктивно должно быть не более 2 (двух) сокетов. ... |
|||
:
Нравится:
Не нравится:
|
|||
14.07.2021, 19:38 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
Посмотрите Standard Edition High Availability авторFrom version 19c onwards, users of Oracle Database Standard Edition can no longer use Oracle Real Application Clusters. However since most users of Oracle Real Application Clusters and Standard Edition used it to provide protection from failure of a server rather than for the scalability of database, Oracle is replacing it with Standard Edition High Availability. This solution provides cluster-based failover for Standard Edition Oracle Databases using Oracle Clusterware. Oracleʼs Oracle Database SE2 (SE2) customers thereby benefit from the high availability capabilities and storage management solutions that are already part of Oracle Grid Infrastructure, such as Oracle Automatic Storage Management (ASM) and the Oracle ASM Cluster File System (ACFS), free of charge. Может быть не придется городить странный новый VMware-огород. Сгородите стандартный неновый Oracle-огород. Общая рекомендация по устранению проблем при лицензировании Oracle Database: Долой VMware ! Даешь Oracle Linux KVM ! ... |
|||
:
Нравится:
Не нравится:
|
|||
14.07.2021, 19:45 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
Leonid Kudryavtsev, что считать "упавшим". Какие ошибки железа/софта считаются допустимыми, какие будут приводить к миграции. Скорее всего софтовые ошибки VmWare не заметит. Т.ч. СУБД вполне сможет упасть, а fault tolerance по железу никак не поможет. Да - это хороший вопрос, спасибо. SQL*Plus, спасибо, SEHA в данной ситуации наверное наиболее оптимальное решение ... |
|||
:
Нравится:
Не нравится:
|
|||
15.07.2021, 08:23 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
landy SQL*Plus, спасибо, SEHA в данной ситуации наверное наиболее оптимальное решение На доброе здоровье! Расскажите потом, что в итоге получилось. ... |
|||
:
Нравится:
Не нравится:
|
|||
15.07.2021, 10:03 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
landy, Если я не ошибаюсь, что режим FT транслирует процессорные инструкции на другую вм. И защищает в случае отказа самой ноды VmWare. Если у вас упала(kernel panic) целевая виртуалка, то и ёе копия тоже упадет. Такое было в VmWare 4, думаю что в 7 версии в основном все так же. ... |
|||
:
Нравится:
Не нравится:
|
|||
16.07.2021, 18:30 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
Был опыт использования vmware FT для сервера блокировок большой системы SAP. Действительно, работает как заявляется вендором при ограниченной нагрузке. На больших нагрузка (от 500 сессий) начались проблемы - network latency стал настолько длинным, что вся производительность значительно деградировала. Пришлось отказаться от использования. На базах данных ситуация будет еще печальнее, думаю. Так как еще добавятся дисковые операции. ... |
|||
:
Нравится:
Не нравится:
|
|||
17.07.2021, 10:12 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
Otero, спасибо Я тут подобное тоже на буржуйских форумах видел When using VMWare's 'Fault Tolerance' feature, If the underlying network between Primary and Secondary VM is not configured optimally, then you might see Network Latency. In my previous shop, a DB was built in VMWare with Fault tolerance enabled. But, we observed network latency between Apps and DB servers . We were observing 10 - 40 ms latency during ping tests. Once the Fault Tolerance was disabled, the latency was reduced to around 0.2 ms тут - https://community.oracle.com/tech/apps-infra/discussion/4053130/vmwares-fault-tolerance-active-passive-ha-vs-rac ... |
|||
:
Нравится:
Не нравится:
|
|||
17.07.2021, 21:42 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
landy Все что гуглится по данному вопросу - из последних 2017 год, и в основном это от VmWare. Чего-то у меня сильные сомнения в этом решении для обеспечения отказоустойчивости БД, особенно если БД сильно нагружена FT - это "живая" репликация изменений памяти ВМ с одного хоста на другой. Есть ограничения по количеству vCPU, технология требовательная к сетевым ресурсам (и по пропускной способности, и по времени отклика, и вообще стоит под это дело отдельную пару адаптеров иметь), есть и иные ограничения системного характера. FT защищает от фатального отказа основного хоста, не защищает от сбоя в гостевой ОС и приложениях - как тут справедливо выше замечено, kernel panic в гостевой ОС воспроизведётся сразу в обоих виртуалках, равно как и любые баги прикладного ПО. В плюсах: почти моментальная активация резервной ВМ со столь же разогретыми кэшами (прикладными и ядерными), открытыми сокетами ну и т.д. Как единственное средство обеспечения отказоустойчивости оракловой БД эта технология, наверное, не подойдёт - типичные требования по отказоустойчивости не предполагают отсутствия защиты от сбоев ОС одного из узлов "кластера". А вот прикрыть на самом деле критичные по доступности узлы RAC-кластера (условный фронтэнд) при наличии действительных потребностей в такой доступности - вполне рабочее решение. ... |
|||
:
Нравится:
Не нравится:
|
|||
19.07.2021, 22:09 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
Scott Tiger, если есть RAC - зачем FT? Лишняя сущность. Но сейчас для RAC на 19с нужен ЕЕ, до этого был бесплатен для SE ... |
|||
:
Нравится:
Не нравится:
|
|||
20.07.2021, 11:40 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
да и как тут уже говорили - в случае падения прикдада в ВМ при рабочей ВМ будем иметь такую же рабочую ВМ с нерабочим прикладом на другрм хосте ... |
|||
:
Нравится:
Не нравится:
|
|||
20.07.2021, 11:43 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
... |
|||
:
Нравится:
Не нравится:
|
|||
20.07.2021, 14:36 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
andrey_anonymous, SEHA уже советовали а Oracle Failsafe (если мне не изменяет память) - работает только на Windows ... |
|||
:
Нравится:
Не нравится:
|
|||
20.07.2021, 15:39 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
andrey_anonymous 19с+ - failsafe desupport ... |
|||
:
Нравится:
Не нравится:
|
|||
20.07.2021, 16:44 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
landy Scott Tiger, если есть RAC - зачем FT? Лишняя сущность. Я ж не говорю, что обязательная. Но юзкейс вполне придумывается, я описал его выше. RAC не даст такой скорости переключения при аппаратном сбое узла, в первую очередь. ... |
|||
:
Нравится:
Не нравится:
|
|||
21.07.2021, 15:16 |
|
Fault Tolerance VmWare и Oracle DB
|
|||
---|---|---|---|
#18+
Scott Tiger, Ну в RAC тоже кэши и т п разогреты. Время переключения клиентов определяется сетевыми задержками(задержками на сетевом оборудовании). В случае с FT они никуда не деваются, поэтому "вжик" магия тут будет очень похожа на RAC в случае отказа узла, с ньюансами неподконтрольности состояний процессов в ВМ. ... |
|||
:
Нравится:
Не нравится:
|
|||
22.07.2021, 07:49 |
|
|
start [/forum/topic.php?fid=52&msg=40083868&tid=1880021]: |
0ms |
get settings: |
10ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
34ms |
get topic data: |
12ms |
get forum data: |
3ms |
get page messages: |
65ms |
get tp. blocked users: |
2ms |
others: | 243ms |
total: | 391ms |
0 / 0 |