powered by simpleCommunicator - 2.0.49     © 2025 Programmizd 02
Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
25 сообщений из 30, страница 1 из 2
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39195686
nateless
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Пока сидим на PostgreSQL но встают жуткие проблемы при проходе всей базы, апдейтах, выборках.

Мы храним bitcoin blockchain распарсеный по блокам, транзакциям, входам и выходам и адресам. Почти по всем сущносятм делаются различные аналитические выборки, в то же время в режиме реального времени добавляются новые данные со скоростью примерно 200 тысяч транзакций в сутки, около 1.5M входов столько же выходов. Всего сейчас около 140М транзакций под 400М входов и выходов. При добавлении данных идет обсчет всех значений для к примеру адресов, сколько пришло сколько ушло и так далее. База с индексами весит почти 200 гигов.

Вся БД на одном сервере с 64GB RAM (из которых используется только 10GB) и SSD жесктим диском, на котором только БД.

При аналитических выборках по нашим алгоритмам это все выполняется очень долго. Хотелось бы иметь возможность выбирать любые данные по различным критериям не больше секунды. А так же проводить массовый апдейт.

Думали на тему MemSQL, даже попробовали туда начать экспорт но все равно уперлись примерно в 10к операций в секунду, что для нас очень медленно, кроме того mysql движок наложил ограничения при массовых инсертах он не возвращает id как PostgrSQL что приводит к последующему селекту.
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39195697
nateless
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
PS: Мы готовы рассмотреть вариант докупки до 5 серверов с SSD и 64GB RAM
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39195705
nateless
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Извинясь за PS, не могу топик изменить что бы добавить данные.

Нам обязательна нужна транзакционность и желательно что бы были нормальные клинеты так как разработка идет на Rails\Elixir и не хотелось бы проблем с сырыми клиентами.
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39195815
Фотография DirksDR
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
nateless,

Противоречивые у Вас требования - чтобы OLTP и OLAP сразу, да еще и бесплатно!
Попробуйте Cache с ее системой онлайн аналитики DeepSee, если рассматриваете платные варианты.
В московском представительстве InterSystems есть технические специалисты, рекомендую с ними пообщаться.
Только сформулируйте задачу поаккуратнее:какие таблицы, колонки, ключи, количество записей в таблицах, количество пользователей, какие запросы, количество запросов на ввод, на запись и пр.
А может, Вам в форум NoSQL, Big Data?
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39195851
Yo.!
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
nateless,

какие транзакции, какой риалтайм ? это все четкая противоположность концепции биг дата.
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39195856
КБС5
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Стебелек сегодня зарелизился. Этот потянет.
Но он в Бете, хоть и с транзакциями. Так что тут еще думать нужно.
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39195927
kealon(Ruslan)
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Yo.!nateless,

какие транзакции, какой риалтайм ? это все четкая противоположность концепции биг дата.
+1
либо ACID, либо RealTime :-)
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39195942
Arm79
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
У PostreSql есть возможность реплицирования. Что мешает OLTP использовать на одном сервере, а аналитику делать на другом?
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39196034
Фотография Sayan Malakshinov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Oracle 12.1.0.2 с inmemory option, даже без Real Application Clusters (RAC) с такими объёмом пойдёт...
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39196388
Фотография Критик
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
может будет проще заменить SSD?

ps но сначала лучше найти узкое место
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39196466
Фотография ASCRUS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Yo.!nateless,

какие транзакции, какой риалтайм ? это все четкая противоположность концепции биг дата.
+1 При таких требованиях это не BigData, а ManyRows правильнее уж называть :)

Мне кажется автору стоит не искать лекарство от всех болезней, оставить OLTP на Постгре + рядом поставить какой нибудь колонко-ориентированный сервер и периодически на него переносить изменения с OLTP. Если данных много и обновление хранилищ данных должно вести с высокой периодичностью, то можно и на MPP решения посмотреть.

Смущают правда массовые апдейты. Для хранилищ данных это удар ниже пояса, тяжело апдейты отлавливать в первоисточниках, еще тяжелее их без потери прозрачности схемы данных и производительности в хранилище данных укладывать. Здесь наверное имеет смысл и на OLTP доделать добавление изменений данных во времени как новых записей, чтобы OLTP текущее состояние своих данных поддерживал на апдейтах, но вел историю изменений вставками для их последующего захвата хранилищем данных. А хранилище дальше может их преобразовывать на измерения, меняющиеся во времени и факты, в конечном счете раскладывая по витринам.
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39197213
Как я понимаю для blockhain из ACID важно только: А и C. Атомарное и консистентное сохранение одного "документа"

Посмотрите в сторону RethinkDB.
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39197290
nateless
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
DirksDR,

Пока хотелось бы остаться на opensource решениях и компенсировать все колл серверов.

Arm79,

Логика наших апдейтов достаточно сложная кроме того сам блокчейн не так прост, в нем есть варианты сайд чейнов, когда майнеры майнят ветку которая потом будет признана не действительной и можно откатить до 6 блоков назад это огромный массив данных и тут либо писать сложную систему отката, либо проводить повторно наши обсчеты с какого-то save point`a. И это только одна из множества проблем. Поэтому думаем как оставить все в одном хранилие и не делать "холодную" / "горячую" базу.

xtender,

Подойдет как? Что Oracle может дать того что не дает PostgreSQL? Есть какие-то метрики которые скажут что мы получи X прирост производительность и у нас не будет проблем с постоянными адпейтами как архивных (старых) так и новых данных?

ASCRUS,

MPP это что? :)

nikolay.kulikov@gmail.com,

Смотрели скорость записи\чтения очень низкая.
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39197305
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
natelessЧто Oracle может дать того что не дает PostgreSQL?
Понимание того, что все проблемы вы себе создаёте собственными кривыми руками.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39197348
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
natelessПри аналитических выборках по нашим алгоритмам это все выполняется очень долго. Хотелось бы иметь возможность выбирать любые данные по различным критериям не больше секунды.

IMHO Проще всего разнести рабочею БД и БД для аналитике по разным машинам.
Если это действительно аналитика.
natelessА так же проводить массовый апдейт.

Не знаю,что под этими словами точно скрывается. Но обычно, в реальных системах, именно "массовый апдейт" требуется достаточно редко.

Если частая операция - что то не то в Вашей структуре данных.
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39197358
этта
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Leonid Kudryavtsev,

у них она не просто частая, а массовая
по 20--30k версий -- как два байта об асфальт

см тут:

http://www.sql.ru/forum/1202248/ochen-dolgiy-update-na-30m-zapisey?mid=18859272#18859272

т.е. пж тут сосёт
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39197373
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
По логике в Oracle с updte'ами и insert'ами должно быть намного полегче. Там даже vacum'ам нет, за ненадобностью )))
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39197381
Arm79
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
natelessЛогика наших апдейтов достаточно сложная кроме того сам блокчейн не так прост, в нем есть варианты сайд чейнов, когда майнеры майнят ветку которая потом будет признана не действительной и можно откатить до 6 блоков назад это огромный массив данных и тут либо писать сложную систему отката, либо проводить повторно наши обсчеты с какого-то save point`a. И это только одна из множества проблем. Поэтому думаем как оставить все в одном хранилие и не делать "холодную" / "горячую" базу.
И что? Как это мешает репликации и разнесению нагрузки?
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39197382
a_shats
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
nateless,

На всякий случай.
Как вариант решения железом "в лоб" - 2x E5-2667V3, 16x 32GB LRDIMM 2133MHz, 2x PCI-E SSD типа Intel P3700 серии объемом 400-800 ГБ. Можно и Р3600 серии, но это будет несколько медленнее и на чтение, и на запись.
Тупо, железно, начнет тормозить со временем (по мере роста базы) - но на сейчас задачу решит, относительно близко к желаемым критериям.
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39197414
Фотография Sayan Malakshinov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
natelessxtender,

Подойдет как? Что Oracle может дать того что не дает PostgreSQL? Есть какие-то метрики которые скажут что мы получи X прирост производительность и у нас не будет проблем с постоянными адпейтами как архивных (старых) так и новых данных?То есть вы даже не понимаете как работает PostgreSQL?
В принципе уже дали частичный ответ:
Leonid KudryavtsevПо логике в Oracle с updte'ами и insert'ами должно быть намного полегче. Там даже vacum'ам нет, за ненадобностью )))Помимо этого стоит еще добавить, что все будет еще быстрее с Inmemory option, за счет избавления от лишних индексов и векторной обработки:
White paper: Oracle Database In-Memory
In-Memory Acceleration for the Real-Time Enterprise
Помимо этого, думаю еще надо правильно выбрать/продумать схемы секционирования для еще большего ускорения. И еще можно будет дополнительно ускорить с использованием Real Application Cluster(RAC) или хотя бы Active Standby: например, гонять аналитику на второй ноде или на стэндбае.
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39197418
nateless
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
xtender,

К сожалению нет, я не DBA. Спасибо за инфу почитаю. Как я понял RAC уже в платном Оракле, какая там стоимость за год на сервер с 16 ядрами?
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39197422
Фотография Sayan Malakshinov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
nateless,

имхо рано вам про обычный RAC думать, пока подумайте про RAC one node наверное. По поводу цен да и вообще миграции поговорите с самим Ораклом, я думаю сейлзы/пресейлзы продажи ради и анализ, и тесты вам проведут
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39197423
Фотография Sayan Malakshinov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
natelessкакая там стоимость за год на сервер с 16 ядрами?там есть еще вариант и оплаты по NUP'ам, т.е. Named user plus
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39197463
Фотография iv_an_ru
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
nateless,

Virtuoso Open Source ;)
...
Рейтинг: 0 / 0
Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
    #39197931
a_shats
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
natelessВся БД на одном сервере с 64GB RAM ( из которых используется только 10GB ) и SSD жесктим диском, на котором только БД.
А почему, если не секрет ?
...
Рейтинг: 0 / 0
25 сообщений из 30, страница 1 из 2
Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / Посоветуйте СУБД под BigData с новыми данными в режиме риалтайм.
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]