|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
Приходит много данных. В большинстве случаев это insert или update. Транзакции, ссылочная целостность не нужны, поэтому можно использовать NoSql решения. Что-то гугл мне не помогает найти какую-то полезную информацию по этому поводу. При прочем равном выбор падёт на SQL решение. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 17:22 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
Нужно ли трекать эти insert/update или важно только последнее значение? Какие типы запросов планируются? Что даст NoSQL тут по-твоему? В чем затык с реляционной базой? Масштабирование? Репликация? Партиционирование? Какой объем данных ожидается? Предварительно можно посомтреть на Cassandra имхо ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 17:51 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
Можно отсюда посмотреть. https://db-engines.com/en/ranking По сути эта линка - универсальный ответ. Дальше - нужны какие-то детали. Хотя-бы стоимость лицензии. Будете платить? Или хочется бесплатного? ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 17:52 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
redwhite90, Что за хранилище где не нужна целостность и т.д.?)))) Файл возьми. Писать очень быстро. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 17:52 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
PetroNotC Sharp, Тоже про файл подумал) ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 17:53 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
PetroNotC Sharpredwhite90, Что за хранилище где не нужна целостность и т.д.?)))) Файл возьми. Писать очень быстро. Практически любой временной ряд - просто запись температуры с датчика, там к примеру даже апдейт не нужен. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 17:55 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
Sergunka, Ну стрим с кинофильмами тоже в файл пишут. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 17:57 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
Это либо TimeSeries (экзотика) либо EventStore. Последнее работает успешно в банках. Написано кажется на ДотНете и скорость пишуших транзакций у него отличная. Насчет updates я не уверен. Надо смотреть архитектурно можно ли update рассматривать как еще один корректирующий insert. Если архитектурно можно - то взлетит. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 17:59 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
redwhite90Приходит много данных. В большинстве случаев это insert или update. Транзакции, ссылочная целостность не нужны, поэтому можно использовать NoSql решения. Что-то гугл мне не помогает найти какую-то полезную информацию по этому поводу. При прочем равном выбор падёт на SQL решение. Вроде как Кассандра официальный чемпион по этому делу. Скажите объемы записей в секунду тогда боле-менее будет понятно куда двигатся. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 17:59 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
PetroNotC SharpSergunka, Ну стрим с кинофильмами тоже в файл пишут. Технически в фильме нет временных тегов и особой нужды выбирать по тегу. Во временном ряду это довольно рядовая операция практически любой МЛ алгоритм Anomaly detection на этом построен. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 18:02 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
Ну. Кассандра она имеет лимиты по оперативке. И она больше для UPDATES чеме для INSERTS. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 18:04 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
maytonНасчет updates я не уверен. Надо смотреть архитектурно можно ли update рассматривать как еще один корректирующий insert. Если архитектурно можно - то взлетит. Это в Кассандре реализованно как новая версия для записи. И если мой склероз не изменяет можно вытащить все версии для записи. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 18:05 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
Задача - что-то типа краулинга .SEMRUSH как я понял делает нечто похожее. Вот тут некто пишет: https://eax.me/avoid-nosql/ Наконец, Cassandra использует LSM-tree. Этот способ хранения данных подходит далеко не под все нагрузки. Если вы пишите и удаляете много данных (например, решили использовать Cassandra для хранения очередей), это будет работать очень и очень плохо. Но у нас по идее удалений мало будет ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 18:28 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
Sergunkaredwhite90Приходит много данных. В большинстве случаев это insert или update. Транзакции, ссылочная целостность не нужны, поэтому можно использовать NoSql решения. Что-то гугл мне не помогает найти какую-то полезную информацию по этому поводу. При прочем равном выбор падёт на SQL решение. Вроде как Кассандра официальный чемпион по этому делу. Скажите объемы записей в секунду тогда боле-менее будет понятно куда двигатся. А можно какой-то прув? ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 18:30 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
redwhite90много данных.цифры то будут? ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 18:43 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
забыл никНужно ли трекать эти insert/update или важно только последнее значение? Какие типы запросов планируются? Что даст NoSQL тут по-твоему? В чем затык с реляционной базой? Масштабирование? Репликация? Партиционирование? Какой объем данных ожидается? Предварительно можно посомтреть на Cassandra имхо Ну по масштабированию однозначно NOSQL должна побеждать. Это было что-то типа преинтервью в проект, поэтому я не знаю всех деталей. Но меня удивила сама постановка вопроса, что упор на то, что много записей и обновлений. Нужно выбрать хранилище заточенное на такие операции. Про запросы на выборку ничего не известно ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 18:49 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
Когда в свое время заморачивался скоростью, меня SQL Lite вполне устроил. По скорости на простых точечных (одна запись) select/insert'ах раз в 7-8 быстрее PostgreSQL, Основное ускорение (на моей задаче) - отсутсвия протокола TCP/IP между прикладным кодом и БД. Т.ч. не уверен, что даже Non-SQL memory базы работающие через TCP/IP будут быстрее. TCP/IP (даже loopback) привносит слишком большие издержки. IMHO & AFAIK ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 18:51 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
redwhite90Это было что-то типа преинтервью в проект, поэтому я не знаю всех деталей. Но меня удивила сама постановка вопроса, что упор на то, что много записей и обновлений. Нужно выбрать хранилище заточенное на такие операции. Про запросы на выборку ничего не известно Ну может от вас и требовалось пораасуждать, поздавать наводящие вопросы хз. Ибо формулировка - будет много инсертов и апдейтов лишь вычеркивает все заточенное под OLAP, но не сильно упрощает понимание. Тут надо крутиться от других требований ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 19:20 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
redwhite90поэтому я не знаю всех деталей.как узнаешь, приходи. Сейчас твой вопрос равносилен: "нужно перевезти много груза. Что посоветуете"? ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 19:23 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
забыл ник...будет много инсертов и апдейтов лишь вычеркивает... ну для меня скорее это вычеркивает PostgreSQL с его vacuum или, по крайне мере, заставляет задуматься и проверить пригодность PostgreSQL на тестах. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 19:51 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
Я тоже заметил что PostgreSQL не игрок клуба TPC* тестов где тусят обычно IBM, Oracle, MS. Наверное стыдится. Хотя JSONB это они здорово придумали. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 20:27 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
redwhite90Sergunkaпропущено... Вроде как Кассандра официальный чемпион по этому делу. Скажите объемы записей в секунду тогда боле-менее будет понятно куда двигатся. А можно какой-то прув? Никакой она не чемпион. Потому-что конкурса никакого не было. Это ... знаете-ли как чемпионство среди Стебельков и ФВМясов. Кроме специфичного бенчмарка который написал сам автор никаких других сравнений не было. Всё нишевое. Специфичное. Вы даже WHERE свободно не можете в кассандре написать. Предикат не летает для всех полей by default. Просто такова архитектура. Ну а если реально нужно в одной нише сравнивать. Возьмите сравнение Apache Ignite vs Apache Cassandra. Если таковое сущесствует канешна. Ну и правила судейства. Что хотим. Скорость транзакций? Это одно. Реакция на падение ноды. И способность кластера безболезненно ее пережить - это совсем-совсем другое. Вот и попробуйсте просто поставить грамотно задачу тестирования. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 20:30 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
забыл никredwhite90Это было что-то типа преинтервью в проект, поэтому я не знаю всех деталей. Но меня удивила сама постановка вопроса, что упор на то, что много записей и обновлений. Нужно выбрать хранилище заточенное на такие операции. Про запросы на выборку ничего не известно Ну может от вас и требовалось пораасуждать, поздавать наводящие вопросы хз. Ибо формулировка - будет много инсертов и апдейтов лишь вычеркивает все заточенное под OLAP, но не сильно упрощает понимание. Тут надо крутиться от других требований Я думаю, что так и есть. Вопрос собственно в том, чтобы эти ветки выделить и расписать когда что лучше. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 21:24 |
|
Какое хранилище выбрать если будет много insert/update
|
|||
---|---|---|---|
#18+
PetroNotC Sharpredwhite90много данных.цифры то будут? Как обычно в реальном мире клиент надеется, что бизнес будет расти, поэтому хочет заложить наиболее подходящий продукт под требования известные на данном этапе. Пока это должно быть что-то стандартное(не самописное). ... |
|||
:
Нравится:
Не нравится:
|
|||
09.07.2019, 21:33 |
|
|
start [/forum/topic.php?fid=59&msg=39835630&tid=2121204]: |
0ms |
get settings: |
10ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
45ms |
get topic data: |
8ms |
get forum data: |
2ms |
get page messages: |
58ms |
get tp. blocked users: |
1ms |
others: | 13ms |
total: | 159ms |
0 / 0 |