powered by simpleCommunicator - 2.0.49     © 2025 Programmizd 02
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / База для очень быстрой проверки наличия в списке
5 сообщений из 5, страница 1 из 1
База для очень быстрой проверки наличия в списке
    #39312335
Foggy
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Здравствуйте!
Никак не могу определиться с выбором базы данных для хранения списков.
Основное требование. Хранить списки UID, при запросе в 10-20 UID выдавать ответ, какие уже есть в списке, а каких нет.
Пока присматриваюсь к Redis, хранить информацию в Sets и запросом SISMEMBER ( http://redis.io/commands/sismember ) смотреть есть ли объект в списке или нет.
Но не устраивает производительность. А точнее, то что запрос SISMEMBER может проверять только один элемент, а 10-20 запросов не укладываются в требования по времени. При использовании пакетной отсылки запросов подошел к достаточно быстрому времени ответа, но хотелось бы иметь задел прочности. Причем такое решение даёт 100% точность ответа, что не требуется, если правильных ответов будет 85-90% это не критично. Может есть какой-то вероятностный алгоритм?
Данных не особо много. В пару гигибайт укладываются, но планируются постоянные запросы в несколько потоков на наличие объекта в списке.
ОС Linux
...
Рейтинг: 0 / 0
База для очень быстрой проверки наличия в списке
    #39312376
servit
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Foggy ,

В соседнем форуме была похожая тема: " Как реализовать сравнение множеств? "
Там же приведён конкретный пример с показателями скорости поиска: 19182172
...
Рейтинг: 0 / 0
База для очень быстрой проверки наличия в списке
    #39312404
buzza
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
т. к. "пара гигибайт" легко влезает в оперативку - однозначно хватит простого hashmap (std::unordered_map или что там есть в вашем языке)
...
Рейтинг: 0 / 0
База для очень быстрой проверки наличия в списке
    #39313046
Foggy
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
servit Foggy ,

В соседнем форуме была похожая тема: " Как реализовать сравнение множеств? "
Там же приведён конкретный пример с показателями скорости поиска: 19182172

Спасибо, нужно будет протестировать

buzzaт. к. "пара гигибайт" легко влезает в оперативку - однозначно хватит простого hashmap (std::unordered_map или что там есть в вашем языке)

Я думал над таким вариантом. База должна быть доступна по сети, поэтому для таких целей можно взять Erlang и за вечер самому написать. Но лишний раз использовать свои велосипеды не люблю, хотя да, свое решение это хорошо.
...
Рейтинг: 0 / 0
База для очень быстрой проверки наличия в списке
    #39315507
Фотография ASCRUS
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Если требуется функциональность многопоточного выполнения запросов, с одновременным изменением данных и версионностью, то еще как вариант посмотреть от H2 MVStore:
http://www.h2database.com/html/mvstore.html

Движок умеет работать в режиме inmemory, а так же организовать хранение на диске в файле, с кэшированием в памяти. Неплохой движок, но правда на скорострельность я не тестировал, но думаю должно быть более менее.
...
Рейтинг: 0 / 0
5 сообщений из 5, страница 1 из 1
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / База для очень быстрой проверки наличия в списке
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]