База для очень быстрой проверки наличия в списке / NoSQL, Big Data

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / База для очень быстрой проверки наличия в списке

5 сообщений из 5, страница 1 из 1

База для очень быстрой проверки наличия в списке

#39312335

Foggy

Гость

Здравствуйте!
Никак не могу определиться с выбором базы данных для хранения списков.
Основное требование. Хранить списки UID, при запросе в 10-20 UID выдавать ответ, какие уже есть в списке, а каких нет.
Пока присматриваюсь к Redis, хранить информацию в Sets и запросом SISMEMBER ( http://redis.io/commands/sismember ) смотреть есть ли объект в списке или нет.
Но не устраивает производительность. А точнее, то что запрос SISMEMBER может проверять только один элемент, а 10-20 запросов не укладываются в требования по времени. При использовании пакетной отсылки запросов подошел к достаточно быстрому времени ответа, но хотелось бы иметь задел прочности. Причем такое решение даёт 100% точность ответа, что не требуется, если правильных ответов будет 85-90% это не критично. Может есть какой-то вероятностный алгоритм?
Данных не особо много. В пару гигибайт укладываются, но планируются постоянные запросы в несколько потоков на наличие объекта в списке.
ОС Linux

...

Рейтинг:

0 / 0

21.09.2016, 01:21

| Ответить | Цитировать | Написать

База для очень быстрой проверки наличия в списке

#39312376

servit

Участник

Откуда: г. Кишинёв, Республика Молдова

Сообщения: 3 167

Рейтинг: 0 / 0

Foggy ,

В соседнем форуме была похожая тема: " Как реализовать сравнение множеств? "
Там же приведён конкретный пример с показателями скорости поиска: 19182172

...

Рейтинг:

0 / 0

21.09.2016, 08:23

| Ответить | Цитировать | Написать

База для очень быстрой проверки наличия в списке

#39312404

buzza

Гость

т. к. "пара гигибайт" легко влезает в оперативку - однозначно хватит простого hashmap (std::unordered_map или что там есть в вашем языке)

...

Рейтинг:

0 / 0

21.09.2016, 09:13

| Ответить | Цитировать | Написать

База для очень быстрой проверки наличия в списке

#39313046

Foggy

Гость

servit Foggy ,

В соседнем форуме была похожая тема: " Как реализовать сравнение множеств? "
Там же приведён конкретный пример с показателями скорости поиска: 19182172

Спасибо, нужно будет протестировать

buzzaт. к. "пара гигибайт" легко влезает в оперативку - однозначно хватит простого hashmap (std::unordered_map или что там есть в вашем языке)

Я думал над таким вариантом. База должна быть доступна по сети, поэтому для таких целей можно взять Erlang и за вечер самому написать. Но лишний раз использовать свои велосипеды не люблю, хотя да, свое решение это хорошо.

...

Рейтинг:

0 / 0

22.09.2016, 00:55

| Ответить | Цитировать | Написать

База для очень быстрой проверки наличия в списке

#39315507

ASCRUS

Участник

Откуда: МО Электросталь

Сообщения: 5 642

Рейтинг: 0 / 0

Если требуется функциональность многопоточного выполнения запросов, с одновременным изменением данных и версионностью, то еще как вариант посмотреть от H2 MVStore:
http://www.h2database.com/html/mvstore.html

Движок умеет работать в режиме inmemory, а так же организовать хранение на диске в файле, с кэшированием в памяти. Неплохой движок, но правда на скорострельность я не тестировал, но думаю должно быть более менее.

...

Рейтинг:

0 / 0

26.09.2016, 12:22

| Ответить | Цитировать | Написать

5 сообщений из 5, страница 1 из 1

Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / База для очень быстрой проверки наличия в списке

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=48&msg=39313046&tid=1856729]:	0ms
get settings:	11ms
get forum list:	17ms
check forum access:	4ms
check topic access:	4ms
track hit:	57ms
get topic data:	11ms
get forum data:	2ms
get page messages:	59ms
get tp. blocked users:	1ms
others:	248ms

total:	414ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы