powered by simpleCommunicator - 2.0.54     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Посоветуйте NoSQL DB
23 сообщений из 23, страница 1 из 1
Посоветуйте NoSQL DB
    #38872967
victorovich
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Добрый день.

Посоветуйте пожалуйста решение NoSQL исходя из моих требований:

1) хранилище должно размещаться в локальной сети (не в интернет-облаке типа Amazon)
2) сервер должен быть на винде (линукс не подходит)
3) будут храниться файлы размером ~100КБ-16МБ каждый
4) файлов может быть много (до 1 млн. новых в день)
5) нужна простая выборка key-value и возможность удаления старых файлов
6) интерфейс клиентского API - C/C++
7) чем проще и надежнее решение - тем лучше

Вроде как CouchBase подходит? или Oracle NoSQL?

Спасибо.
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38873449
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
А чем не подходит просто файловая система?..
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38873648
victorovich
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
даже не хочется комментировать ваш вопрос...
проведите тесты сами и посмотрите производительность при млн. файлов и файловой системе
к тому же при удаленном расположении машины сервера сетевая шара - не вариант, нужно решение по-надежней
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38873898
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
На винчестере моего ноутбука сейчас чуть менее 400 тысяч файлов. Проблем с производительностью не замечено.

О ненадёжности файл-сервера Windows в локальной сети попрошу Вас рассказать с подробностями, а то вдруг десять лет беспроблемной работы сотни пользователей были всего лишь счастливой случайностью...
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38873917
victorovich
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Зачем тогда по вашему разрабатывают NoSQL-сервера? От нечего делать?
Я не собираюсь вам здесь ничего доказывать. Не можете посоветовать - просьба не писать.
Спасибо.
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38874033
gandjustas
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
victorovichЗачем тогда по вашему разрабатывают NoSQL-сервера? От нечего делать?
Я не собираюсь вам здесь ничего доказывать. Не можете посоветовать - просьба не писать.
Спасибо.
"Зачем" это философский вопрос. Вы уверены что ваши цели и ограничения, полностью совпадают с целями и ограничениями, которые заложили разработчики баз?

Я вот не уверен что кто либо из них закладывал хранение миллиарда файлов по 100КБ (это ацки большой объем), более того, все известные мне NoSQL БД используют хранение данных в памяти компа и есл база превышает объем ОП, то работать это по сути перестает.

Поэтому для таких объемов ФС - идеальное хранилище. Главное весь миллиард в одну папку не валить.
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38874043
nolocky
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
victorovichДобрый день.

Посоветуйте пожалуйста решение NoSQL исходя из моих требований:

1) хранилище должно размещаться в локальной сети (не в интернет-облаке типа Amazon)
2) сервер должен быть на винде (линукс не подходит)
3) будут храниться файлы размером ~100КБ-16МБ каждый
4) файлов может быть много (до 1 млн. новых в день)
5) нужна простая выборка key-value и возможность удаления старых файлов
6) интерфейс клиентского API - C/C++
7) чем проще и надежнее решение - тем лучше

Вроде как CouchBase подходит? или Oracle NoSQL?

Спасибо.

походу у автора дыра в голове и полное непонимание отличия файла от базы данных

в базе данных условно один файл на всё, остальное решается вопросами партицирования. партицирование по дню (отдельный файл бд для каждого дня) - это оок.

а вот тысячи файлов в день - за такое надо увольнять из отрасли, и принимать обратнотолько со сдачей экзаменов на вопрос ограничения количества файловых дескрипторов в системе.
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38874213
victorovich
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
nolockyvictorovichДобрый день.

Посоветуйте пожалуйста решение NoSQL исходя из моих требований:

1) хранилище должно размещаться в локальной сети (не в интернет-облаке типа Amazon)
2) сервер должен быть на винде (линукс не подходит)
3) будут храниться файлы размером ~100КБ-16МБ каждый
4) файлов может быть много (до 1 млн. новых в день)
5) нужна простая выборка key-value и возможность удаления старых файлов
6) интерфейс клиентского API - C/C++
7) чем проще и надежнее решение - тем лучше

Вроде как CouchBase подходит? или Oracle NoSQL?

Спасибо.

походу у автора дыра в голове и полное непонимание отличия файла от базы данных

в базе данных условно один файл на всё, остальное решается вопросами партицирования. партицирование по дню (отдельный файл бд для каждого дня) - это оок.

а вот тысячи файлов в день - за такое надо увольнять из отрасли, и принимать обратнотолько со сдачей экзаменов на вопрос ограничения количества файловых дескрипторов в системе.

Как раз и нужно чтобы был один файл и не было превышения дескрипторов. Для этого и прошу посоветовать NoSQL БД чтобы не связываться с ФС, которые изначально не были разработаны под такие объемы и кол-ва.
Файлы будут постоянно удаляться, более млн. врядли будет, но и добавляться новые.
Для таких целей NoSQL и разработали.
Или я в форум по философии попал? :)
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38874214
victorovich
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Мог бы и сам такое написать чтобы в один файл все валило, но не хочется если уже есть хорошие готовые решения.
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38874216
victorovich
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Сейчас использую SQLite, и разбивку по часам. Каждый час - новый файл. По чтению меня скорость устраивает, а вот по записи беда, я так подозреваю что SQLite после каждой записи делать Flush, потому производительность очень низкая. Плюс сетевого интерфейса у него нет, а нужен.
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38874430
Alexey Tomin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
victorovichПосоветуйте пожалуйста решение NoSQL исходя из моих требований:

1) хранилище должно размещаться в локальной сети (не в интернет-облаке типа Amazon)
2) сервер должен быть на винде (линукс не подходит)
3) будут храниться файлы размером ~100КБ-16МБ каждый
4) файлов может быть много (до 1 млн. новых в день)
5) нужна простая выборка key-value и возможность удаления старых файлов
6) интерфейс клиентского API - C/C++
7) чем проще и надежнее решение - тем лучше


mongodb вроде подходит. Не знаю, как про "до 16Тб в день" (умножил размер файла на количество), тем более не знаю, какая винда это выдержит, но вроде как монгу используют для больших объёмов, в т.ч. Яндекс.
Файлы там в GridFS хранятся- виртуальная файловая система поверх БД.
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38874573
Winnipuh
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
victorovichЗачем тогда по вашему разрабатывают NoSQL-сервера? От нечего делать?
Я не собираюсь вам здесь ничего доказывать. Не можете посоветовать - просьба не писать.
Спасибо.

Мало ли что разрабатывают и для каких целей.
Какой объем?

SQLite?
SQL Server?
cassandra

и т.д.
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38874698
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
victorovich, не слушайте про файловую систему. Исследования говорят , что файловая система это не лучший способ хранения большого количества мелких файлов.
Вы правильно считаете, что вам нужна key-value база. Mongo, мне кажется, overkill. 90% функционала использовать не будете.
Oracle NoSQL в этом плане будет хорош - начинаете работать на бесплатно, а если станет бизнес-критикал, то берете поддержку. Да и вашим параметрам она удовлетворяте. Если не нужно распределенность, то BerkleyDB - это одноузловая версия Oracle NoSQL
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38875005
victorovich
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Да. Я прекрасно знаю что такое FS на низком уровне. Даже сам могу написать свою простейшую для такой задачи. Уж тем более знаком с NTFS, которая разрабатывалась лет 30 назад, когда и близко таких объемов и кол-ва не было. Куча мелких файлов на диске - это беда. Достаточно выполнить DIR C: /S и посмотреть на сколько повиснет, хотя это простой запрос типа SELECT name FROM Table
Относительно решений Oracle NoSQL / Berekley вопрос - можно ли их настроить так, чтобы кеширования почти не было и ОЗУ потребление сводилось бы к минимуму?
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38875058
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Посмотрите вот тут - может поможет?
https://docs.oracle.com/cd/E26161_02/html/AdminGuide/select-cache-strategy.html
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38876036
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
victorovichДостаточно выполнить DIR C: /S и посмотреть на сколько повиснет
Для уже вышеназванных почти 400к файлов на тормозном ноутбучном винте первый (холодный) запуск занял 4 минуты 19 секунд. Второй (с прогретым кэшем) - 52 секунды. Но какое отношение этот тест имеет к заявленному в стартовом посте "нужна простая выборка key-value"?..
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38876499
victorovich
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Dimitry SibiryakovvictorovichДостаточно выполнить DIR C: /S и посмотреть на сколько повиснет
Для уже вышеназванных почти 400к файлов на тормозном ноутбучном винте первый (холодный) запуск занял 4 минуты 19 секунд. Второй (с прогретым кэшем) - 52 секунды. Но какое отношение этот тест имеет к заявленному в стартовом посте "нужна простая выборка key-value"?..

Вы издеваетесь? Если у вас key выбирается только 4 минуты, а представьте если вы еще value (т.е. сами данные файла) начнете выбирать! Проведите такой эксперимент - очень простой: прочитайте все файлы с винта в "холодном кеше" c данными, заметьте время, а потом прочитайте по секторам весь логический диск С: подряд, чтобы кол-во секторов было сопоставимо с кол-вом данных всех ваших файлов (т.к. диск может не до конца быть забит). Увидите разницу. Вот второй способ - это примерно то, что будет в нормальном NoSQL-решении. Причины след. - дефрагментация самих файлов, что вызывает "бегание" головки жесткого диска (если он механический), а также структура FS не адаптированная для частых и больших выборок. Кеш конечно же есть, но не всегда он спасает, особенно если файлы обновляются.
Т.е. если я выбираю файлы в одной папке, то их поиск будет быстрее чем если они будут в азных папках на разных уровнях иерархии. А для key-value решения это не имеет значения.
В общем, если и дальше будете защищать NTFS как самое лучшее что есть на свете, то занимайтесь этим на другом сайте поклонников, но не в ветке форума NoSQL.
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38876501
victorovich
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Даже не так - неправильный эксперимент.
Лучше такой - постройте заранее список всех файлов на вашем диске через тот же dir /S, а потом на холодном кеше попробуйте обращаться к файлам в случайном порядке из этого списка и пройтись по всем. Читать данные файла даже не нужно, просто читайте, к примеру, дату его создания. И такой процесс у вас зависнет минут на 20 - не меньше. Связано с тем, что dir выбирает файлы по иерархии, что чуть быстрее случайного обращения к файлам. А в нормальной DB обращение может быть случайным и должном быть быстрым. Я с этим баловался даже на нескольких тысячах файлах - и результаты "производительности" NTFS+Windows меня просто поразили. Просто FS в основном не для таких задач.
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38921834
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
victorovichЗачем тогда по вашему разрабатывают NoSQL-сервера? От нечегог делать?


О, мужик, ты попал пальцем в небо. Именно по этой причине и разрабатывают NoSQL-сервера.
А знаешь, почему их потом используют?
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38922071
Фотография DirksDR
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
MasterZivА знаешь, почему их потом используют?
Заинтриговал:)
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38922152
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DirksDRMasterZivА знаешь, почему их потом используют?
Заинтриговал:)

не, пока ТС не спросит, не скажу...
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38923051
Winnipuh
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
MasterZivDirksDRпропущено...

Заинтриговал:)

не, пока ТС не спросит, не скажу...

даладно! может он стесняется

итак?
...
Рейтинг: 0 / 0
Посоветуйте NoSQL DB
    #38928508
GVF112GVF
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
victorovich,

Посмотрите второй раздел - http://public.dhe.ibm.com/common/ssi/ecm/en/imm14164usen/IMM14164USEN.PDF

С уважением,
Вадим.
...
Рейтинг: 0 / 0
23 сообщений из 23, страница 1 из 1
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Посоветуйте NoSQL DB
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]