|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
Добрый день. Посоветуйте пожалуйста решение NoSQL исходя из моих требований: 1) хранилище должно размещаться в локальной сети (не в интернет-облаке типа Amazon) 2) сервер должен быть на винде (линукс не подходит) 3) будут храниться файлы размером ~100КБ-16МБ каждый 4) файлов может быть много (до 1 млн. новых в день) 5) нужна простая выборка key-value и возможность удаления старых файлов 6) интерфейс клиентского API - C/C++ 7) чем проще и надежнее решение - тем лучше Вроде как CouchBase подходит? или Oracle NoSQL? Спасибо. ... |
|||
:
Нравится:
Не нравится:
|
|||
06.02.2015, 07:23 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
А чем не подходит просто файловая система?.. ... |
|||
:
Нравится:
Не нравится:
|
|||
06.02.2015, 15:07 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
даже не хочется комментировать ваш вопрос... проведите тесты сами и посмотрите производительность при млн. файлов и файловой системе к тому же при удаленном расположении машины сервера сетевая шара - не вариант, нужно решение по-надежней ... |
|||
:
Нравится:
Не нравится:
|
|||
06.02.2015, 18:34 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
На винчестере моего ноутбука сейчас чуть менее 400 тысяч файлов. Проблем с производительностью не замечено. О ненадёжности файл-сервера Windows в локальной сети попрошу Вас рассказать с подробностями, а то вдруг десять лет беспроблемной работы сотни пользователей были всего лишь счастливой случайностью... ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2015, 15:07 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
Зачем тогда по вашему разрабатывают NoSQL-сервера? От нечего делать? Я не собираюсь вам здесь ничего доказывать. Не можете посоветовать - просьба не писать. Спасибо. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2015, 15:55 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
victorovichЗачем тогда по вашему разрабатывают NoSQL-сервера? От нечего делать? Я не собираюсь вам здесь ничего доказывать. Не можете посоветовать - просьба не писать. Спасибо. "Зачем" это философский вопрос. Вы уверены что ваши цели и ограничения, полностью совпадают с целями и ограничениями, которые заложили разработчики баз? Я вот не уверен что кто либо из них закладывал хранение миллиарда файлов по 100КБ (это ацки большой объем), более того, все известные мне NoSQL БД используют хранение данных в памяти компа и есл база превышает объем ОП, то работать это по сути перестает. Поэтому для таких объемов ФС - идеальное хранилище. Главное весь миллиард в одну папку не валить. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2015, 21:33 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
victorovichДобрый день. Посоветуйте пожалуйста решение NoSQL исходя из моих требований: 1) хранилище должно размещаться в локальной сети (не в интернет-облаке типа Amazon) 2) сервер должен быть на винде (линукс не подходит) 3) будут храниться файлы размером ~100КБ-16МБ каждый 4) файлов может быть много (до 1 млн. новых в день) 5) нужна простая выборка key-value и возможность удаления старых файлов 6) интерфейс клиентского API - C/C++ 7) чем проще и надежнее решение - тем лучше Вроде как CouchBase подходит? или Oracle NoSQL? Спасибо. походу у автора дыра в голове и полное непонимание отличия файла от базы данных в базе данных условно один файл на всё, остальное решается вопросами партицирования. партицирование по дню (отдельный файл бд для каждого дня) - это оок. а вот тысячи файлов в день - за такое надо увольнять из отрасли, и принимать обратнотолько со сдачей экзаменов на вопрос ограничения количества файловых дескрипторов в системе. ... |
|||
:
Нравится:
Не нравится:
|
|||
07.02.2015, 22:20 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
nolockyvictorovichДобрый день. Посоветуйте пожалуйста решение NoSQL исходя из моих требований: 1) хранилище должно размещаться в локальной сети (не в интернет-облаке типа Amazon) 2) сервер должен быть на винде (линукс не подходит) 3) будут храниться файлы размером ~100КБ-16МБ каждый 4) файлов может быть много (до 1 млн. новых в день) 5) нужна простая выборка key-value и возможность удаления старых файлов 6) интерфейс клиентского API - C/C++ 7) чем проще и надежнее решение - тем лучше Вроде как CouchBase подходит? или Oracle NoSQL? Спасибо. походу у автора дыра в голове и полное непонимание отличия файла от базы данных в базе данных условно один файл на всё, остальное решается вопросами партицирования. партицирование по дню (отдельный файл бд для каждого дня) - это оок. а вот тысячи файлов в день - за такое надо увольнять из отрасли, и принимать обратнотолько со сдачей экзаменов на вопрос ограничения количества файловых дескрипторов в системе. Как раз и нужно чтобы был один файл и не было превышения дескрипторов. Для этого и прошу посоветовать NoSQL БД чтобы не связываться с ФС, которые изначально не были разработаны под такие объемы и кол-ва. Файлы будут постоянно удаляться, более млн. врядли будет, но и добавляться новые. Для таких целей NoSQL и разработали. Или я в форум по философии попал? :) ... |
|||
:
Нравится:
Не нравится:
|
|||
08.02.2015, 18:13 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
Мог бы и сам такое написать чтобы в один файл все валило, но не хочется если уже есть хорошие готовые решения. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.02.2015, 18:18 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
Сейчас использую SQLite, и разбивку по часам. Каждый час - новый файл. По чтению меня скорость устраивает, а вот по записи беда, я так подозреваю что SQLite после каждой записи делать Flush, потому производительность очень низкая. Плюс сетевого интерфейса у него нет, а нужен. ... |
|||
:
Нравится:
Не нравится:
|
|||
08.02.2015, 18:25 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
victorovichПосоветуйте пожалуйста решение NoSQL исходя из моих требований: 1) хранилище должно размещаться в локальной сети (не в интернет-облаке типа Amazon) 2) сервер должен быть на винде (линукс не подходит) 3) будут храниться файлы размером ~100КБ-16МБ каждый 4) файлов может быть много (до 1 млн. новых в день) 5) нужна простая выборка key-value и возможность удаления старых файлов 6) интерфейс клиентского API - C/C++ 7) чем проще и надежнее решение - тем лучше mongodb вроде подходит. Не знаю, как про "до 16Тб в день" (умножил размер файла на количество), тем более не знаю, какая винда это выдержит, но вроде как монгу используют для больших объёмов, в т.ч. Яндекс. Файлы там в GridFS хранятся- виртуальная файловая система поверх БД. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 09:08 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
victorovichЗачем тогда по вашему разрабатывают NoSQL-сервера? От нечего делать? Я не собираюсь вам здесь ничего доказывать. Не можете посоветовать - просьба не писать. Спасибо. Мало ли что разрабатывают и для каких целей. Какой объем? SQLite? SQL Server? cassandra и т.д. ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 11:31 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
victorovich, не слушайте про файловую систему. Исследования говорят , что файловая система это не лучший способ хранения большого количества мелких файлов. Вы правильно считаете, что вам нужна key-value база. Mongo, мне кажется, overkill. 90% функционала использовать не будете. Oracle NoSQL в этом плане будет хорош - начинаете работать на бесплатно, а если станет бизнес-критикал, то берете поддержку. Да и вашим параметрам она удовлетворяте. Если не нужно распределенность, то BerkleyDB - это одноузловая версия Oracle NoSQL ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 12:55 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
Да. Я прекрасно знаю что такое FS на низком уровне. Даже сам могу написать свою простейшую для такой задачи. Уж тем более знаком с NTFS, которая разрабатывалась лет 30 назад, когда и близко таких объемов и кол-ва не было. Куча мелких файлов на диске - это беда. Достаточно выполнить DIR C: /S и посмотреть на сколько повиснет, хотя это простой запрос типа SELECT name FROM Table Относительно решений Oracle NoSQL / Berekley вопрос - можно ли их настроить так, чтобы кеширования почти не было и ОЗУ потребление сводилось бы к минимуму? ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 17:03 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
Посмотрите вот тут - может поможет? https://docs.oracle.com/cd/E26161_02/html/AdminGuide/select-cache-strategy.html ... |
|||
:
Нравится:
Не нравится:
|
|||
09.02.2015, 17:47 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
victorovichДостаточно выполнить DIR C: /S и посмотреть на сколько повиснет Для уже вышеназванных почти 400к файлов на тормозном ноутбучном винте первый (холодный) запуск занял 4 минуты 19 секунд. Второй (с прогретым кэшем) - 52 секунды. Но какое отношение этот тест имеет к заявленному в стартовом посте "нужна простая выборка key-value"?.. ... |
|||
:
Нравится:
Не нравится:
|
|||
10.02.2015, 15:37 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
Dimitry SibiryakovvictorovichДостаточно выполнить DIR C: /S и посмотреть на сколько повиснет Для уже вышеназванных почти 400к файлов на тормозном ноутбучном винте первый (холодный) запуск занял 4 минуты 19 секунд. Второй (с прогретым кэшем) - 52 секунды. Но какое отношение этот тест имеет к заявленному в стартовом посте "нужна простая выборка key-value"?.. Вы издеваетесь? Если у вас key выбирается только 4 минуты, а представьте если вы еще value (т.е. сами данные файла) начнете выбирать! Проведите такой эксперимент - очень простой: прочитайте все файлы с винта в "холодном кеше" c данными, заметьте время, а потом прочитайте по секторам весь логический диск С: подряд, чтобы кол-во секторов было сопоставимо с кол-вом данных всех ваших файлов (т.к. диск может не до конца быть забит). Увидите разницу. Вот второй способ - это примерно то, что будет в нормальном NoSQL-решении. Причины след. - дефрагментация самих файлов, что вызывает "бегание" головки жесткого диска (если он механический), а также структура FS не адаптированная для частых и больших выборок. Кеш конечно же есть, но не всегда он спасает, особенно если файлы обновляются. Т.е. если я выбираю файлы в одной папке, то их поиск будет быстрее чем если они будут в азных папках на разных уровнях иерархии. А для key-value решения это не имеет значения. В общем, если и дальше будете защищать NTFS как самое лучшее что есть на свете, то занимайтесь этим на другом сайте поклонников, но не в ветке форума NoSQL. ... |
|||
:
Нравится:
Не нравится:
|
|||
11.02.2015, 05:24 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
Даже не так - неправильный эксперимент. Лучше такой - постройте заранее список всех файлов на вашем диске через тот же dir /S, а потом на холодном кеше попробуйте обращаться к файлам в случайном порядке из этого списка и пройтись по всем. Читать данные файла даже не нужно, просто читайте, к примеру, дату его создания. И такой процесс у вас зависнет минут на 20 - не меньше. Связано с тем, что dir выбирает файлы по иерархии, что чуть быстрее случайного обращения к файлам. А в нормальной DB обращение может быть случайным и должном быть быстрым. Я с этим баловался даже на нескольких тысячах файлах - и результаты "производительности" NTFS+Windows меня просто поразили. Просто FS в основном не для таких задач. ... |
|||
:
Нравится:
Не нравится:
|
|||
11.02.2015, 05:52 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
victorovichЗачем тогда по вашему разрабатывают NoSQL-сервера? От нечегог делать? О, мужик, ты попал пальцем в небо. Именно по этой причине и разрабатывают NoSQL-сервера. А знаешь, почему их потом используют? ... |
|||
:
Нравится:
Не нравится:
|
|||
31.03.2015, 08:11 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
MasterZivА знаешь, почему их потом используют? Заинтриговал:) ... |
|||
:
Нравится:
Не нравится:
|
|||
31.03.2015, 11:04 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
DirksDRMasterZivА знаешь, почему их потом используют? Заинтриговал:) не, пока ТС не спросит, не скажу... ... |
|||
:
Нравится:
Не нравится:
|
|||
31.03.2015, 11:45 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
MasterZivDirksDRпропущено... Заинтриговал:) не, пока ТС не спросит, не скажу... даладно! может он стесняется итак? ... |
|||
:
Нравится:
Не нравится:
|
|||
31.03.2015, 18:14 |
|
Посоветуйте NoSQL DB
|
|||
---|---|---|---|
#18+
victorovich, Посмотрите второй раздел - http://public.dhe.ibm.com/common/ssi/ecm/en/imm14164usen/IMM14164USEN.PDF С уважением, Вадим. ... |
|||
:
Нравится:
Не нравится:
|
|||
06.04.2015, 20:13 |
|
|
start [/forum/topic.php?fid=48&msg=38928508&tid=1856844]: |
0ms |
get settings: |
8ms |
get forum list: |
12ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
43ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
54ms |
get tp. blocked users: |
1ms |
others: | 13ms |
total: | 153ms |
0 / 0 |