Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Посоветуйте NoSQL DB / 23 сообщений из 23, страница 1 из 1
06.02.2015, 07:23
    #38872967
victorovich
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
Добрый день.

Посоветуйте пожалуйста решение NoSQL исходя из моих требований:

1) хранилище должно размещаться в локальной сети (не в интернет-облаке типа Amazon)
2) сервер должен быть на винде (линукс не подходит)
3) будут храниться файлы размером ~100КБ-16МБ каждый
4) файлов может быть много (до 1 млн. новых в день)
5) нужна простая выборка key-value и возможность удаления старых файлов
6) интерфейс клиентского API - C/C++
7) чем проще и надежнее решение - тем лучше

Вроде как CouchBase подходит? или Oracle NoSQL?

Спасибо.
...
Рейтинг: 0 / 0
06.02.2015, 15:07
    #38873449
Dimitry Sibiryakov
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
А чем не подходит просто файловая система?..
...
Рейтинг: 0 / 0
06.02.2015, 18:34
    #38873648
victorovich
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
даже не хочется комментировать ваш вопрос...
проведите тесты сами и посмотрите производительность при млн. файлов и файловой системе
к тому же при удаленном расположении машины сервера сетевая шара - не вариант, нужно решение по-надежней
...
Рейтинг: 0 / 0
07.02.2015, 15:07
    #38873898
Dimitry Sibiryakov
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
На винчестере моего ноутбука сейчас чуть менее 400 тысяч файлов. Проблем с производительностью не замечено.

О ненадёжности файл-сервера Windows в локальной сети попрошу Вас рассказать с подробностями, а то вдруг десять лет беспроблемной работы сотни пользователей были всего лишь счастливой случайностью...
...
Рейтинг: 0 / 0
07.02.2015, 15:55
    #38873917
victorovich
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
Зачем тогда по вашему разрабатывают NoSQL-сервера? От нечего делать?
Я не собираюсь вам здесь ничего доказывать. Не можете посоветовать - просьба не писать.
Спасибо.
...
Рейтинг: 0 / 0
07.02.2015, 21:33
    #38874033
gandjustas
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
victorovichЗачем тогда по вашему разрабатывают NoSQL-сервера? От нечего делать?
Я не собираюсь вам здесь ничего доказывать. Не можете посоветовать - просьба не писать.
Спасибо.
"Зачем" это философский вопрос. Вы уверены что ваши цели и ограничения, полностью совпадают с целями и ограничениями, которые заложили разработчики баз?

Я вот не уверен что кто либо из них закладывал хранение миллиарда файлов по 100КБ (это ацки большой объем), более того, все известные мне NoSQL БД используют хранение данных в памяти компа и есл база превышает объем ОП, то работать это по сути перестает.

Поэтому для таких объемов ФС - идеальное хранилище. Главное весь миллиард в одну папку не валить.
...
Рейтинг: 0 / 0
07.02.2015, 22:20
    #38874043
nolocky
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
victorovichДобрый день.

Посоветуйте пожалуйста решение NoSQL исходя из моих требований:

1) хранилище должно размещаться в локальной сети (не в интернет-облаке типа Amazon)
2) сервер должен быть на винде (линукс не подходит)
3) будут храниться файлы размером ~100КБ-16МБ каждый
4) файлов может быть много (до 1 млн. новых в день)
5) нужна простая выборка key-value и возможность удаления старых файлов
6) интерфейс клиентского API - C/C++
7) чем проще и надежнее решение - тем лучше

Вроде как CouchBase подходит? или Oracle NoSQL?

Спасибо.

походу у автора дыра в голове и полное непонимание отличия файла от базы данных

в базе данных условно один файл на всё, остальное решается вопросами партицирования. партицирование по дню (отдельный файл бд для каждого дня) - это оок.

а вот тысячи файлов в день - за такое надо увольнять из отрасли, и принимать обратнотолько со сдачей экзаменов на вопрос ограничения количества файловых дескрипторов в системе.
...
Рейтинг: 0 / 0
08.02.2015, 18:13
    #38874213
victorovich
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
nolockyvictorovichДобрый день.

Посоветуйте пожалуйста решение NoSQL исходя из моих требований:

1) хранилище должно размещаться в локальной сети (не в интернет-облаке типа Amazon)
2) сервер должен быть на винде (линукс не подходит)
3) будут храниться файлы размером ~100КБ-16МБ каждый
4) файлов может быть много (до 1 млн. новых в день)
5) нужна простая выборка key-value и возможность удаления старых файлов
6) интерфейс клиентского API - C/C++
7) чем проще и надежнее решение - тем лучше

Вроде как CouchBase подходит? или Oracle NoSQL?

Спасибо.

походу у автора дыра в голове и полное непонимание отличия файла от базы данных

в базе данных условно один файл на всё, остальное решается вопросами партицирования. партицирование по дню (отдельный файл бд для каждого дня) - это оок.

а вот тысячи файлов в день - за такое надо увольнять из отрасли, и принимать обратнотолько со сдачей экзаменов на вопрос ограничения количества файловых дескрипторов в системе.

Как раз и нужно чтобы был один файл и не было превышения дескрипторов. Для этого и прошу посоветовать NoSQL БД чтобы не связываться с ФС, которые изначально не были разработаны под такие объемы и кол-ва.
Файлы будут постоянно удаляться, более млн. врядли будет, но и добавляться новые.
Для таких целей NoSQL и разработали.
Или я в форум по философии попал? :)
...
Рейтинг: 0 / 0
08.02.2015, 18:18
    #38874214
victorovich
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
Мог бы и сам такое написать чтобы в один файл все валило, но не хочется если уже есть хорошие готовые решения.
...
Рейтинг: 0 / 0
08.02.2015, 18:25
    #38874216
victorovich
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
Сейчас использую SQLite, и разбивку по часам. Каждый час - новый файл. По чтению меня скорость устраивает, а вот по записи беда, я так подозреваю что SQLite после каждой записи делать Flush, потому производительность очень низкая. Плюс сетевого интерфейса у него нет, а нужен.
...
Рейтинг: 0 / 0
09.02.2015, 09:08
    #38874430
Alexey Tomin
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
victorovichПосоветуйте пожалуйста решение NoSQL исходя из моих требований:

1) хранилище должно размещаться в локальной сети (не в интернет-облаке типа Amazon)
2) сервер должен быть на винде (линукс не подходит)
3) будут храниться файлы размером ~100КБ-16МБ каждый
4) файлов может быть много (до 1 млн. новых в день)
5) нужна простая выборка key-value и возможность удаления старых файлов
6) интерфейс клиентского API - C/C++
7) чем проще и надежнее решение - тем лучше


mongodb вроде подходит. Не знаю, как про "до 16Тб в день" (умножил размер файла на количество), тем более не знаю, какая винда это выдержит, но вроде как монгу используют для больших объёмов, в т.ч. Яндекс.
Файлы там в GridFS хранятся- виртуальная файловая система поверх БД.
...
Рейтинг: 0 / 0
09.02.2015, 11:31
    #38874573
Winnipuh
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
victorovichЗачем тогда по вашему разрабатывают NoSQL-сервера? От нечего делать?
Я не собираюсь вам здесь ничего доказывать. Не можете посоветовать - просьба не писать.
Спасибо.

Мало ли что разрабатывают и для каких целей.
Какой объем?

SQLite?
SQL Server?
cassandra

и т.д.
...
Рейтинг: 0 / 0
09.02.2015, 12:55
    #38874698
Alexander Ryndin
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
victorovich, не слушайте про файловую систему. Исследования говорят , что файловая система это не лучший способ хранения большого количества мелких файлов.
Вы правильно считаете, что вам нужна key-value база. Mongo, мне кажется, overkill. 90% функционала использовать не будете.
Oracle NoSQL в этом плане будет хорош - начинаете работать на бесплатно, а если станет бизнес-критикал, то берете поддержку. Да и вашим параметрам она удовлетворяте. Если не нужно распределенность, то BerkleyDB - это одноузловая версия Oracle NoSQL
...
Рейтинг: 0 / 0
09.02.2015, 17:03
    #38875005
victorovich
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
Да. Я прекрасно знаю что такое FS на низком уровне. Даже сам могу написать свою простейшую для такой задачи. Уж тем более знаком с NTFS, которая разрабатывалась лет 30 назад, когда и близко таких объемов и кол-ва не было. Куча мелких файлов на диске - это беда. Достаточно выполнить DIR C: /S и посмотреть на сколько повиснет, хотя это простой запрос типа SELECT name FROM Table
Относительно решений Oracle NoSQL / Berekley вопрос - можно ли их настроить так, чтобы кеширования почти не было и ОЗУ потребление сводилось бы к минимуму?
...
Рейтинг: 0 / 0
09.02.2015, 17:47
    #38875058
Alexander Ryndin
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
Посмотрите вот тут - может поможет?
https://docs.oracle.com/cd/E26161_02/html/AdminGuide/select-cache-strategy.html
...
Рейтинг: 0 / 0
10.02.2015, 15:37
    #38876036
Dimitry Sibiryakov
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
victorovichДостаточно выполнить DIR C: /S и посмотреть на сколько повиснет
Для уже вышеназванных почти 400к файлов на тормозном ноутбучном винте первый (холодный) запуск занял 4 минуты 19 секунд. Второй (с прогретым кэшем) - 52 секунды. Но какое отношение этот тест имеет к заявленному в стартовом посте "нужна простая выборка key-value"?..
...
Рейтинг: 0 / 0
11.02.2015, 05:24
    #38876499
victorovich
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
Dimitry SibiryakovvictorovichДостаточно выполнить DIR C: /S и посмотреть на сколько повиснет
Для уже вышеназванных почти 400к файлов на тормозном ноутбучном винте первый (холодный) запуск занял 4 минуты 19 секунд. Второй (с прогретым кэшем) - 52 секунды. Но какое отношение этот тест имеет к заявленному в стартовом посте "нужна простая выборка key-value"?..

Вы издеваетесь? Если у вас key выбирается только 4 минуты, а представьте если вы еще value (т.е. сами данные файла) начнете выбирать! Проведите такой эксперимент - очень простой: прочитайте все файлы с винта в "холодном кеше" c данными, заметьте время, а потом прочитайте по секторам весь логический диск С: подряд, чтобы кол-во секторов было сопоставимо с кол-вом данных всех ваших файлов (т.к. диск может не до конца быть забит). Увидите разницу. Вот второй способ - это примерно то, что будет в нормальном NoSQL-решении. Причины след. - дефрагментация самих файлов, что вызывает "бегание" головки жесткого диска (если он механический), а также структура FS не адаптированная для частых и больших выборок. Кеш конечно же есть, но не всегда он спасает, особенно если файлы обновляются.
Т.е. если я выбираю файлы в одной папке, то их поиск будет быстрее чем если они будут в азных папках на разных уровнях иерархии. А для key-value решения это не имеет значения.
В общем, если и дальше будете защищать NTFS как самое лучшее что есть на свете, то занимайтесь этим на другом сайте поклонников, но не в ветке форума NoSQL.
...
Рейтинг: 0 / 0
11.02.2015, 05:52
    #38876501
victorovich
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
Даже не так - неправильный эксперимент.
Лучше такой - постройте заранее список всех файлов на вашем диске через тот же dir /S, а потом на холодном кеше попробуйте обращаться к файлам в случайном порядке из этого списка и пройтись по всем. Читать данные файла даже не нужно, просто читайте, к примеру, дату его создания. И такой процесс у вас зависнет минут на 20 - не меньше. Связано с тем, что dir выбирает файлы по иерархии, что чуть быстрее случайного обращения к файлам. А в нормальной DB обращение может быть случайным и должном быть быстрым. Я с этим баловался даже на нескольких тысячах файлах - и результаты "производительности" NTFS+Windows меня просто поразили. Просто FS в основном не для таких задач.
...
Рейтинг: 0 / 0
31.03.2015, 08:11
    #38921834
MasterZiv
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
victorovichЗачем тогда по вашему разрабатывают NoSQL-сервера? От нечегог делать?


О, мужик, ты попал пальцем в небо. Именно по этой причине и разрабатывают NoSQL-сервера.
А знаешь, почему их потом используют?
...
Рейтинг: 0 / 0
31.03.2015, 11:04
    #38922071
DirksDR
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
MasterZivА знаешь, почему их потом используют?
Заинтриговал:)
...
Рейтинг: 0 / 0
31.03.2015, 11:45
    #38922152
MasterZiv
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
DirksDRMasterZivА знаешь, почему их потом используют?
Заинтриговал:)

не, пока ТС не спросит, не скажу...
...
Рейтинг: 0 / 0
31.03.2015, 18:14
    #38923051
Winnipuh
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
MasterZivDirksDRпропущено...

Заинтриговал:)

не, пока ТС не спросит, не скажу...

даладно! может он стесняется

итак?
...
Рейтинг: 0 / 0
06.04.2015, 20:13
    #38928508
GVF112GVF
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Посоветуйте NoSQL DB
victorovich,

Посмотрите второй раздел - http://public.dhe.ibm.com/common/ssi/ecm/en/imm14164usen/IMM14164USEN.PDF

С уважением,
Вадим.
...
Рейтинг: 0 / 0
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Посоветуйте NoSQL DB / 23 сообщений из 23, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]