powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / Хранение большого количества мелкий файлов
25 сообщений из 25, страница 1 из 1
Хранение большого количества мелкий файлов
    #38479457
Devider
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Добрый день.

Есть необходимость хранить большие объемы файлов (картинок) размером до 100 kb из ограниченного (до тысяч) списка источников. Источники объединяются в группы. Файлы привязаны ко времени занесения в базу. Выбираться данные будут по источнику за указанный период. Посоветуйте плз, как организовать это хозяйство. Рабочая версия - кассандра, но картина в голове не выстраивается.
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38479849
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Загружай картинки в BLOBы.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38480168
Devider
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Блобы в смысле в обычной таблице РСУБД?
Этих блобов может быть достаточно много. Теоретически рост может быть десятки мегабайт в секунду. И соотношение записи к чтению я вижу порядка 90/10, а то и больше. Честно говоря, до сих пор использовал БД "традиционным" способов и не набивал их так бинарями. Не очень себе представляю, как она себя поведет.
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38480174
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DeviderЭтих блобов может быть достаточно много. Теоретически рост может быть
десятки мегабайт в секунду.
Хреновая у тебя теория. На десятки мегабайт в секунду не хватит пропускной способности сети.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38480650
sphinx_mv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dimitry SibiryakovDeviderЭтих блобов может быть достаточно много. Теоретически рост может быть
десятки мегабайт в секунду.
Хреновая у тебя теория. На десятки мегабайт в секунду не хватит пропускной способности сети.
Уж кто бы говорил!
В-обсчем, учись, студент:
wide area networks bitrate
local area networks bitrate
wireless networks bitrate
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38480671
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
sphinx_mvВ-обсчем, учись, студент:
Ты эта... Начни уже отличать мегабиты от мегабайтов.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38480825
sphinx_mv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dimitry Sibiryakovsphinx_mvВ-обсчем, учись, студент:
Ты эта... Начни уже отличать мегабиты от мегабайтов.
Маразм крепчает?
А просто поделить (на калькуляторе, если по другому не получается) 100, ладно... пусть не 100, а хотя бы 80 мегабит в секунду ( "fast ethernet" , который 100BASE-TX, 1995 год) на 8 бит (которые в одном байте) не судьба? А еще бывает и 1000 мегабит в секунду ( gigabit ethernet , 1998 год)... И это - далеко не самые большие цифры даже для "ширпотреба".

Кстати, если кто-то почему-то "не заметил" - в табличках по ранее приведенной ссылке даже есть колонка "байты в секунду"...

В-обсчем, скромные "десятки мегабайт в секунду", о которых упоминал ТС, совершенно не представляют собой проблемы пропускной способности даже для сети, построенной на технолоиях прошлого века...
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38480843
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
sphinx_mvА просто поделить (на калькуляторе, если по другому не получается) 100,
ладно... пусть не 100, а хотя бы 80 мегабит в секунду ("fast ethernet", который
100BASE-TX, 1995 год) на 8 бит (которые в одном байте) не судьба?
Не судьба. Потому что некоторые (в отличии от...) знают не только число бит в байте, но и
другие обстоятельства, делающие жизнь совсем не так радужной.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38480878
Фотография ScareCrow
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
авторВ-обсчем, скромные "десятки мегабайт в секунду", о которых упоминал ТС, совершенно не представляют собой проблемы пропускной способности даже для сети, построенной на технолоиях прошлого века...
вопрос на засыпку 100 мегабил локальная сеть это сколько мегабайт?
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38480881
Зайцев Фёдор
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dimitry Sibiryakovдругие обстоятельства, делающие жизнь совсем не так радужной.
Погода неважнецкая, Валя из бухгалтерии отшивает, и т.д. - всё это действительно бывает.
Но как это ограничивает возможности сети? Или речь идёт о какой-то конкретной сети?
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38480898
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Зайцев Фёдоркак это ограничивает возможности сети?
Данные в БД передаются не на Ethernet уровне.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38480902
sphinx_mv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dimitry Sibiryakovsphinx_mvА просто поделить (на калькуляторе, если по другому не получается) 100,
ладно... пусть не 100, а хотя бы 80 мегабит в секунду ("fast ethernet", который
100BASE-TX, 1995 год) на 8 бит (которые в одном байте) не судьба?
Не судьба. Потому что некоторые (в отличии от...) знают не только число бит в байте, но и
другие обстоятельства, делающие жизнь совсем не так радужной.
К пропускной способности сети эти "нерадужные обстоятельства" не имеют практически никакого отношения - до "вообще" включительно!

Напоминаю: про "проблемы" с передачей больших объемов "разнокалиберной" информации Вы пытаетесь рассказывать очень близко с этим связанному сотруднику телекоммуникационной компании. А у нас (даже без использования колокэйшена) клиенту в-легкую предоставляют пару сотен реальных мегабит в секунду между удаленными офисами даже не в пределах одного города. Чем клиент это "наполнит" - проблема клиента. А от нас должен быть предоставлен стабильный канал, в котором биты и байты связаны простым математическим соотношением "8-к-1". Вот такая у нас "радужная реальность", однако. :)
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38480912
Зайцев Фёдор
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dimitry SibiryakovЗайцев Фёдоркак это ограничивает возможности сети?
Данные в БД передаются не на Ethernet уровне.
И это полностью исключает любую возможность передавать десятки мегабайт в секунду? 5 десятков - это десятки?
Народный суд запретил ТС использовать несколько сетевых интерфейсов?

Я не понимаю.
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38480923
sphinx_mv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dimitry SibiryakovЗайцев Фёдоркак это ограничивает возможности сети?
Данные в БД передаются не на Ethernet уровне.
Поставить дисковую систему по-шустрее, не пробовали? Процессор более адекватный? Оперативной памяти достаточно? А операционную систему тюнить?

ЗЫ. И как интересно стрелочки переехали с пропускной способности сети на производительность всего сервера "в сборе"...
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38480927
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Зайцев ФёдорИ это полностью исключает любую возможность передавать десятки мегабайт
в секунду? 5 десятков - это десятки?
Десятки, десятки. Вот только для этих десятков нужен гигабитный Ethernet и протокол уровня
приложения сильно плотнее чем SMB, поскольку SMB на гигабите даёт только порядка 30
мегабайт в секунду. А протоколы СУБД обычно ещё менее эффективны из-за привычки к полному
квитированию.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38480960
Зайцев Фёдор
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dimitry Sibiryakov
это всё понятноДесятки, десятки. Вот только для этих десятков нужен гигабитный Ethernet и протокол уровня
приложения сильно плотнее чем SMB, поскольку SMB на гигабите даёт только порядка 30
мегабайт в секунду. А протоколы СУБД обычно ещё менее эффективны из-за привычки к полному
квитированию.

, но я только что получил 45 Мб/сек. mssql server 2008, AMD A4 3400, 9999 файлов по 166Кб
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38480972
Зайцев Фёдор
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dimitry Sibiryakovпоскольку SMB на гигабите даёт только порядка 30 мегабайт в секунду
У меня не получается копировать файлы медленее, чем 90 Мб/сек. Надеюсь, это не признак неисправности, т.к. гарантия уже закончилась )
Получается, либо я копирую по какому-то другому протоколу, либо утверждение "...SMB на гигабите..." противоречит действительности
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38481537
Аноним321
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Зайцев Фёдор, 90 Мбит/c ~ 11 МегаБайт/c гордится нечем.
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38481567
Зайцев Фёдор
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Аноним321Зайцев Фёдор, 90 Мбит/c ~ 11 МегаБайт/c гордится нечем.
90 МБ, доволен? забыл как правильно пишется единица )
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38485082
Leonid Kudryavtsev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Два вопроса:
1. А у меня копирование по сети выдало 112 MB в секунду (счетчик в FAR'е). Кто больше?
2. Какое это имеет отношение к вопросу автора?

Devider....Честно говоря, до сих пор использовал БД "традиционным" способов и не набивал их так бинарями. Не очень себе представляю, как она себя поведет.
А какие проблемы? Информация она и есть информация.

Единственное, я когда проектировал табличку с блобами складывал в отдельный tablespace и блобы хранил отдельно от данных. См. доку БД. "Как поведет" и скорость на конкретной СУБД и конкретном железе нужно наверное банально мерить. Особенно, если есть понимание о характере нагрузки.

Соглашусь с Dimitry Sibiryakov, 10 мегабайт в секунду рост БД IMHO не мало - 10 МБ в сек, это 36 Gb в час, 288 Gb за 8 часовой рабочий день.... ))) Куда Вы это складывать планируете? Плюс еще redo-log'ов (в случае Oracle) не меньше (если не больше) будет создаваться.

Достоинства - транзакции, поиск по индексам, надежность.

Нет проблемы, что при каких либо падениях софта, останутся временные файлы на сервере, не подключенные к БД. Пока в нашей системе информация хранилась как файл + ссылка из БД - в реальных системах, которые работали годами, всегда были проблемы: часть файлов отсутствует, какие-то левые файлы и целые директории и т.д. Не критично конечно, но и не особо приятно. В БД транзакционность и таких проблем не может/не должно быть. Плюс залезть шаловливыми ручками и что-то удалить - тяжелее.
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38485242
AAron
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
а точно нужна СУБД?
может нужен высокопроизводительный NAS? с подключением к серверу 10GB.

у нас немного другая задача - генерация отчетов для массы заказчиков в pdf и html. раскладываем по файлам. ориентировочно - 15-20млн файлов. скорость выдачи

и еще по пропускной способности - Exadata, общение между ячейками до 80mbs по infiniband'у.


так что... вопрос системной архитектуры...
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38485244
Alexander Ryndin
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AAronи еще по пропускной способности - Exadata, общение между ячейками до 80mbs по infiniband'у.
до 80 gbs?
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38485250
AAron
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AAron,

скорость выдачи - не дописал. количество пользователей - 200тыс+, одновременно использующих отчеты - 2-3 тыс.
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38487993
AAron
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Alexander Ryndin,

конечно ;))
...
Рейтинг: 0 / 0
Хранение большого количества мелкий файлов
    #38534546
Dima T
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Elliptics как раз для таких целей придумано. Яндекс его пользует
...
Рейтинг: 0 / 0
25 сообщений из 25, страница 1 из 1
Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / Хранение большого количества мелкий файлов
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]