Выбор СУБД для хранения болшого кол-ва XML / NoSQL, Big Data

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Выбор СУБД для хранения болшого кол-ва XML

11 сообщений из 11, страница 1 из 1

Выбор СУБД для хранения болшого кол-ва XML

#39462265

Gemorroj

Гость

Нужно хранить очень много xml данных (размер от 3кб до 2мб, avg 40 кб).
Максимально до 35 миллиардов записей всего в схеме. В день по 1 млн записей.
В схему будет идти постоянный инсерт и редкая выборка по id.

Нужно определиться где хранить данные.
Удобно было бы в postgres, т.к. остальные данные тоже в нем + понятно как масштабировать/реплицировать/шардировать/секционировать. Но не уверен на счет регрессии в производительности на таком типе данных и таких объемах.
Как альтернативу рассматриваю MongoDB+GridFS.

Был бы признателен за совет в какую сторону смотреть, может кто-нибудь поделится опытом работы со схожими условиями.

...

Рейтинг:

0 / 0

30.05.2017, 13:25

| Ответить | Цитировать | Написать

Выбор СУБД для хранения болшого кол-ва XML

#39462277

Gemorroj

Гость

в нулях запутался)
в день 10 млн инсертов,
всего 3.6 млрд записей.

...

Рейтинг:

0 / 0

30.05.2017, 13:42

| Ответить | Цитировать | Написать

Выбор СУБД для хранения болшого кол-ва XML

#39462284

Dimitry Sibiryakov

Участник

Сообщения: 54 521

Рейтинг: 0 / 0

GemorrojВ схему будет идти постоянный инсерт и редкая выборка по id.
По-моему, это отличный случай для простой файловой системы. А DFS, например, ещё и шардинг с репликацией обеспечит.

...

Рейтинг:

0 / 0

30.05.2017, 13:47

| Ответить | Цитировать | Написать

Выбор СУБД для хранения болшого кол-ва XML

#39462382

Дедушка

Участник

Откуда: Город трёх революций

Сообщения: 4 572

Рейтинг: 0 / 0

Gemorroj,

- действительно нужно хранить именно XML?
- действительно нужно "В схему будет идти постоянный инсерт" или можно инсертить "отдельно"?

...

Рейтинг:

0 / 0

30.05.2017, 15:00

| Ответить | Цитировать | Написать

Выбор СУБД для хранения болшого кол-ва XML

#39462403

Gemorroj

Гость

Дедушка,

- да, именно xml. это исходные подписанные данные. распаршенные данные из этих xml хранятся отдельно.
- имеется ввиду 2 схемы, в 1 инсерт, а во вторую копирование из 1 по расписанию?

...

Рейтинг:

0 / 0

30.05.2017, 15:19

| Ответить | Цитировать | Написать

Выбор СУБД для хранения болшого кол-ва XML

#39462420

DPH3

Участник

Сообщения: 524

Рейтинг: 0 / 0

Gemorroj,

А в чем проблема с постгресом? Дать достаточно диска для хранения, все равно все данные будут хранится в TOASTе, а поиск будет по ключам. Так что не вижу особых проблем на такой объем.
Да и вообще, можно поставить эксперимент с каким-нибудь терабайтником, это будет точнее всего.

...

Рейтинг:

0 / 0

30.05.2017, 15:30

| Ответить | Цитировать | Написать

Выбор СУБД для хранения болшого кол-ва XML

#39462446

Gemorroj

Гость

DPH3,

К сожалению, нет тестового стенда для полноценного эксперимента.
В тестах на 2 млн записей монга и постгрес показывают одинаково хорошие результаты.
Но экстраполировать их на 3 млрд было бы неверным.
---
"в чем проблема с постгресом?" - нет опыта работы с такими объемами, хочу 7 раз отмерять.

...

Рейтинг:

0 / 0

30.05.2017, 15:52

| Ответить | Цитировать | Написать

Выбор СУБД для хранения болшого кол-ва XML

#39462586

Критик

Участник

Откуда: Москва / Калуга

Сообщения: 35 963

Рейтинг: 0 / 0

ну, 100 млн-то можете протестировать?

...

Рейтинг:

0 / 0

30.05.2017, 17:44

| Ответить | Цитировать | Написать

Выбор СУБД для хранения болшого кол-ва XML

#39462701

Yo.!

Гость

GemorrojВ схему будет идти постоянный инсерт и редкая выборка по id.

hadoop+hbase. две колонки, одна id, другая сам xml. может даже разумней по пути во что-то типа avro конвертить

...

Рейтинг:

0 / 0

30.05.2017, 22:41

| Ответить | Цитировать | Написать

Выбор СУБД для хранения болшого кол-ва XML

#39463686

Gemorroj

Гость

Критик,

100 млн тоже без каких-либо видимых проблем.

...

Рейтинг:

0 / 0

01.06.2017, 11:37

| Ответить | Цитировать | Написать

Выбор СУБД для хранения болшого кол-ва XML

#39475919

chernolyas

Участник

Сообщения: 69

Рейтинг: 0 / 0

Gemorroj,

http://exist-db.org/exist/apps/homepage/index.html или http://basex.org/ не подойдет?

...

Рейтинг:

0 / 0

22.06.2017, 07:29

| Ответить | Цитировать | Написать

11 сообщений из 11, страница 1 из 1

Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Выбор СУБД для хранения болшого кол-ва XML

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=48&fpage=5&tid=1856683]:	0ms
get settings:	8ms
get forum list:	11ms
check forum access:	3ms
check topic access:	3ms
track hit:	167ms
get topic data:	12ms
get forum data:	3ms
get page messages:	47ms
get tp. blocked users:	1ms
others:	12ms

total:	267ms