Какое решение выбрать? / NoSQL, Big Data

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Какое решение выбрать?

9 сообщений из 9, страница 1 из 1

Какое решение выбрать?

#39479943

alexzf

Гость

Всем привет! Я с big data проекты в глаза не видел, но чисто лично для себя интересно выяснить вот такую архитектуру.

Есть машины они генерят кучу данных, к примеру за неделю 100гб текстовых данных, все эти данные классифицируются на определенные метки и записываются в БД (соотношение для этого хранилища insert / select / delete примерно такой 10% / 85% / 5%. ). Далее некии модули получают эти данные и обробатывают складывают в реляционную БД.

Для хранения всех жтих файлов хочу выбрать hbase. То есть машина генерит файл , демоны грузят эти данные в hbase и уже приложения работают с hbase.

Или просто все это дело в MongoDb настроить replica set и не париться.

Кто как бы поступил? Очень интересно.

...

Рейтинг:

0 / 0

29.06.2017, 19:35

| Ответить | Цитировать | Написать

Какое решение выбрать?

#39479947

Дедушка

Участник

Откуда: Город трёх революций

Сообщения: 4 572

Рейтинг: 0 / 0

alexzfДалее некии модули получают эти данные и обробатывают складывают в реляционную БД.что мешает файлики с диска обрабатывать\складывать (ETL) в реляционную БД?

...

Рейтинг:

0 / 0

29.06.2017, 19:44

| Ответить | Цитировать | Написать

Какое решение выбрать?

#39479974

alexzf

Гость

Дедушка,

Да это имеет место, но меня не устраивает скорость записи в таблицу, я конечно не пакетной записью пользовался, а простыми инсертами.

Конечно можно использовать postgresql а будет ли он справляться с селектами по инстансу размером в 200-300 тб?

Скорость выборки тут приоритетней.

...

Рейтинг:

0 / 0

29.06.2017, 20:54

| Ответить | Цитировать | Написать

Какое решение выбрать?

#39479998

Критик

Участник

Откуда: Москва / Калуга

Сообщения: 35 963

Рейтинг: 0 / 0

alexzfКонечно можно использовать postgresql а будет ли он справляться с селектами по инстансу размером в 200-300 тб?

вы выше писали о 100Гб в неделю, это всего 5 Тб в год, с которыми справится почти любая СУБД при наличии правильных рук,
и потом вдруг откуда-то появляются 200-300 Тб

с учетом, что 1Тб enterprise дискового пространства стоит $10 тыс, то вы только за диски отдадите $2-3 млн, а с таким бюджетом на форумах не спрашивают )

...

Рейтинг:

0 / 0

29.06.2017, 21:51

| Ответить | Цитировать | Написать

Какое решение выбрать?

#39480001

Критик

Участник

Откуда: Москва / Калуга

Сообщения: 35 963

Рейтинг: 0 / 0

alexzf,

тут сравнение обычных СУБД для 100 млн строк на обычных машинах, время измеряется считанными минутами

http://www.sql.ru/forum/1222372-a/agregaciya-dannyh-100-mln-strok

...

Рейтинг:

0 / 0

29.06.2017, 21:55

| Ответить | Цитировать | Написать

Какое решение выбрать?

#39480249

alexzf

Гость

Критик,

Пардон, все верно 2-3 Тб, опечатался.
Я не знаю по ценам по интерпрайс решениям, но ibm блюмиксы по 3тб и 48 ядер есть.

Решение ETL и после выборка по этим данным конечно же мне больше нравится чем пользование HDP и в ту степь, но вот я может быть с постгресом что то не так делаю, все пишется медленно.

...

Рейтинг:

0 / 0

30.06.2017, 11:17

| Ответить | Цитировать | Написать

Какое решение выбрать?

#39480250

alexzf

Гость

alexzf,

На локальном сервере в 8 ядер и 32ram ssd

...

Рейтинг:

0 / 0

30.06.2017, 11:18

| Ответить | Цитировать | Написать

Какое решение выбрать?

#39480628

Критик

Участник

Откуда: Москва / Калуга

Сообщения: 35 963

Рейтинг: 0 / 0

alexzf,

тут спросите по нему
http://www.sql.ru/forum/postgresql

...

Рейтинг:

0 / 0

30.06.2017, 18:58

| Ответить | Цитировать | Написать

Какое решение выбрать?

#39499602

buven

Участник

Сообщения: 690

Рейтинг: 0 / 0

alexzf,

Учитывая вводную:
alexzf Далее некии модули получают эти данные и обробатывают складывают в реляционную БД.
и причину выбора:
alexzf но меня не устраивает скорость записи в таблицу
Стесняюсь спросить... А когда у вас commit при таком раскладе?

...

Рейтинг:

0 / 0

03.08.2017, 12:17

| Ответить | Цитировать | Написать

9 сообщений из 9, страница 1 из 1

Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Какое решение выбрать?

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=48&fpage=5&tid=1856673]:	0ms
get settings:	9ms
get forum list:	11ms
check forum access:	3ms
check topic access:	3ms
track hit:	54ms
get topic data:	11ms
get forum data:	2ms
get page messages:	46ms
get tp. blocked users:	1ms
others:	14ms

total:	154ms