Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Какое решение выбрать? / 9 сообщений из 9, страница 1 из 1
29.06.2017, 19:35
    #39479943
alexzf
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение выбрать?
Всем привет! Я с big data проекты в глаза не видел, но чисто лично для себя интересно выяснить вот такую архитектуру.

Есть машины они генерят кучу данных, к примеру за неделю 100гб текстовых данных, все эти данные классифицируются на определенные метки и записываются в БД (соотношение для этого хранилища insert / select / delete примерно такой 10% / 85% / 5%. ). Далее некии модули получают эти данные и обробатывают складывают в реляционную БД.

Для хранения всех жтих файлов хочу выбрать hbase. То есть машина генерит файл , демоны грузят эти данные в hbase и уже приложения работают с hbase.

Или просто все это дело в MongoDb настроить replica set и не париться.

Кто как бы поступил? Очень интересно.
...
Рейтинг: 0 / 0
29.06.2017, 19:44
    #39479947
Дедушка
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение выбрать?
alexzfДалее некии модули получают эти данные и обробатывают складывают в реляционную БД.что мешает файлики с диска обрабатывать\складывать (ETL) в реляционную БД?
...
Рейтинг: 0 / 0
29.06.2017, 20:54
    #39479974
alexzf
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение выбрать?
Дедушка,

Да это имеет место, но меня не устраивает скорость записи в таблицу, я конечно не пакетной записью пользовался, а простыми инсертами.

Конечно можно использовать postgresql а будет ли он справляться с селектами по инстансу размером в 200-300 тб?

Скорость выборки тут приоритетней.
...
Рейтинг: 0 / 0
29.06.2017, 21:51
    #39479998
Критик
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение выбрать?
alexzfКонечно можно использовать postgresql а будет ли он справляться с селектами по инстансу размером в 200-300 тб?

вы выше писали о 100Гб в неделю, это всего 5 Тб в год, с которыми справится почти любая СУБД при наличии правильных рук,
и потом вдруг откуда-то появляются 200-300 Тб

с учетом, что 1Тб enterprise дискового пространства стоит $10 тыс, то вы только за диски отдадите $2-3 млн, а с таким бюджетом на форумах не спрашивают )
...
Рейтинг: 0 / 0
29.06.2017, 21:55
    #39480001
Критик
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение выбрать?
alexzf,

тут сравнение обычных СУБД для 100 млн строк на обычных машинах, время измеряется считанными минутами

http://www.sql.ru/forum/1222372-a/agregaciya-dannyh-100-mln-strok
...
Рейтинг: 0 / 0
30.06.2017, 11:17
    #39480249
alexzf
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение выбрать?
Критик,

Пардон, все верно 2-3 Тб, опечатался.
Я не знаю по ценам по интерпрайс решениям, но ibm блюмиксы по 3тб и 48 ядер есть.

Решение ETL и после выборка по этим данным конечно же мне больше нравится чем пользование HDP и в ту степь, но вот я может быть с постгресом что то не так делаю, все пишется медленно.
...
Рейтинг: 0 / 0
30.06.2017, 11:18
    #39480250
alexzf
Гость
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение выбрать?
alexzf,

На локальном сервере в 8 ядер и 32ram ssd
...
Рейтинг: 0 / 0
30.06.2017, 18:58
    #39480628
Критик
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение выбрать?
alexzf,

тут спросите по нему
http://www.sql.ru/forum/postgresql
...
Рейтинг: 0 / 0
03.08.2017, 12:17
    #39499602
buven
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Какое решение выбрать?
alexzf,

Учитывая вводную:
alexzf Далее некии модули получают эти данные и обробатывают складывают в реляционную БД.
и причину выбора:
alexzf но меня не устраивает скорость записи в таблицу
Стесняюсь спросить... А когда у вас commit при таком раскладе?
...
Рейтинг: 0 / 0
Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Какое решение выбрать? / 9 сообщений из 9, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]