Агрегирование данных sql через kafka в mongodb / NoSQL, Big Data

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Агрегирование данных sql через kafka в mongodb

9 сообщений из 9, страница 1 из 1

Агрегирование данных sql через kafka в mongodb

#39598084

mr_max

Участник

Сообщения: 1 306

Рейтинг: 0 / 0

Задача:
данные с устройств записываются в sql server каждые 5 сек. Эти данные могу быть с одинаковыми значениями идти.
Хотелось бы отправлять эти данные в поток kafka, обрабатывать их и ложить в Mongodb уже данные без одинаковых значений
SQL Пример:

авторDate Value
07.02.2018 12:11:10 13.12
07.02.2018 12:11:15 13.12
07.02.2018 12:11:20 13.12
07.02.2018 12:11:25 16.28
07.02.2018 12:11:25 16.28
07.02.2018 12:11:25 16.28

=>
MongoDB:
07.02.2018 12:11:10 13.12
07.02.2018 12:11:25 16.28

Подскажите в какую сторону копать?

...

Рейтинг:

0 / 0

07.02.2018, 12:13

| Ответить | Цитировать | Написать

Агрегирование данных sql через kafka в mongodb

#39598154

Дедушка

Участник

Откуда: Город трёх революций

Сообщения: 4 572

Рейтинг: 0 / 0

какова допустимая задержка между актуальностью данных в сиквеле и монге?

для начала почитайте про сопряжение сиквела и кафки подходит ли вам.

...

Рейтинг:

0 / 0

07.02.2018, 13:23

| Ответить | Цитировать | Написать

Агрегирование данных sql через kafka в mongodb

#39598191

mr_max

Участник

Сообщения: 1 306

Рейтинг: 0 / 0

Дедушкакакова допустимая задержка между актуальностью данных в сиквеле и монге?

для начала почитайте про сопряжение сиквела и кафки подходит ли вам.
Да подходит, сейчас уже это работает и очень хорошо.
Задержка не более 3 сек.
Мне бы понять каким способом делать агрегацию, возможно с помощью спарка в отдельную таблицу sql и её уже посылать в поток, либо есть какие-то возможности у кафки, кто что знает?

...

Рейтинг:

0 / 0

07.02.2018, 13:58

| Ответить | Цитировать | Написать

Агрегирование данных sql через kafka в mongodb

#39598635

fixxer

Участник

Сообщения: 805

Рейтинг: 0 / 0

mr_max,

логично было бы кафку перед сиквелем поставить и читать с нее как в сиквель, так и в монгу. перед монгой поставить аггрегатор, либо на базе кафка стримз, либо какой другой стрим процессинг.

...

Рейтинг:

0 / 0

08.02.2018, 00:11

| Ответить | Цитировать | Написать

Агрегирование данных sql через kafka в mongodb

#39598849

Критик

Участник

Откуда: Москва / Калуга

Сообщения: 35 963

Рейтинг: 0 / 0

может просто индекс создать в сиквеле?
с опцией: IGNORE_DUP_KEY = ON

...

Рейтинг:

0 / 0

08.02.2018, 12:04

| Ответить | Цитировать | Написать

Агрегирование данных sql через kafka в mongodb

#39598851

mr_max

Участник

Сообщения: 1 306

Рейтинг: 0 / 0

Критикможет просто индекс создать в сиквеле?
с опцией: IGNORE_DUP_KEY = ON
в SQL хотят, чтобы хранилась вся картина.
И там не совсем одинаковые значения.
там дробные значения
5.565
5.567
5.568

и такие вот значения можно было бы схлопнуть.

...

Рейтинг:

0 / 0

08.02.2018, 12:07

| Ответить | Цитировать | Написать

Агрегирование данных sql через kafka в mongodb

#39598900

Дедушка

Участник

Откуда: Город трёх революций

Сообщения: 4 572

Рейтинг: 0 / 0

Дедушкасопряжение сиквела и кафки подходит ли вам.mr_maxДа подходит, сейчас уже это работает и очень хорошо.тогда вам выше уже посоветовали... смотрите в сторону кафка стримс

...

Рейтинг:

0 / 0

08.02.2018, 12:57

| Ответить | Цитировать | Написать

Агрегирование данных sql через kafka в mongodb

#39598946

mr_max

Участник

Сообщения: 1 306

Рейтинг: 0 / 0

Дедушка,

Но у меня уже кафка стримс стоит, которая копирует тупо данные из одной базы в другую.
Теперь как настроить стрим на аггрегацию, так как я предложили или есть более изящный способ?

...

Рейтинг:

0 / 0

08.02.2018, 13:35

| Ответить | Цитировать | Написать

Агрегирование данных sql через kafka в mongodb

#39600057

Критик

Участник

Откуда: Москва / Калуга

Сообщения: 35 963

Рейтинг: 0 / 0

mr_max,

как вариант, можно рассмотреть Microsoft StreamInsight, раз у вас там все равно есть MS SQL
https://msdn.microsoft.com/ru-ru/library/ee391416(v=sql.111).aspx

...

Рейтинг:

0 / 0

10.02.2018, 18:03

| Ответить | Цитировать | Написать

9 сообщений из 9, страница 1 из 1

Форумы / NoSQL, Big Data [игнор отключен] [закрыт для гостей] / Агрегирование данных sql через kafka в mongodb

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=48&msg=39598851&tid=1856639]:	0ms
get settings:	10ms
get forum list:	14ms
check forum access:	4ms
check topic access:	4ms
track hit:	47ms
get topic data:	13ms
get forum data:	3ms
get page messages:	51ms
get tp. blocked users:	2ms
others:	320ms

total:	468ms