QuestDB - новая СУБД для хранения time series данных / Сравнение СУБД

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / QuestDB - новая СУБД для хранения time series данных

25 сообщений из 239, страница 9 из 10

все

QuestDB - новая СУБД для хранения time series данных

#39935732

bluestreak

Гость

[quot kealon(Ruslan)#22095712]

bluestreak

это однопроходная формула
если имелась ввиду avg(x — avg(y))

Ну это одно и тоже с точки зрения вычислений. Так же? Необходим заранее вычисленный агрегат чтобы делать вычисления для каждого значения «х». Можно ещё более наглядно сделать: sum(( x-avg(x))*(x-avg(x))) . Это variance. avg(x) это проход 1 остальное проход 2.

Ещё всякие vwap и тд

...

Рейтинг:

0 / 0

09.03.2020, 21:47

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39935742

ъъъъъ

Гость

bluestreak

UDP полезен в сборе метрик. Простая отправка и отправляющая система не замедляется базой.

Можно ещё данные отправлять не после каждого "изменения метрик", а лишь каждый 10й раз. Какая разница, по какой причине данные потерялись, зато отправляющая система не замедляется.

...

Рейтинг:

0 / 0

09.03.2020, 22:40

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39935750

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 0 / 0

Думаю что топик тематически связан с https://www.sql.ru/forum/1323115/proektirovanie-sistemy-sbora-geolokacionnyh-dannyh

Попробуйте автору предложить этот продукт. Заодно потренируетесь в обсуждении практических вопросов.

...

Рейтинг:

0 / 0

09.03.2020, 23:23

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39935762

bluestreak

Гость

mayton

Спасибо!

...

Рейтинг:

0 / 0

10.03.2020, 01:32

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39935768

bluestreak

Гость

ъъъъъ

bluestreak

UDP полезен в сборе метрик. Простая отправка и отправляющая система не замедляется базой.

Это зависит от системы. Если задача системы это не терять метрики, то нужно конечно использовать надежный протокол. Можно TCP - это просто, надежно но медленно. Можно сохранять метрики у источника и использовать UDP с NACK. При сбалансированных pub-sub может ретрансмиссий либо не быть либо очень мало. И таким образом нагрузка на сеть и cpu будет меньше.

В системах у которых метрики не основной вид деятельности UDP и потери вполне приемлемы. Например вы хотите отменить теряющий деньги заказ а торговая система ожидает подтверждения получения метрики от системы которая строит графики на которые никто не смотрит. В таком случае наверно лучше перестать терять деньги чем пропустить пиксель на графике.

...

Рейтинг:

0 / 0

10.03.2020, 01:47

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39942126

Бумбараш

Участник

Откуда: никем не победимая, самая любимая

Сообщения: 1 090

Рейтинг: 0 / 0

bluestreak,

знаешь что-нибудь про shakti database?
https://shakti.com

её делают создатели kdb, замутили новую контору. Что-нибудь слышно об их внедрениях в индустрии, есть ли успехи?
может у тебя есть инфа какая

...

Рейтинг:

0 / 0

30.03.2020, 01:39

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39942385

bluestreak

Гость

Бумбараш

Слышал и поверхностно изучал. О применениях не слышал, КДБ засела во всех банках и версию 4 недавно сделала, вариантов мало. Если честно то я смысла в шакти особого не вижу. Все проблемы с распространением КДБ перенесли вербатим в шакти. Впечатление такое что Артуру Уитли от скуки делать нечего — в first derivative засела бюрократия от которой он хочет освободить от неё свой любимый язык.

Они говорят что SIMD использует, но КДБ тоже как и другие проекты и наш в том числе. Ничего нового. Закрытый код тоже, красота, даже туториал закрыли.

...

Рейтинг:

0 / 0

30.03.2020, 23:37

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39942387

bluestreak

Гость

https://news.ycombinator.com/item?id=19418570

sannysannof подсуммировал

...

Рейтинг:

0 / 0

30.03.2020, 23:42

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39942405

Бумбараш

Участник

Откуда: никем не победимая, самая любимая

Сообщения: 1 090

Рейтинг: 0 / 0

увидел там, что с ними работает некто Саня Белопольский, который написал pyq

не в курсах про pyq, но он сам интересный дядя оказался

https://observer.com/2009/05/alexander-belopolsky-billionaire-jim-simons-old-foe-gets-5-m-condo/

прямо Серёжей Олейниковым повеяло

...

Рейтинг:

0 / 0

31.03.2020, 04:08

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39942478

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 0 / 0

Бумбараш

Если это - космический корабль - то и обсуждаеть его невозможно просто в топике Сравнения СУБД.
(система по сложности близка к операционке) Мы - что-то потеряем или не учтём. Если обсуждать
ЕГО СУБД то ее надо вычленить и проанализировать.

Вобщем. Не вижу смысла я здесь равивать идею шакти.

...

Рейтинг:

0 / 0

31.03.2020, 11:18

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39943350

bluestreak

Гость

Сегодня мы выпустили ещё одно обновление:

QuestDB 4.2.0 — текст на английском https://github.com/questdb/questdb/releases/tag/4.2.0

Это первая версия в которой появилась возможность выполнять запросы с помощью SIMD и параллельных вычислений. Мы начали с простецких запросов, таких как агрегация без ключей

Код: plaintext

select avg(x) from tab

.

Данные разбиваются на сегменты, которые обрабатываются SIMD инструкциям одновременно. Так же несколько функций выполняются параллельно, в таких запросах как

Код: plaintext

select sum(a), avg(b), min(c) from tab

.

Производительность таких вычислений достаточно высокая. Например миллиард double значений агрегируется за 290мс на прочессорах с двумя каналами памяти и 100мс с шестью каналами. Один канал памяти полностью утилизируется двумя тредами.

По сравнению с нашим самым быстрым конкурентом — KDB, QuestDB в два раза быстрее на вышеописанной агрегации. Агрегация сравнима по скорости с параллельным суммированием простого массива в языках Julia и rust.

QuestDB доступна бесплатно и по Apache 2.0 лицензии, так что скачивайте пробуйте и комментируйте.

...

Рейтинг:

0 / 0

03.04.2020, 01:25

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39943384

kealon(Ruslan)

Участник

Откуда: Нижневартовск

Сообщения: 4 020

Рейтинг: 0 / 0

bluestreak

Данные разбиваются на сегменты, которые обрабатываются SIMD инструкциям одновременно. Так же несколько функций выполняются параллельно, в таких запросах как

Код: plaintext

select sum(a), avg(b), min(c) from tab

вы очень удивитесь когда "правильно посчитаете" эти агрегаты на больших данных такого типа

...

Рейтинг:

0 / 0

03.04.2020, 09:18

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39943422

bluestreak

Гость

kealon(Ruslan),

Объясните пожалуйста?

...

Рейтинг:

0 / 0

03.04.2020, 11:26

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39943426

bluestreak

Гость

Я спросонья пытаюсь понять что вы имели ввиду 😀 Производительность точно такая же на 64 бит целых числах.

Складывать double значения действительно не точно. могут быть отличия в районе 9 знака после запятой если сравнить параллельную агрегацию с суммированием по одному. Что же делать? Это такой IEEE формат

...

Рейтинг:

0 / 0

03.04.2020, 11:37

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39943433

mayton

Участник

Откуда: loopback

Сообщения: 53 422

Рейтинг: 0 / 0

bluestreak

Производительность таких вычислений достаточно высокая. Например миллиард double значений агрегируется за 290мс на прочессорах с двумя каналами памяти и 100мс с шестью каналами. Один канал памяти полностью утилизируется двумя тредами.

Смотри. Системы на базе in-memory имеют узкое применение. В общем случае продуктовые данные
не помещаются в память. Поэтому преимущества загрузки 2х каналов памяти - это не очень полезный
кейс для DBMS как таковой. Что ты собрался так много процессить? Методы сеток?

Обычно пользователю интересна какая-то узкая часть данных. Которую легко индексировать
или материализовывать. Или следуя лучшим традициям CQRS - трекать отдельно вообще от
основного хранилища фактов.

Вот эта штука

Код: sql

select sum(a), avg(b), min(c) from tab

это вообще не OLTP. Это дата-аналитическая кверя. Ее исполняют 1 раз для исторического периода.
Для 2019 года например и кладут ее в отдельную табличку или OLAP кубик навсегда. Там она и лежит
и никогда не меняется. Вот это правильный паттерн.

...

Рейтинг:

0 / 0

03.04.2020, 11:49

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39943490

kealon(Ruslan)

Участник

Откуда: Нижневартовск

Сообщения: 4 020

Рейтинг: 0 / 0

bluestreak

различая могут быть легко процентов 20 от искомого

выход только один - "правильно считать агрегаты по таким типам", в учебниках по расчётам есть описания как это делать

...

Рейтинг:

0 / 0

03.04.2020, 13:34

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39943538

bluestreak

Гость

Различия конечно есть, но существенно меньше чем 20%. Вот например сумма 1.6 миллиардов на моем ноуте (2 канала):

Параллельно:

Последовательно:

Разница 242 с копейками, те 0.000001%

...

Рейтинг:

0 / 0

03.04.2020, 15:37

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39943545

bluestreak

Гость

mayton

bluestreak

Код: sql

select sum(a), avg(b), min(c) from tab

Я согласен, можно посчитать и сохранить. Но смысл не в этом. Мы делаем большой объём данных интерактивными. Конечно постепенно. Польза от суммирования всей таблицу не велика, но это демонстрирует потенциальные возможности которыми могут обладать будущие субд. Это поможет сократить необходимость в индексах, материальных въю и других костылей, которые нужно постоянно поддерживать. Дальше векторные и параллельные поиски, сравнения, копирование, индексы и тд. И вообще все что захочешь.

...

Рейтинг:

0 / 0

03.04.2020, 15:56

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39943560

kealon(Ruslan)

Участник

Откуда: Нижневартовск

Сообщения: 4 020

Рейтинг: 0 / 0

bluestreak,

а вот теорию почитать? или я вам должен данные предоставить где будет 20% как за здрасти?

...

Рейтинг:

0 / 0

03.04.2020, 16:20

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39943561

bluestreak

Гость

kealon(Ruslan)

bluestreak,

а вот теорию почитать? или я вам должен данные предоставить где будет 20% как за здрасти?

Да, пожалуйста. Свои аргументы нужно подкреплять фактами.

...

Рейтинг:

0 / 0

03.04.2020, 16:24

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39943565

kealon(Ruslan)

Участник

Откуда: Нижневартовск

Сообщения: 4 020

Рейтинг: 0 / 0

bluestreak,

для ленивых ;-), я не занимаюсь благотворительностью

...

Рейтинг:

0 / 0

03.04.2020, 16:30

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39944688

bluestreak

Гость

kealon(Ruslan)

bluestreak,

для ленивых ;-), я не занимаюсь благотворительностью

Почему же так кисло? Вы меня совершенно не знаете.

Я поделился новостями давненько и в первую очередь с соотечественниками. Но видно не очень интересно...

Вот всему остальному миру интересно:

https://www.reddit.com/r/programming/comments/fwlk0k/questdb_using_simd_to_aggregate_billions_of/

Ну и в ХН на главной странице:

https://news.ycombinator.com/news

...

Рейтинг:

0 / 0

08.04.2020, 00:50

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39944728

kealon(Ruslan)

Участник

Откуда: Нижневартовск

Сообщения: 4 020

Рейтинг: 0 / 0

bluestreak,

Лирика меня мало интересует, я уже давно обрёл защитный уровень цинизма. Тем более, я знаю как высасывают такие новости.
Выискивать вам что-то конкретное - это труд, профит от которого приближается к 0, так как даже чего-то нового я не узнаю, я уж не говорю о каком-то материальном выхлопе.

Логических оптимизаций в вашем продукте я особо не вижу, лопатить машинные оптимизации не самый большой скил, один человек на этом поле не воин.
Советую кстати посмотреть в либы того же интела и использовать их по возмоности, там много что сделано для машинных оптимизаций. Если вы хапните их внимание это уже будет очень большой профит вам.

PS:
avg(( x-avg(x))*(x-avg(x))) = avg( x^2 -2 x * avg(x) + avg(x)^2) = avg(x^2) - 2 avg(x)^2 + avg(x)^2 = avg(x^2) - avg(x)^2

...

Рейтинг:

0 / 0

08.04.2020, 09:18

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39945014

bluestreak

Гость

kealon(Ruslan)

Хорошо, спасибо за информацию. Это все похоже сводится к https://en.m.wikipedia.org/wiki/Kahan_summation_algorithm мне вот не сложно за 0 поделится если я нужной информацией владею.

...

Рейтинг:

0 / 0

08.04.2020, 19:42

| Ответить | Цитировать | Написать

QuestDB - новая СУБД для хранения time series данных

#39945017

Бумбараш

Участник

Откуда: никем не победимая, самая любимая

Сообщения: 1 090

Рейтинг: 0 / 0

kealon(Ruslan)

bluestreak,

для ленивых ;-), я не занимаюсь благотворительностью

kealon(Ruslan)

ты такой крутой парень

кек

...

Рейтинг:

0 / 0

08.04.2020, 19:48

| Ответить | Цитировать | Написать

25 сообщений из 239, страница 9 из 10

все

Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / QuestDB - новая СУБД для хранения time series данных

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

Start [/forum/topic.php?fid=35&tid=1552167&startmsg=last&offset=-2]:	0ms
get settings:	2ms
get forum list:	6ms
check forum access:	0ms
check topic access:	0ms
track hit:	16ms
get topic data:	3ms
get forum data:	1ms
get page messages:	31ms
get tp. blocked users:	0ms
others:	82ms

total:	141ms