|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
Доброе время суток! Я пишу СУБД для очень быстрой обработки данных, как реляционных так и time series. Система доступна через SQL и так же напрямую из java. SQL работает одновременно по PostgreSQL протоколу, HTTP и также через Influx line protocol. Остальное описание и документация находится на GitHub (на английском) https://github.com/questdb/questdb Хотелось бы услышать ваше мнение и так же помочь нам поддержать вас в решении разнообразных проблем. Спасибо! ... |
|||
:
Нравится:
Не нравится:
|
|||
28.11.2019, 18:16 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
какие преимущества перед InfluxDB и другими распространенными TS DB? ... |
|||
:
Нравится:
Не нравится:
|
|||
28.11.2019, 19:20 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
На много быстрее чем influx и timescale. по сравнению с influx человеческий SQL, нормально ошибки репортятся, транзакционность данных, отказоустойчивость, поддержка реляционной модели, те неограниченные joins. Можно залить по influx протоколу а вытащить по postgres По сравнению с timescale, просто быстрее, нагружает сервер меньше, например запрос в questdb выполняется быстрее на одном потоке чем timescale на шести PostgreSQL инфраструктура конечно хорошая, но мы быстрыми темпами догоняем. Можем фич добавить быстро и без бюрократии Залив данных из файлов упрощён - questdb заливает гораздо быстрее и автоматом создаёт таблицу и определяет типы полей. Также размер транзакции не ограничен при этом транзакция остаётся атомичной Мы скоро накрутим incremental запросы, по производительности уничтожим все базы. Раз в 10-100 быстрее будет в зависимости от запроса ... |
|||
:
Нравится:
Не нравится:
|
|||
28.11.2019, 19:35 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
bluestreak PostgreSQL инфраструктура конечно хорошая, но мы быстрыми темпами догоняем. Можем фич добавить быстро и без бюрократии как вы её быстрыми темпами обгоните, если у вас один контрибьютор, судя по github bluestreak Мы скоро накрутим incremental запросы, по производительности уничтожим все базы. Раз в 10-100 быстрее будет в зависимости от запроса Что такое incremental запросы? ... |
|||
:
Нравится:
Не нравится:
|
|||
28.11.2019, 19:42 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
Инвестиции почти готовы, получаем деньги в январе и погнали. Я и есть этот контрибутор :) Инкрементальные запросы вытекают из предположения что данные на изменяются. За исходный результат берётся не 0 а результат предидущего запроса. Например ‘select location, avg(temp) where timestamp = ‘2019-12’ Считает среднюю температуру в каждом месте за декабрь. Первый раз обходит весь декабрь. Запускаем еще раз. Запрос берет готовый hashmap из предидущего запуска и дорабатывает дельтой данных между сейчас и предидущим временем ... |
|||
:
Нравится:
Не нравится:
|
|||
28.11.2019, 19:59 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
Сейчас кэширование в том или ином виде есть в любой DB. Некоторые DB, в том числе timeseries, полностью хранят в inmemory последние периоды time series, которыми в основном и пользуютя пользователи. Поэтому там в 10-100 раз особо некуда уже обгонять. ... |
|||
:
Нравится:
Не нравится:
|
|||
28.11.2019, 20:59 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
Ну это наверное в теории. Если вы запустите запрос в influx чтобы просуммировать одно поле по ключу значений другого, то 10м записей он обработает за 100мс, запустите его ещё раз то будет опять 100мс и вы так же увидите подпрыгивание всех ядер процессора. Запрос который возвращает закешированные 20 записей возвращает данные за 3мс а не 100. По этому если они кэшируют то далеко не столько как говорят. ... |
|||
:
Нравится:
Не нравится:
|
|||
28.11.2019, 21:09 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
bluestreakЗапрос который возвращает закешированные 20 записей возвращает данные за 3мс а не 100. Осталось только найти странное приложение, которое раз за разом одним и тем же запросом запрашивает одни и те же данные. Это разве что к пых-пыховцам и прочим уэб-кодерам. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
28.11.2019, 22:28 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
Таких приложений может быть не очевидное количество но их полно. В моём примере может быть текущий месяц, который не меняется от понедельника до пятницы. В зависимости от скорости поступления данных результат запроса меняется. Это применимо к отчетности, в реальном времени, консолям всяким которые не обязательно запрашивают данные в инкрементах и собирают картину на клиенте. Пых-пыховцам тоже инструменты нужны. ... |
|||
:
Нравится:
Не нравится:
|
|||
28.11.2019, 23:04 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
кстати, я так же могу ответить на конструктивные вопросы. Не зря же 5 лет эту СУБД пишу. Например, как сделать .....? Я думаю что существующие СУБД не идеальны :) ... |
|||
:
Нравится:
Не нравится:
|
|||
28.11.2019, 23:07 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
bluestreakя так же могу ответить на конструктивные вопросы. Не зря же 5 лет эту СУБД пишу. Хочешь потягаться с теми, кто делает это 20?.. Posted via ActualForum NNTP Server 1.5 ... |
|||
:
Нравится:
Не нравится:
|
|||
28.11.2019, 23:17 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
bluestreak, название хорошее, что означает? работа с с данной СУБД - это перманентный Quest? ... |
|||
:
Нравится:
Не нравится:
|
|||
28.11.2019, 23:37 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
Dimitry Sibiryakov bluestreakя так же могу ответить на конструктивные вопросы. Не зря же 5 лет эту СУБД пишу. Хочешь потягаться с теми, кто делает это 20?.. Дело не в том чтобы тягаться (я пишу софт с 1994г). QuestDB это apache 2.0 проект. Есть возможность сделать вещи, которые в существующих СУБД делаются через задницу, прямо в СУБД и по человечески, как всем было бы удобно, быстро, и не дорого в смысле вычислительных ресурсов в облаках. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 00:15 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
Дмитрий Мух bluestreak, название хорошее, что означает? работа с с данной СУБД - это перманентный Quest? Спасибо! Quest это упорная разработка чтобы результат был удобный и быстрый. Например парка сервером, чтобы можно было 100Гб файл перетащить в браузер и он загрузился без проблем. Ну и другие подобные вещи ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 00:19 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
bluestreak, Я пишу СУБД для очень быстрой обработки данных java Делаю столярный цех. Все работы будут выполняться топором и бензопилой. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 05:35 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
crutchmaster bluestreak, Я пишу СУБД для очень быстрой обработки данных java Делаю столярный цех. Все работы будут выполняться топором и бензопилой. Молоток Изучил предмет дасканално И ответил очень аригинално Постгрес С, залив 500мб цсв - 47с Questdb java, залив того же файла 4с GC = 0 Скачайте, попробуйте ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 06:18 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
bluestreak, Давай остальные метрики, время выборок, скорость join'ов и прочее. На базе в пару TB и работающих 100 подключениях. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 06:37 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15.
Здесь timescale/postgres выполняют каждый запрос в 6 потоков. Questdb в один поток. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 06:55 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
Залей свой датасет попробуй Joins работают быстро, количество не ограничено. Размер базы ограничен системными ресурсами, диском и физической памятью. Для работы с данными используются memory mapped files. Количество подключений не ограниченно, сервера не блокирующие с поддержкой flow control. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 06:59 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
bluestreak, Ну что это за бенч? Где тестовые данные? Где версии софта? Где железо? Где IO? Что там по надёжности? Она у тебя inmemory? Как это всё сбрасывается на диск? ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 07:07 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
Бенч синтетический датасет, 500мб 10м записей Данные - ... Версии недельной давности Dell 9570 laptop i9 6 core , 32gb. 1tb nvme ssd Надежность данных - транзакционность (acid) по одной таблице пока. Автоматическое восстановление при потере электропитания Данные как я сказал пишутся и читаются через memory mapped files. ОС занимается управлением памятью. В прямую память попадают только промежуточные данные при выполнении запросов. При этом делается все возможное чтобы данные не копировать в память. Например результат ‘from a join b on(x)’ хранится в памяти как хэш ключа x и rowid (64bit) таблицы b Данные на диск записываются ОС асинхронно. Будет возможность делать msync с коммитом в зависимости от задачи ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 07:25 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
bluestreak Дмитрий Мух bluestreak, название хорошее, что означает? работа с с данной СУБД - это перманентный Quest? Спасибо! Quest это упорная разработка чтобы результат был удобный и быстрый. Например парка сервером, чтобы можно было 100Гб файл перетащить в браузер и он загрузился без проблем. Ну и другие подобные вещи Ну нам такого не надо, у нас другие задачи. А 100Гб файл - это что? Киношка какая что-ли? Так с этим вроде сейчас через браузер проблем нет. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 09:42 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
bluestreak Для работы с данными используются memory mapped files. А с MongoDB MMAPv1 сравнивали? А с WiredTiger? ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 09:46 |
|
QuestDB - новая СУБД для хранения time series данных
|
|||
---|---|---|---|
#18+
bluestreak, Как-то без огонька. Надо устроить спецолимпиаду, написать генератор входных данных, придумать задачи, наделать скриптов, чтобы кому надо могли у себя это запустить и потыкать. ... |
|||
:
Нравится:
Не нравится:
|
|||
29.11.2019, 09:49 |
|
|
start [/forum/topic.php?fid=35&tid=1552167]: |
0ms |
get settings: |
7ms |
get forum list: |
13ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
33ms |
get topic data: |
11ms |
get forum data: |
2ms |
get page messages: |
64ms |
get tp. blocked users: |
1ms |
others: | 271ms |
total: | 408ms |
0 / 0 |