Как лучше хранить сырые данные / WinForms, .Net Framework

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Как лучше хранить сырые данные

25 сообщений из 33, страница 1 из 2

все

Как лучше хранить сырые данные

#38612310

darlov

Гость

Доброго времени суток. Сразу скажу новичок... Подскажите пожалуйста с реализацией.
Пишу проект, который собирает технологические данные с серверов, агрегирует и вставляет в БД.
Сырые данные которые еще не подверглись агрегации в чем лучше хранить, в оперативной памяти, в Protocol Buffers, в XML?
Если отталкиваться от количества данных, то ежесекундно будут приходить около 3000 данных, вида double(64) | double(64) | double(64) т.е. 24 байта за информационную единицу, умножив на 3000 получаю 72000 байт в секунду, умножив на 10 минут (столько планирую хранить данные) получаю 41,200 МБ цифра не большая, если что то не упустил. Но я не знаю как это отразится на производительности.
Надеюсь понятно объяснил...

...

Рейтинг:

0 / 0

11.04.2014, 13:47

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38612686

darlov

Гость

Видимо не понятно объяснил

...

Рейтинг:

0 / 0

11.04.2014, 17:38

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38612696

Shocker.Pro

Участник

Откуда: ->|<- :адуктО

Сообщения: 23 134

Рейтинг: 0 / 0

Та понятно,
Что смущает? возможность затыка SQL-сервера при таком потоке?
Проведите нагрузочный тест, проверьте загрузку сети, диска и процессора SQL-сервера при этом потоке

...

Рейтинг:

0 / 0

11.04.2014, 17:43

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38612702

Antonariy

Участник

Откуда: ☭

Сообщения: 80 221

Рейтинг: 0 / 0

Да все понятно.

Точно не в XML.

Я бы вообще не заморачивался с хранением данных в памяти, а отправлял в бд по факту получения, и аггрегацией в ней же занимался.

...

Рейтинг:

0 / 0

11.04.2014, 17:45

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38612704

dvim

Участник

Откуда: Санкт Петербург

Сообщения: 618

Рейтинг: 0 / 0

darlov,

А в чем проблема в хранении 42 МБ в оперативной памяти?
Зачем сложности.

...

Рейтинг:

0 / 0

11.04.2014, 17:46

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38612705

Shocker.Pro

Участник

Откуда: ->|<- :адуктО

Сообщения: 23 134

Рейтинг: 0 / 0

а, или опасаетесь за само приложение? 42 Мб - это немного, даже если еще столько же служебной информации. Больше вопрос, как эти данные обрабатываются, от этого будет зависеть принцип хранения.

...

Рейтинг:

0 / 0

11.04.2014, 17:47

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38613428

darlov

Гость

Antonariy, я тесты не делал, но в статьях и советах на форумах, пишут что не выдержит БД такой поток данных, единовременно если вставлять, проблем якобы не будет, а постоянный инсерт не выдержит. Собираюсь использовать Postgresql.

...

Рейтинг:

0 / 0

13.04.2014, 11:18

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38613431

darlov

Гость

Ну ок, раз это небольшой объем. Тогда более высоко производительней будет в оперативке хранить, единствено, можно потерять данные при падения приложения.

...

Рейтинг:

0 / 0

13.04.2014, 11:23

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38613472

Сон Веры Павловны

Участник

Сообщения: 6 318

Рейтинг: 0 / 0

darlovпишут что не выдержит БД такой поток данных, единовременно если вставлять, проблем якобы не будет, а постоянный инсерт не выдержит
А пацаны-разработчики биллинга об этом и не знали.

...

Рейтинг:

0 / 0

13.04.2014, 12:38

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38613512

Arm79

Участник

Откуда: МО, Раменское

Сообщения: 3 205

Рейтинг: 0 / 0

darlovежесекундно будут приходить около 3000 данных, вида double(64) | double(64) | double(64)
Таки да, не каждая СУБД выдержит, если будет поток 3000 транзакций в секунду.

С другой стороны для такого небольшого объема данных нет проблем делать ежесекундную вставку данных одной операцией.

Что за СУБД? И какое под ней железо?

...

Рейтинг:

0 / 0

13.04.2014, 13:53

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38613655

darlov

Гость

Arm79, СУБД: PostgreSQL, железо пока CPU: Intel i3, RAM: 4ГБ, при продакшн железо скорей всего изменится в лучшую сторону.

...

Рейтинг:

0 / 0

13.04.2014, 17:25

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38613672

Где-то в степи

Участник

Откуда: Под Таганрогом

Сообщения: 4 453

Рейтинг: 0 / 0

darlov,
А вот если немного изменить вопрос, объем данных пару гигабайт, ускорить частоту приема на 4, в случае смерти приложения
сохранять данные, делать различные срезы из полученной информации... без за базы ?????

...

Рейтинг:

0 / 0

13.04.2014, 17:50

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38613704

Arm79

Участник

Откуда: МО, Раменское

Сообщения: 3 205

Рейтинг: 0 / 0

darlovжелезо пока CPU: Intel i3, RAM: 4ГБ, при продакшн железо скорей всего изменится в лучшую сторону
У меня ноут мощнее :-)

Ну смотрите, ежесекундно 3000 * 24 байта = 70 килобайт. В общем, ничтожно мало.

Есть варианты. Например, генерить multiple инсерты типа:
PostgreeSQL DocsINSERT INTO products (product_no, name, price) VALUES
(1, 'Cheese', 9.99),
(2, 'Bread', 1.99),
(3, 'Milk', 2.99);

Или сохранять в файл и buill insert через Copy

Насколько критично, если какие-то данные пропадут, не попадут в БД? Например, минутный интервал?

...

Рейтинг:

0 / 0

13.04.2014, 18:54

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38613773

darlov

Гость

Arm79, Спасибо за COPY? не знал.
Ну если будут пропадать данные раз в полгода, это еще не критично, а если периодически , то это критично. А почему это cпросили, то что команда COPY может не отработать из за ошибки в файле?
Еще вопросик, команда COPY может брать данные с RAM?

...

Рейтинг:

0 / 0

13.04.2014, 21:05

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38613784

Arm79

Участник

Откуда: МО, Раменское

Сообщения: 3 205

Рейтинг: 0 / 0

darlov,

1) Создание файла и запись в него килобайтов/мегабайтов ныне не составляет проблем по скорости. Диски быстрые, кэш большой. Поэтому можно спокойно сначала записать в файл, а потом перекинуть в БД
2) Если уж совсем критично по времени, можно файл создавать на RAM-диске.

Но у меня все равно чувство, что вы переусложняете.

...

Рейтинг:

0 / 0

13.04.2014, 21:29

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38613787

darlov

Гость

Arm79,
Спасибо, буду пробовать.

...

Рейтинг:

0 / 0

13.04.2014, 21:45

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38613809

Где-то в степи

Участник

Откуда: Под Таганрогом

Сообщения: 4 453

Рейтинг: 0 / 0

darlov,
в четвертом появился MemoryMappedFile можно работать с привязкой к диску можно чисто с памятью ( быстрее)
при мелких размерах, система ставит по дефолту размер кластера диска,
делаем рентабельную очередь, с конца пишем данные из разных потоков, с морды заливаем в файл, если есть желании
через дельту или как флешем проталкиваем данные на жесткий диск, можно заталкивать структуры (имхо не забывать про смещение), таки получать их из файла, и тд......

...

Рейтинг:

0 / 0

13.04.2014, 23:24

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38613816

Где-то в степи

Участник

Откуда: Под Таганрогом

Сообщения: 4 453

Рейтинг: 0 / 0

наверно лучше вместо - ставит по дефолту размер кластера диска,
выравнивает до размера клястера..

...

Рейтинг:

0 / 0

13.04.2014, 23:41

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38613900

Alex Kuznetsov

Участник

Откуда: Ростов-на-Дону

Сообщения: 1 795

Рейтинг: 0 / 0

Коллеги, а что мешает собирать данные в одном потоке, а записывать в базу в разных потоках?
Разнести задачу записи в очередь из нескольких потоков и пусть пишут.
Хоть через файл, хоть напрямую...

Тут вопрос в другом: ежели за 10 минут набегает ~41 Mb данных, то за сутки получим ~5 Gb, за год более 2 Tb без учёта служебных данных и т.д., и т.п.
Какова должны быть ретроспективная глубина хранения данных?

...

Рейтинг:

0 / 0

14.04.2014, 08:07

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38613928

Shocker.Pro

Участник

Откуда: ->|<- :адуктО

Сообщения: 23 134

Рейтинг: 0 / 0

darlov10 минут (столько планирую хранить данные)

...

Рейтинг:

0 / 0

14.04.2014, 09:15

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38613997

Alex Kuznetsov

Участник

Откуда: Ростов-на-Дону

Сообщения: 1 795

Рейтинг: 0 / 0

Shocker.Prodarlov10 минут (столько планирую хранить данные)Shocker.Pro, я помню про 10 минут.
Просто меня смутила фраза:
автор...Ну если будут пропадать данные раз в полгода, это еще не критично, а если периодически , то это критично... Не сразу понял что речь идёт именно о 10-ти минутном "куске" сырых данных.
Видимо, сказывается то, что голова побаливает...

...

Рейтинг:

0 / 0

14.04.2014, 11:00

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38614009

darlov

Гость

Alex Kuznetsov,
Я так и планирую разделить по потокам, как раз для промежуточного хранения массива данных я и интересуюсь что использовать.

...

Рейтинг:

0 / 0

14.04.2014, 11:14

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38614011

darlov

Гость

Где-то в степи, Спасибо за MemoryMappedFile, беру на заметку.

...

Рейтинг:

0 / 0

14.04.2014, 11:15

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38614059

Alex Kuznetsov

Участник

Откуда: Ростов-на-Дону

Сообщения: 1 795

Рейтинг: 0 / 0

darlovAlex Kuznetsov,
Я так и планирую разделить по потокам, как раз для промежуточного хранения массива данных я и интересуюсь что использовать.Тогда действительно можно посмотреть в сторону MMF. Только учтите один немаловажный момент про размер блоков .
MSDN... One advantage to using MMF I/O is that the system performs all data transfers for it in 4K pages of data. ...
Правда это было актуально для 1998 года. Сейчас ситуация изменилась и размер страницы зависит от системы.

ММF можно использовать для "скидывания" сырых данных на диск, а затем уже в отдельных потоках(после 10-ти минутного скидывания) спокойно сливать данные в базу.
Слил в базу - грохнул файл.
Таким образом может быть два потока на запись в MMF(не думаю, что для записи секундных данных нужно будет более одного потока), и сколько нужно для передачи файла в базу.

...

Рейтинг:

0 / 0

14.04.2014, 12:00

| Ответить | Цитировать | Написать

Как лучше хранить сырые данные

#38614144

Где-то в степи

Участник

Откуда: Под Таганрогом

Сообщения: 4 453

Рейтинг: 0 / 0

Alex Kuznetsov,
да забудь те вы о много поточном инсерте в базу....
если вытесняющую многозадачность можно победить для такой невьебенной задачи дополнительным клястером
то база ну никак не будет писать в таблицу разными потоками..

...

Рейтинг:

0 / 0

14.04.2014, 13:19

| Ответить | Цитировать | Написать

25 сообщений из 33, страница 1 из 2

все

Форумы / WinForms, .Net Framework [игнор отключен] [закрыт для гостей] / Как лучше хранить сырые данные

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=20&msg=38612686&tid=1403029]:	0ms
get settings:	5ms
get forum list:	10ms
check forum access:	2ms
check topic access:	2ms
track hit:	168ms
get topic data:	11ms
get forum data:	2ms
get page messages:	60ms
get tp. blocked users:	1ms
others:	198ms

total:	459ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы