powered by simpleCommunicator - 2.0.59     © 2025 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / C++ [игнор отключен] [закрыт для гостей] / Какую БД выбрать?
25 сообщений из 76, страница 2 из 4
Какую БД выбрать?
    #39644121
AlekseySQL
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
White OwlА ниче что у нас есть специальный форум "Сравнение СУБД"?

У меня достаточно широко стоит вопрос, включая файлы и различные форматы типа dbf, xml... Не думаю, что эти варианты там можно обсудить.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644128
Dima T
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AlekseySQLВ двоичном формате данные хранят все поля (в структурах), и читаются также все поля. Поэтому появилось мысль использовать БД, чтобы не читать лишние поля (а преобразования из выборки БД в нужные объекты скорее всего как и в предыдущем случае практически не будет замедлять работу).
Разбей структуру на две: часто используемые поля и остальные. Храни в двух разных таблицах, а связь по ключу или просто по индексу, т.е. номеру записи в таблице.
AlekseySQLКакую БД посоветуете при подобном объеме? Подойдут ли для этого dbf- файлы (или они тоже читаются целиком)? Пока критерий один- максимальная скорость.
Ты уже сделал самый быстрый вариант. Никакая БД тебя не спасет, т.к. при использовании БД будет лишняя нагрузка на проц, а может и лишнее чтение диска, т.к. БД кроме данных содержит вспомогательную инфу: индексы и т.д.

ИМХО лучше подумай как улучшить расположение данных в твоей БД, чтобы минимизировать чтения с диска.
Может надо ввести какую-то вспомогательную доп.инфу для ускорения поиска нужных данных.
Тут надо от конкретной задачи отталкиваться, смотреть какие именно операции чаще выполняются и под них делать оптимизацию.

PS Если дисковое IO критично, то можно диски побыстрее взять, современные SSD читают линейно 3+ Гб/сек.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644148
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AlekseySQLWhite OwlА ниче что у нас есть специальный форум "Сравнение СУБД"?

У меня достаточно широко стоит вопрос, включая файлы и различные форматы типа dbf, xml... Не думаю, что эти варианты там можно обсудить.
В твоей задаче xml не дает никаких преимуществ. Это тот же csv по роду доступа.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644151
Arm79
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dima TТы уже сделал самый быстрый вариант. Никакая БД тебя не спасет, т.к. при использовании БД будет лишняя нагрузка на проц, а может и лишнее чтение диска, т.к. БД кроме данных содержит вспомогательную инфу: индексы и т.д.
Это неверная информация. Зависит от входных данных и от требуемой логики обработки.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644152
982183
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dima TТы уже сделал самый быстрый вариант. Никакая БД тебя не спасет, т.к. при использовании БД будет лишняя нагрузка на проц, а может и лишнее чтение диска, т.к. БД кроме данных содержит вспомогательную инфу: индексы и т.д.
.
Ну так это "вспомогательная" информация и позволяет более быстро работать с данными.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644153
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
По поводу dbf. Скорее всего не взлетит.
Программные продукты такие как
Dbase, clipper, e. T. C. Создавались в эпоху 32 битного железа и софта со всеми вытекающими последствиями. Нельзя открыть файл размером больше 2 гб. И тому подобное.

Если под dbf ты имел в виду другое - то уточни что.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644158
Dima T
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Arm79Dima TТы уже сделал самый быстрый вариант. Никакая БД тебя не спасет, т.к. при использовании БД будет лишняя нагрузка на проц, а может и лишнее чтение диска, т.к. БД кроме данных содержит вспомогательную инфу: индексы и т.д.
Это неверная информация. Зависит от входных данных и от требуемой логики обработки.
В общем случае - согласен. Но, к сожалению, ТС деталей решаемой задачи он не раскрывает, поэтому исходим из его утверждения что задача уже решена оптимально.

982183Dima TТы уже сделал самый быстрый вариант. Никакая БД тебя не спасет, т.к. при использовании БД будет лишняя нагрузка на проц, а может и лишнее чтение диска, т.к. БД кроме данных содержит вспомогательную инфу: индексы и т.д.
.
Ну так это "вспомогательная" информация и позволяет более быстро работать с данными.
Я так понимаю для данной задачи это лишнее.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644185
Фотография mayton
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Нам нужны хоть какие-то цифры.
АлексейSQL. Сделай пожалуйса в консоли:

$ cp file.csv /dev/null

И сообщи нам сколько это заняло времени в секундах.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644197
AlekseySQL
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
maytonНам нужны хоть какие-то цифры.
АлексейSQL. Сделай пожалуйса в консоли:

$ cp file.csv /dev/null

И сообщи нам сколько это заняло времени в секундах.

Файл размером 352МБ копировался "в никуда" примерно 1 секунду.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644213
AlekseySQL
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Dima TPS Если дисковое IO критично, то можно диски побыстрее взять, современные SSD читают линейно 3+ Гб/сек.

Если 3Гб/сек- это 3 Гбайт/секунда, то для этого надо компьютер полностью пересобирать, чтобы мать поддерживала интерфейс М.2. А после этого придется заменять процессор + память... Так что не вариант.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644224
Dima T
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AlekseySQLDima TPS Если дисковое IO критично, то можно диски побыстрее взять, современные SSD читают линейно 3+ Гб/сек.

Если 3Гб/сек- это 3 Гбайт/секунда, то для этого надо компьютер полностью пересобирать, чтобы мать поддерживала интерфейс М.2. А после этого придется заменять процессор + память... Так что не вариант.
Да, речь про M.2 с поддержкой PCIe x4.
Пересобирать не обязательно, есть контроллеры-переходники PCIe - M.2.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644234
AlekseySQL
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Dima TДа, речь про M.2 с поддержкой PCIe x4.
Пересобирать не обязательно, есть контроллеры-переходники PCIe - M.2.

Спасибо! Не знал про такое и думал, что такие скорости работы с диском мне не доступны.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644253
AlekseySQL
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Dima TДа, речь про M.2 с поддержкой PCIe x4.
Пересобирать не обязательно, есть контроллеры-переходники PCIe - M.2.

Где же ты был когда я недавно ssd с sata- интерфейсом себе покупал?
Я купил диск ~10 раз меньшей скоростью, вдвое меньшим размером и только ~1,5 раза дешевле, чем есть диски для M.2...

p.s. катаюсь по полу от горя :)
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644255
rdb_dev
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AlekseySQLСпасибо! Я всегда думал, что раз SQL- запросы позволяют указать конкретные поля для выборки, то и чтение происходит только этих полей. Какого же было мое удивление, когда я прочитал это:Только учти, что размер базы при поколоночном хранении, может быть значительно больше, чем при построчном и этот размер будет расти линейно при заполнении записей любыми данными, даже NULL, тогда как некоторые БД построчного хранения способны оптимизировать размеры записей, храня лишь битовые флаги для NULL и полей, подвергшихся изменению (в случае с версионными СУБД).
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644277
AlekseySQL
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
AlekseySQLГде же ты был когда я недавно ssd с sata- интерфейсом себе покупал?
Я купил диск ~10 раз меньшей скоростью, вдвое меньшим размером и только ~1,5 раза дешевле, чем есть диски для M.2...

p.s. катаюсь по полу от горя :)

Есть ssd- диски, которые коннектятся напрямую к PCI Express 3.0 и предложенные переходники требуют наличия именно PCI Express 3.0 .

Так вот, как я помню, на yandex- маркете с помощью фильтров я искал материнки:
1. "в продаже"
2. LGA- 1150
3. PCI Express 3.0

и находил только модели Supermicro (у них специфичный внешний вид, поэтому запомнились) по неадекватным ценам. А теперь там есть модели (от 5500 рублей), которые поддерживают мой процессор и обладают разъемом PCI Express 3.0.

Так что если "прижмет", то можно будет апгрейдится.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644278
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. Sidorov базы данных с поколоночным хранением
?

Они тут не нужны скорее всего.

И твоё упрощённое понимание "читают только нужные/все поля из таблицы" неверно.
Всё гораздо сложнее.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644286
Фотография MasterZiv
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AlekseySQLЕсть 50 ГБ текстовой информации (csv- формат). Для ускорения обращения я перегнал ее в двоичные файлы (выполнив преобразования из текста в нужные типы данных), получив 33 ГБ.
Какую БД посоветуете при подобном объеме? Подойдут ли для этого dbf- файлы (или они тоже читаются целиком)? Пока критерий один- максимальная скорость.

Сколько там записей, объектов?
Объём в байтах мало кому интересен при разговоре о БД.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644294
AlekseySQL
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
AlekseySQLТак вот, как я помню, на yandex- маркете с помощью фильтров я искал материнки:
1. "в продаже"
2. LGA- 1150
3. PCI Express 3.0

и находил только модели Supermicro (у них специфичный внешний вид, поэтому запомнились) по неадекватным ценам. А теперь там есть модели (от 5500 рублей), которые поддерживают мой процессор и обладают разъемом PCI Express 3.0.

Так что если "прижмет", то можно будет апгрейдится.

На сайте производителей проанализировал эти материнки и оказалось, что слот PCI Express 3.0 имеет скорость x16, а нужный слот со скоростью x4 имеет старую версию PCI Express 2.0 . Так что отбой: для M.2 придется дополнительно менять: мать, процессор, память.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644295
AlekseySQL
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
MasterZivAlekseySQLЕсть 50 ГБ текстовой информации (csv- формат). Для ускорения обращения я перегнал ее в двоичные файлы (выполнив преобразования из текста в нужные типы данных), получив 33 ГБ.
Какую БД посоветуете при подобном объеме? Подойдут ли для этого dbf- файлы (или они тоже читаются целиком)? Пока критерий один- максимальная скорость.

Сколько там записей, объектов?
Объём в байтах мало кому интересен при разговоре о БД.

В файле размеров 352 МБайт расположено 6 000 000 строк, каждая из которых представляет назависимую запись. Другими словами, одна запись в текстовом формате весит примерно 60 Байт (а в двоичном немного меньше ~40 Байт).

Скоро попробую скорость при поколоночном хранении в файле и тут отпишу результат.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644314
Arm79
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Лучше бы вы описали характер данных в файле, распределение по значениям колонок, структуру записи и предполагаемые действия над данными.

Столько времени убили, а конкретики до сих пор нет
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644318
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AlekseySQLВ файле размеров 352 МБайт расположено 6 000 000 строк

Это всё чудненько влазит в оперативку даже 32-х разрядного процесса. Зачем ты вообще
устраиваешь переливание с диска на диск - совершенно непонятно.
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644321
Фотография Изопропил
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
AlekseySQLAlekseySQLТак вот, как я помню, на yandex- маркете с помощью фильтров я искал материнки:
1. "в продаже"
2. LGA- 1150
3. PCI Express 3.0

и находил только модели Supermicro (у них специфичный внешний вид, поэтому запомнились) по неадекватным ценам. А теперь там есть модели (от 5500 рублей), которые поддерживают мой процессор и обладают разъемом PCI Express 3.0.

Так что если "прижмет", то можно будет апгрейдится.

На сайте производителей проанализировал эти материнки и оказалось, что слот PCI Express 3.0 имеет скорость x16, а нужный слот со скоростью x4 имеет старую версию PCI Express 2.0 . Так что отбой: для M.2 придется дополнительно менять: мать, процессор, память.зачем менять?
Ну будет PCI карта работать в режиме 2.0 с 4мя линиями
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644334
AlekseySQL
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Arm79Лучше бы вы описали характер данных в файле, распределение по значениям колонок, структуру записи и предполагаемые действия над данными.

Столько времени убили, а конкретики до сих пор нет

Пожалуйста, подождите результата теста при "поколоночном" хранении. Возможно все уже сделано, только не протестировано.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644335
AlekseySQL
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Dimitry SibiryakovAlekseySQLВ файле размеров 352 МБайт расположено 6 000 000 строк

Это всё чудненько влазит в оперативку даже 32-х разрядного процесса. Зачем ты вообще
устраиваешь переливание с диска на диск - совершенно непонятно.


Подготавливаю данные для последующего многократного чтения.
...
Рейтинг: 0 / 0
Какую БД выбрать?
    #39644345
Фотография Изопропил
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Задача как обычно осталась за кадром
...
Рейтинг: 0 / 0
25 сообщений из 76, страница 2 из 4
Форумы / C++ [игнор отключен] [закрыт для гостей] / Какую БД выбрать?
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]