Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
White OwlА ниче что у нас есть специальный форум "Сравнение СУБД"? У меня достаточно широко стоит вопрос, включая файлы и различные форматы типа dbf, xml... Не думаю, что эти варианты там можно обсудить. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 07:43 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
AlekseySQLВ двоичном формате данные хранят все поля (в структурах), и читаются также все поля. Поэтому появилось мысль использовать БД, чтобы не читать лишние поля (а преобразования из выборки БД в нужные объекты скорее всего как и в предыдущем случае практически не будет замедлять работу). Разбей структуру на две: часто используемые поля и остальные. Храни в двух разных таблицах, а связь по ключу или просто по индексу, т.е. номеру записи в таблице. AlekseySQLКакую БД посоветуете при подобном объеме? Подойдут ли для этого dbf- файлы (или они тоже читаются целиком)? Пока критерий один- максимальная скорость. Ты уже сделал самый быстрый вариант. Никакая БД тебя не спасет, т.к. при использовании БД будет лишняя нагрузка на проц, а может и лишнее чтение диска, т.к. БД кроме данных содержит вспомогательную инфу: индексы и т.д. ИМХО лучше подумай как улучшить расположение данных в твоей БД, чтобы минимизировать чтения с диска. Может надо ввести какую-то вспомогательную доп.инфу для ускорения поиска нужных данных. Тут надо от конкретной задачи отталкиваться, смотреть какие именно операции чаще выполняются и под них делать оптимизацию. PS Если дисковое IO критично, то можно диски побыстрее взять, современные SSD читают линейно 3+ Гб/сек. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 08:19 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
AlekseySQLWhite OwlА ниче что у нас есть специальный форум "Сравнение СУБД"? У меня достаточно широко стоит вопрос, включая файлы и различные форматы типа dbf, xml... Не думаю, что эти варианты там можно обсудить. В твоей задаче xml не дает никаких преимуществ. Это тот же csv по роду доступа. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 09:11 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
Dima TТы уже сделал самый быстрый вариант. Никакая БД тебя не спасет, т.к. при использовании БД будет лишняя нагрузка на проц, а может и лишнее чтение диска, т.к. БД кроме данных содержит вспомогательную инфу: индексы и т.д. Это неверная информация. Зависит от входных данных и от требуемой логики обработки. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 09:18 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
Dima TТы уже сделал самый быстрый вариант. Никакая БД тебя не спасет, т.к. при использовании БД будет лишняя нагрузка на проц, а может и лишнее чтение диска, т.к. БД кроме данных содержит вспомогательную инфу: индексы и т.д. . Ну так это "вспомогательная" информация и позволяет более быстро работать с данными. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 09:18 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
По поводу dbf. Скорее всего не взлетит. Программные продукты такие как Dbase, clipper, e. T. C. Создавались в эпоху 32 битного железа и софта со всеми вытекающими последствиями. Нельзя открыть файл размером больше 2 гб. И тому подобное. Если под dbf ты имел в виду другое - то уточни что. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 09:21 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
Arm79Dima TТы уже сделал самый быстрый вариант. Никакая БД тебя не спасет, т.к. при использовании БД будет лишняя нагрузка на проц, а может и лишнее чтение диска, т.к. БД кроме данных содержит вспомогательную инфу: индексы и т.д. Это неверная информация. Зависит от входных данных и от требуемой логики обработки. В общем случае - согласен. Но, к сожалению, ТС деталей решаемой задачи он не раскрывает, поэтому исходим из его утверждения что задача уже решена оптимально. 982183Dima TТы уже сделал самый быстрый вариант. Никакая БД тебя не спасет, т.к. при использовании БД будет лишняя нагрузка на проц, а может и лишнее чтение диска, т.к. БД кроме данных содержит вспомогательную инфу: индексы и т.д. . Ну так это "вспомогательная" информация и позволяет более быстро работать с данными. Я так понимаю для данной задачи это лишнее. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 09:32 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
Нам нужны хоть какие-то цифры. АлексейSQL. Сделай пожалуйса в консоли: $ cp file.csv /dev/null И сообщи нам сколько это заняло времени в секундах. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 10:06 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
maytonНам нужны хоть какие-то цифры. АлексейSQL. Сделай пожалуйса в консоли: $ cp file.csv /dev/null И сообщи нам сколько это заняло времени в секундах. Файл размером 352МБ копировался "в никуда" примерно 1 секунду. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 10:17 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
Dima TPS Если дисковое IO критично, то можно диски побыстрее взять, современные SSD читают линейно 3+ Гб/сек. Если 3Гб/сек- это 3 Гбайт/секунда, то для этого надо компьютер полностью пересобирать, чтобы мать поддерживала интерфейс М.2. А после этого придется заменять процессор + память... Так что не вариант. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 10:29 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
AlekseySQLDima TPS Если дисковое IO критично, то можно диски побыстрее взять, современные SSD читают линейно 3+ Гб/сек. Если 3Гб/сек- это 3 Гбайт/секунда, то для этого надо компьютер полностью пересобирать, чтобы мать поддерживала интерфейс М.2. А после этого придется заменять процессор + память... Так что не вариант. Да, речь про M.2 с поддержкой PCIe x4. Пересобирать не обязательно, есть контроллеры-переходники PCIe - M.2. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 10:37 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
Dima TДа, речь про M.2 с поддержкой PCIe x4. Пересобирать не обязательно, есть контроллеры-переходники PCIe - M.2. Спасибо! Не знал про такое и думал, что такие скорости работы с диском мне не доступны. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 10:46 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
Dima TДа, речь про M.2 с поддержкой PCIe x4. Пересобирать не обязательно, есть контроллеры-переходники PCIe - M.2. Где же ты был когда я недавно ssd с sata- интерфейсом себе покупал? Я купил диск ~10 раз меньшей скоростью, вдвое меньшим размером и только ~1,5 раза дешевле, чем есть диски для M.2... p.s. катаюсь по полу от горя :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 10:59 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
AlekseySQLСпасибо! Я всегда думал, что раз SQL- запросы позволяют указать конкретные поля для выборки, то и чтение происходит только этих полей. Какого же было мое удивление, когда я прочитал это:Только учти, что размер базы при поколоночном хранении, может быть значительно больше, чем при построчном и этот размер будет расти линейно при заполнении записей любыми данными, даже NULL, тогда как некоторые БД построчного хранения способны оптимизировать размеры записей, храня лишь битовые флаги для NULL и полей, подвергшихся изменению (в случае с версионными СУБД). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 11:01 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
AlekseySQLГде же ты был когда я недавно ssd с sata- интерфейсом себе покупал? Я купил диск ~10 раз меньшей скоростью, вдвое меньшим размером и только ~1,5 раза дешевле, чем есть диски для M.2... p.s. катаюсь по полу от горя :) Есть ssd- диски, которые коннектятся напрямую к PCI Express 3.0 и предложенные переходники требуют наличия именно PCI Express 3.0 . Так вот, как я помню, на yandex- маркете с помощью фильтров я искал материнки: 1. "в продаже" 2. LGA- 1150 3. PCI Express 3.0 и находил только модели Supermicro (у них специфичный внешний вид, поэтому запомнились) по неадекватным ценам. А теперь там есть модели (от 5500 рублей), которые поддерживают мой процессор и обладают разъемом PCI Express 3.0. Так что если "прижмет", то можно будет апгрейдится. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 11:24 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
Basil A. Sidorov базы данных с поколоночным хранением ? Они тут не нужны скорее всего. И твоё упрощённое понимание "читают только нужные/все поля из таблицы" неверно. Всё гораздо сложнее. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 11:24 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
AlekseySQLЕсть 50 ГБ текстовой информации (csv- формат). Для ускорения обращения я перегнал ее в двоичные файлы (выполнив преобразования из текста в нужные типы данных), получив 33 ГБ. Какую БД посоветуете при подобном объеме? Подойдут ли для этого dbf- файлы (или они тоже читаются целиком)? Пока критерий один- максимальная скорость. Сколько там записей, объектов? Объём в байтах мало кому интересен при разговоре о БД. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 11:28 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
AlekseySQLТак вот, как я помню, на yandex- маркете с помощью фильтров я искал материнки: 1. "в продаже" 2. LGA- 1150 3. PCI Express 3.0 и находил только модели Supermicro (у них специфичный внешний вид, поэтому запомнились) по неадекватным ценам. А теперь там есть модели (от 5500 рублей), которые поддерживают мой процессор и обладают разъемом PCI Express 3.0. Так что если "прижмет", то можно будет апгрейдится. На сайте производителей проанализировал эти материнки и оказалось, что слот PCI Express 3.0 имеет скорость x16, а нужный слот со скоростью x4 имеет старую версию PCI Express 2.0 . Так что отбой: для M.2 придется дополнительно менять: мать, процессор, память. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 11:36 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
MasterZivAlekseySQLЕсть 50 ГБ текстовой информации (csv- формат). Для ускорения обращения я перегнал ее в двоичные файлы (выполнив преобразования из текста в нужные типы данных), получив 33 ГБ. Какую БД посоветуете при подобном объеме? Подойдут ли для этого dbf- файлы (или они тоже читаются целиком)? Пока критерий один- максимальная скорость. Сколько там записей, объектов? Объём в байтах мало кому интересен при разговоре о БД. В файле размеров 352 МБайт расположено 6 000 000 строк, каждая из которых представляет назависимую запись. Другими словами, одна запись в текстовом формате весит примерно 60 Байт (а в двоичном немного меньше ~40 Байт). Скоро попробую скорость при поколоночном хранении в файле и тут отпишу результат. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 11:41 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
Лучше бы вы описали характер данных в файле, распределение по значениям колонок, структуру записи и предполагаемые действия над данными. Столько времени убили, а конкретики до сих пор нет ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 12:03 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
AlekseySQLВ файле размеров 352 МБайт расположено 6 000 000 строк Это всё чудненько влазит в оперативку даже 32-х разрядного процесса. Зачем ты вообще устраиваешь переливание с диска на диск - совершенно непонятно. Posted via ActualForum NNTP Server 1.5 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 12:09 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
AlekseySQLAlekseySQLТак вот, как я помню, на yandex- маркете с помощью фильтров я искал материнки: 1. "в продаже" 2. LGA- 1150 3. PCI Express 3.0 и находил только модели Supermicro (у них специфичный внешний вид, поэтому запомнились) по неадекватным ценам. А теперь там есть модели (от 5500 рублей), которые поддерживают мой процессор и обладают разъемом PCI Express 3.0. Так что если "прижмет", то можно будет апгрейдится. На сайте производителей проанализировал эти материнки и оказалось, что слот PCI Express 3.0 имеет скорость x16, а нужный слот со скоростью x4 имеет старую версию PCI Express 2.0 . Так что отбой: для M.2 придется дополнительно менять: мать, процессор, память.зачем менять? Ну будет PCI карта работать в режиме 2.0 с 4мя линиями ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 12:12 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
Arm79Лучше бы вы описали характер данных в файле, распределение по значениям колонок, структуру записи и предполагаемые действия над данными. Столько времени убили, а конкретики до сих пор нет Пожалуйста, подождите результата теста при "поколоночном" хранении. Возможно все уже сделано, только не протестировано. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 12:40 |
|
||
|
Какую БД выбрать?
|
|||
|---|---|---|---|
|
#18+
Dimitry SibiryakovAlekseySQLВ файле размеров 352 МБайт расположено 6 000 000 строк Это всё чудненько влазит в оперативку даже 32-х разрядного процесса. Зачем ты вообще устраиваешь переливание с диска на диск - совершенно непонятно. Подготавливаю данные для последующего многократного чтения. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2018, 12:40 |
|
||
|
|

start [/forum/topic.php?fid=57&msg=39644153&tid=2017855]: |
0ms |
get settings: |
10ms |
get forum list: |
14ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
59ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
54ms |
get tp. blocked users: |
1ms |
| others: | 14ms |
| total: | 171ms |

| 0 / 0 |
