|
|
|
База данных для Linux. Сотни миллионов записей.
|
|||
|---|---|---|---|
|
#18+
Выбираю какую базу данных использовать. Предполагается, что количество записей будет более 100 миллионов , скорее всего в районе 500 миллионов, но точно не более 1 миллиарда. Структура базы очень простая, первая таблица ~ 10-50 миллионов записей, вторая ~100-500 миллионов записей. Между записями свзязь many-to-many. Наиболее частый запрос - выбрать запись (либо набор записей не более чем 10к), либо из первой, либо из второй таблицы, и связанные с ней значения из второй. Размер записи мал ~10 полей. Нагрузка также невелика, не более 100 запросов в секунду. Пока склоняюсь в сторону PostgeSQL, но боюсь что может не справиться. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.04.2008, 19:50 |
|
||
|
База данных для Linux. Сотни миллионов записей.
|
|||
|---|---|---|---|
|
#18+
структура простая, значит навороченость оптимизатора большой роли не сыграет и скорострельность будет упиратся в i/o. Postgres неплохой кандидат, но постгрес и другие опен соурс субд не умеют многоблочного чтения, что похоже на вашей задаче может сильно помочь. так что смотрите на платный оракл или db2 luw (100 запросов в секунду наверно не оставляет шансов бесплатной редакции db2 express-C) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 27.04.2008, 20:41 |
|
||
|
База данных для Linux. Сотни миллионов записей.
|
|||
|---|---|---|---|
|
#18+
Гм, а что помешает Express C на таких объемах дать 100 запросов в секунду? Я гонял ExpressC на весьма слабом сервере, пару сотен запросов в секунду без проблем для десятков млн. записей (больше не гонял, увы). Тут скорее стоит думать о необходимости 24*7 и решать, что проще - купить за 6K$ лицензию с HADR для ExpressC или настраивать Postgress ручками (мне кажется, что купить будет дешевле - но это для каждого конкретного случая нужно решать). Впрочем, все едино, нужно поставить всех кандидатов (благо ставится легко) и погонять даже на коробочных настройках. Или исходить из того, какой DBA доступнее :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.04.2008, 00:18 |
|
||
|
База данных для Linux. Сотни миллионов записей.
|
|||
|---|---|---|---|
|
#18+
500 миллионов - 1 миллиард - это цифра, которая вероятнее всего будет достигнута при работе приложения в течении довольно длительного времени. То есть прямо вот сразу держать такое количество записей задача не стоит, но предусмотреть такую ситуацию все таки надо. В начале количество записей будет измеряться десятками миллионов. Завтра буду ставить и тестировать DB2 Express-c. Насколько я понимаю, в случае нехватки возможностей express-c версии, переход на полноценную выполняется элементарно? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.04.2008, 01:08 |
|
||
|
База данных для Linux. Сотни миллионов записей.
|
|||
|---|---|---|---|
|
#18+
100 запосов на чтение в секунду - для Express-C (на хорошем железе) совсем немного. Даже на запись - немного. Локальный коннект (напр, через сервер приложений на том же серевре) м.б. быстрее. Есть некоторые ускоряющие обработку хитрости, имеет смысл заглянуть в профильную конфу по соседству. Ставить имеет смысл Express-C 9.5 и перед тестами прогнать на БД Configuration Advisor (из Control Center, несколько тыков мышом), выдав ему 100% ресурсов - с настройками по умолчанию DB2 скромничает :) Если база большая и опыт в администрировании есть, можно попробовать Express-C 9.1.2 - ему доступно вдвое больше ресурсов. На все до Enterprise переход тривиален. Можно сказать, что основные отличия между "младшими" версиями - в файле лицензии :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.04.2008, 14:32 |
|
||
|
База данных для Linux. Сотни миллионов записей.
|
|||
|---|---|---|---|
|
#18+
realityПока склоняюсь в сторону PostgeSQL, но боюсь что может не справиться.А вы не бойтесь, а сделайте тест. Без реальной проверки ничего сказать нельзя. А сколько ориентировочно будут занимать места оперативные данные? Если не много (до 16 Гб), то можно попытаться за счет большого кэша держать все данные в памяти. Но нужно проверять и тестировать ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.04.2008, 14:44 |
|
||
|
База данных для Linux. Сотни миллионов записей.
|
|||
|---|---|---|---|
|
#18+
realityМежду записями свзязь many-to-many.И сколько таких связей? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.04.2008, 18:14 |
|
||
|
База данных для Linux. Сотни миллионов записей.
|
|||
|---|---|---|---|
|
#18+
... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 28.04.2008, 18:24 |
|
||
|
База данных для Linux. Сотни миллионов записей.
|
|||
|---|---|---|---|
|
#18+
DPH3Гм, а что помешает Express C на таких объемах дать 100 запросов в секунду? ну, например ограничение в 2Gb RAM которые db2 express-c сумеет использовать. да и ограничение в пол процессора не скажется положительно на перформенс. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.04.2008, 09:49 |
|
||
|
База данных для Linux. Сотни миллионов записей.
|
|||
|---|---|---|---|
|
#18+
Кстати, а связочка many-to-many на таких объемах сколько будет записей тянуть, ориентировочно? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 29.04.2008, 15:24 |
|
||
|
База данных для Linux. Сотни миллионов записей.
|
|||
|---|---|---|---|
|
#18+
Yo.! DPH3Гм, а что помешает Express C на таких объемах дать 100 запросов в секунду? ну, например ограничение в 2Gb RAM которые db2 express-c сумеет использовать. да и ограничение в пол процессора не скажется положительно на перформенс. Ну, у меня 200 запросов в секунду на паре млн. записей было на ноутбуке с одним ядром и 1 гигом памяти ;) Так что как-нибудь получится :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 04.05.2008, 21:51 |
|
||
|
База данных для Linux. Сотни миллионов записей.
|
|||
|---|---|---|---|
|
#18+
realityВыбираю какую базу данных использовать. Предполагается, что количество записей будет более 100 миллионов , скорее всего в районе 500 миллионов, но точно не более 1 миллиарда. Структура базы очень простая, первая таблица ~ 10-50 миллионов записей, вторая ~100-500 миллионов записей. Между записями свзязь many-to-many. Наиболее частый запрос - выбрать запись (либо набор записей не более чем 10к), либо из первой, либо из второй таблицы, и связанные с ней значения из второй. Размер записи мал ~10 полей. Нагрузка также невелика, не более 100 запросов в секунду. Пока склоняюсь в сторону PostgeSQL, но боюсь что может не справиться. Используйте GT.M без сомнений! На таком объёме я её вчера испытывал. (Результат можете посмотреть на Google comp.lang.mumps тема "I am afraid of own routine!") Как CGI шлюз это просто супер. Исходники смогу Вам переслать по e-mail ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2008, 00:42 |
|
||
|
База данных для Linux. Сотни миллионов записей.
|
|||
|---|---|---|---|
|
#18+
попробуйте посмотреть в сторону хранилища данных Sybase IQ... Выборки будут оч. скоростными, а еще если и дерномализуете БД :)... но вот все остальное... ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.10.2008, 11:51 |
|
||
|
База данных для Linux. Сотни миллионов записей.
|
|||
|---|---|---|---|
|
#18+
Yo.! ну, например ограничение в 2Gb RAM которые db2 express-c сумеет использовать. да и ограничение в пол процессора не скажется положительно на перформенс. Разве не 4Gb? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 09.10.2008, 19:22 |
|
||
|
База данных для Linux. Сотни миллионов записей.
|
|||
|---|---|---|---|
|
#18+
Delphi_coder Yo.! ну, например ограничение в 2Gb RAM которые db2 express-c сумеет использовать. да и ограничение в пол процессора не скажется положительно на перформенс. Разве не 4Gb? Неа. Db2 одназначно! 200 запросов в секунду - легко. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.10.2008, 18:41 |
|
||
|
База данных для Linux. Сотни миллионов записей.
|
|||
|---|---|---|---|
|
#18+
кстати, что-то я пропустил. ну две таблицы - ладно. ну связь много ко многим - ладно. но где третья таблица? которая эту m-m связь обеспечивает? :-) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.10.2008, 00:15 |
|
||
|
База данных для Linux. Сотни миллионов записей.
|
|||
|---|---|---|---|
|
#18+
Абсолют Delphi_coderРазве не 4Gb? Неа. Db2 одназначно! 200 запросов в секунду - легко.4Gb - у 9.1.2, но надо париться с настройками. 2Gb - у 9.5 с автоматическим администрированием. У нас 9.5 легко тянет и 400 в сек. + немного аналитики, причем нагрузка сервера никакая, т.е. явно может куда больше. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 13.10.2008, 14:36 |
|
||
|
|

start [/forum/topic.php?fid=35&msg=35286175&tid=1553034]: |
0ms |
get settings: |
11ms |
get forum list: |
12ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
42ms |
get topic data: |
10ms |
get forum data: |
3ms |
get page messages: |
53ms |
get tp. blocked users: |
1ms |
| others: | 240ms |
| total: | 378ms |

| 0 / 0 |
