|
|
|
Проектирование хранилища
|
|||
|---|---|---|---|
|
#18+
здравствуите господа прежде чем открыть тему, долго думал, но принять решение не смог. так что решил спросить мнение у колег. условия: сервер експрес версии. соответветственная апаратная поддежка (или ещо хуже). данные: максимум 150 000 записей в месяц (расчет веду на 300 000), значит 150 000 * 12 = 1 800 000 (расчет веду на 300 000 * 12 = 3 600 000), как говорится - запас. в основном будет производится insert. delete, update очен редко. тепер про запросы: по дням (~70%), по неделям или около того (~15%), по месяцам (~5%), по годам (~2%), все осталное (осталное). то что таблицу придется горизонтально резать, однозначно. вопрос в том как. по месяцам или по годам. для меня проше по годам, менше гемароя. для скорости работы по месяцам. но вот каким будет выиграш в скорости и стоит ли из за этого мучатся? что вы скажете господа? спосибо ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.05.2007, 18:11 |
|
||
|
Проектирование хранилища
|
|||
|---|---|---|---|
|
#18+
Поля каких типов будете использовать? 3 миллиона записей. Это вроде как не так уж много Если сервер будет можный режте по годам. Если celeron 1000Мгц то по месяцам. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.05.2007, 19:16 |
|
||
|
Проектирование хранилища
|
|||
|---|---|---|---|
|
#18+
Это в расчете на 1-3 одновременных конекта на select :) и на то что информация будет инсертится более менее равномерно, а не в конце недели все сразу :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.05.2007, 19:19 |
|
||
|
Проектирование хранилища
|
|||
|---|---|---|---|
|
#18+
железо в большенстве случаев будет несвежим, вплодь до П3 (может и п2, недавно один даже п1 прислал :), вот так то) правда в таких случаях и нагрузка менше на порядок. а стандартно (при максималних нагрузках) расчитываю на п4-3000, 1г оперативки. максимално 15 машин в сети. запросы на инсерт в пик - 1 транзакция за 2-3 секунды. запросы на селект, в пик - 1- за 2-3 минуты. запросы к остальным таблицам не в счет. вобшем, нагрузка реально не ахти. меня больше волнует что большенство запросов будут навароченними, придется симулировать olap, будут навороченные расчеты. кароче статистика. нужно чтоб все это крутилас быстро, максимум 1-2секунды. т.е. пока отрисовывается екран, данные уже на месте :). что касается данных: максимум 5-7 текставых полеи, остальные числовые. правда дольжен изменить стартовые условия, только что сообшили: не 150 000 а 250 000-300 000 записей в месяц (значит с запасом надо предполагать 600 000), т.е. на год надо расчитывать на 7 200 000 записей. а обем нынче в пределах 70 метров в месяц, без текставых полеи, с текстами будет в разы больше. значит придется тексты вынести в справочные таблицы, что увеличит время запроса. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.05.2007, 21:29 |
|
||
|
Проектирование хранилища
|
|||
|---|---|---|---|
|
#18+
А какого типа запросы? Всяческие materialized_view (и как там они еще называются - у каждого сервера свое название) не помогут? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.05.2007, 21:34 |
|
||
|
Проектирование хранилища
|
|||
|---|---|---|---|
|
#18+
функцию сервера будет выполнять експрес версия (DB2 или более вероятно MS SQL Server). а в этих версиях подобних наворотов нет. под ентерпраиз версии думать про такие мелочи даже грешно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 10.05.2007, 22:48 |
|
||
|
Проектирование хранилища
|
|||
|---|---|---|---|
|
#18+
gostдля скорости работы по месяцам. но вот каким будет выиграш в скорости и стоит ли из за этого мучатся? что вы скажете господа?Нагенерировать тестовых данных и проверить. А так, неведомая БД, не известная структура, неизвестные запросы... Как решить уравнение из одних неизвестных переменных ? Мой совет - брать то, что лучше знаешь. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 11.05.2007, 14:20 |
|
||
|
Проектирование хранилища
|
|||
|---|---|---|---|
|
#18+
Serik Akhmetov Нагенерировать тестовых данных и проверить. А так, неведомая БД, не известная структура, неизвестные запросы... Как решить уравнение из одних неизвестных переменных ?начну с конца, про тип данных писал, писал что хранилище, значит все валится в одну кучу (нет нормализации). нужны будут расчеты. что касается експеримента, нынче не могу емулировать реалную ситуацию. но года четыре назад проводил. имел реалные базы в реално работаюшеи организации. данные хранилис в парадоксе и д бесе. таблицы хранилища были разбити по месяцам, т.е каждый месяц добовлялас новая таблица. для баз был выделенный комп (фаил сервер). работа велас через BDE. (я был среди обслуживаюшего персонала, так что доступ имел). на этот выделенный комп установил интербеис, создал базу с двумя таблицами, и слил туда данные трех лет (таблицы не резал, все 36-36 таблиц соответственно в одну). эксперимет чистым не назвать, так как так как в парадоксе и двесе были индекси, в интервеисе индексов не делал. в резултате, все простые или агрегатные запросы на интервеисе выполнялис быстрее (ну естественно), но попытка емуляции олапа, на период болше шести месяцев, убивала машину на долго (делал кубами делфи, чтобы подход был одинаковым, и не загружать сервер, всеже с ним работала вся кантора :)). на этот раз тут спрашиваю потому, чтоб узнать про опыт решения подобных задач, накопленный моими колегами. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 12.05.2007, 10:24 |
|
||
|
|

start [/forum/topic.php?fid=32&msg=34519281&tid=1544542]: |
0ms |
get settings: |
10ms |
get forum list: |
21ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
157ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
60ms |
get tp. blocked users: |
2ms |
| others: | 216ms |
| total: | 486ms |

| 0 / 0 |
