powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Проектирование хранилища
8 сообщений из 8, страница 1 из 1
Проектирование хранилища
    #34517278
GoST
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
здравствуите господа

прежде чем открыть тему, долго думал, но принять решение не смог. так что решил спросить мнение у колег.
условия:
сервер експрес версии. соответветственная апаратная поддежка (или ещо хуже).
данные:
максимум 150 000 записей в месяц (расчет веду на 300 000), значит 150 000 * 12 = 1 800 000 (расчет веду на 300 000 * 12 = 3 600 000), как говорится - запас.
в основном будет производится insert. delete, update очен редко.
тепер про запросы:
по дням (~70%), по неделям или около того (~15%), по месяцам (~5%), по годам (~2%), все осталное (осталное).
то что таблицу придется горизонтально резать, однозначно. вопрос в том как. по месяцам или по годам.
для меня проше по годам, менше гемароя.
для скорости работы по месяцам. но вот каким будет выиграш в скорости и стоит ли из за этого мучатся?

что вы скажете господа?
спосибо
...
Рейтинг: 0 / 0
Проектирование хранилища
    #34517453
Алексей Ключников
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Поля каких типов будете использовать?

3 миллиона записей.
Это вроде как не так уж много
Если сервер будет можный режте по годам.
Если celeron 1000Мгц то по месяцам.
...
Рейтинг: 0 / 0
Проектирование хранилища
    #34517458
Алексей Ключников
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Это в расчете на 1-3 одновременных конекта на select :)
и на то что информация будет инсертится более менее равномерно, а не в конце недели все сразу :)
...
Рейтинг: 0 / 0
Проектирование хранилища
    #34517648
GoST
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
железо в большенстве случаев будет несвежим, вплодь до П3 (может и п2, недавно один даже п1 прислал :), вот так то) правда в таких случаях и нагрузка менше на порядок.
а стандартно (при максималних нагрузках) расчитываю на п4-3000, 1г оперативки.
максимално 15 машин в сети.
запросы на инсерт в пик - 1 транзакция за 2-3 секунды.
запросы на селект, в пик - 1- за 2-3 минуты. запросы к остальным таблицам не в счет.
вобшем, нагрузка реально не ахти. меня больше волнует что большенство запросов будут навароченними, придется симулировать olap, будут навороченные расчеты. кароче статистика. нужно чтоб все это крутилас быстро, максимум 1-2секунды. т.е. пока отрисовывается екран, данные уже на месте :).
что касается данных: максимум 5-7 текставых полеи, остальные числовые.
правда дольжен изменить стартовые условия, только что сообшили:
не 150 000 а 250 000-300 000 записей в месяц (значит с запасом надо предполагать 600 000), т.е. на год надо расчитывать на 7 200 000 записей. а обем нынче в пределах 70 метров в месяц, без текставых полеи, с текстами будет в разы больше. значит придется тексты вынести в справочные таблицы, что увеличит время запроса.
...
Рейтинг: 0 / 0
Проектирование хранилища
    #34517654
DPH
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
DPH
Гость
А какого типа запросы?
Всяческие materialized_view (и как там они еще называются - у каждого сервера свое название) не помогут?
...
Рейтинг: 0 / 0
Проектирование хранилища
    #34517736
GoST
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
функцию сервера будет выполнять експрес версия (DB2 или более вероятно MS SQL Server). а в этих версиях подобних наворотов нет. под ентерпраиз версии думать про такие мелочи даже грешно.
...
Рейтинг: 0 / 0
Проектирование хранилища
    #34519281
Serik Akhmetov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
gostдля скорости работы по месяцам. но вот каким будет выиграш в скорости и стоит ли из за этого мучатся?

что вы скажете господа?Нагенерировать тестовых данных и проверить. А так, неведомая БД, не известная структура, неизвестные запросы...
Как решить уравнение из одних неизвестных переменных ?

Мой совет - брать то, что лучше знаешь.
...
Рейтинг: 0 / 0
Проектирование хранилища
    #34520775
GoST
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Serik Akhmetov Нагенерировать тестовых данных и проверить. А так, неведомая БД, не известная структура, неизвестные запросы...
Как решить уравнение из одних неизвестных переменных ?начну с конца, про тип данных писал, писал что хранилище, значит все валится в одну кучу (нет нормализации). нужны будут расчеты.
что касается експеримента, нынче не могу емулировать реалную ситуацию. но года четыре назад проводил. имел реалные базы в реално работаюшеи организации. данные хранилис в парадоксе и д бесе. таблицы хранилища были разбити по месяцам, т.е каждый месяц добовлялас новая таблица. для баз был выделенный комп (фаил сервер). работа велас через BDE. (я был среди обслуживаюшего персонала, так что доступ имел).
на этот выделенный комп установил интербеис, создал базу с двумя таблицами, и слил туда данные трех лет (таблицы не резал, все 36-36 таблиц соответственно в одну). эксперимет чистым не назвать, так как так как в парадоксе и двесе были индекси, в интервеисе индексов не делал.
в резултате, все простые или агрегатные запросы на интервеисе выполнялис быстрее (ну естественно), но попытка емуляции олапа, на период болше шести месяцев, убивала машину на долго (делал кубами делфи, чтобы подход был одинаковым, и не загружать сервер, всеже с ним работала вся кантора :)).
на этот раз тут спрашиваю потому, чтоб узнать про опыт решения подобных задач, накопленный моими колегами.
...
Рейтинг: 0 / 0
8 сообщений из 8, страница 1 из 1
Форумы / Проектирование БД [игнор отключен] [закрыт для гостей] / Проектирование хранилища
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]