
Новые сообщения [новые:0]
Дайджест
Горячие темы
Избранное [новые:0]
Форумы
Пользователи
Статистика
Статистика нагрузки
Мод. лог
Поиск
|
|
08.12.2009, 14:55
|
|||
|---|---|---|---|
|
|||
Создание БД для работы с большим количеством файлов |
|||
|
#18+
Проектирую БД (MS SQL) для работы с большим количеством файлов. За месяц в систему будет поступать 300 000 отсканированных документов (возможно увеличение до 1 000 000 в будущем). Поступать будут равномерно на протяжении всего месяца. Каждый документ автоматически распознается (по возможности) и информация с него должна попасть в БД (около 25 полей сейчас, а сколько может быть – пока не знаю). Сам документ(*.pdf,*.jpg…) тоже по возможности нужно сохранить в БД. Пользователь будет сравнивать исходник с распознанным и редактировать/подтверждать. В системе параллельно могут вестись несколько заказов и данные по ним должны накапливаться. Количество различных данных, выбираемых из файлов варьируется в зависимости от заказа. Необходимо предусмотреть возможность выгрузки/загрузки данных в базу. Есть ли смысл хранить исходные файлы отдельно не в БД, а только ссылки на них (если файлы будут около 200 Кб*3,6 млн = дополнительно 720 Гб за год)? Если за год будет 3,6 млн файлов, и данные постоянно будут добавляться, как это повлияет на скорость поиска (постоянная переиндексация)? Каким образом хранить данные из файлов – одна таблица – все данные, одна таблица – одно поле, комбинированные значения? Есть ли где-то возможность почитать литературу по подобного рода задачам? Модератор: Тема перенесена из форума "Microsoft SQL Server". ... |
|||
|
:
Нравится:
Не нравится:
|
|||
|
|
|

start [/forum/topic.php?fid=32&mobile=1&tid=1542944]: |
0ms |
get settings: |
9ms |
get forum list: |
19ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
167ms |
get topic data: |
10ms |
get forum data: |
2ms |
get page messages: |
43ms |
get tp. blocked users: |
1ms |
| others: | 214ms |
| total: | 471ms |

| 0 / 0 |
