|
|
|
Создание БД для работы с большим количеством файлов
|
|||
|---|---|---|---|
|
#18+
Проектирую БД (MS SQL) для работы с большим количеством файлов. За месяц в систему будет поступать 300 000 отсканированных документов (возможно увеличение до 1 000 000 в будущем). Поступать будут равномерно на протяжении всего месяца. Каждый документ автоматически распознается (по возможности) и информация с него должна попасть в БД (около 25 полей сейчас, а сколько может быть – пока не знаю). Сам документ(*.pdf,*.jpg…) тоже по возможности нужно сохранить в БД. Пользователь будет сравнивать исходник с распознанным и редактировать/подтверждать. В системе параллельно могут вестись несколько заказов и данные по ним должны накапливаться. Количество различных данных, выбираемых из файлов варьируется в зависимости от заказа. Необходимо предусмотреть возможность выгрузки/загрузки данных в базу. Есть ли смысл хранить исходные файлы отдельно не в БД, а только ссылки на них (если файлы будут около 200 Кб*3,6 млн = дополнительно 720 Гб за год)? Если за год будет 3,6 млн файлов, и данные постоянно будут добавляться, как это повлияет на скорость поиска (постоянная переиндексация)? Каким образом хранить данные из файлов – одна таблица – все данные, одна таблица – одно поле, комбинированные значения? Есть ли где-то возможность почитать литературу по подобного рода задачам? Модератор: Тема перенесена из форума "Microsoft SQL Server". ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.12.2009, 14:55 |
|
||
|
|

start [/forum/topic.php?fid=32&msg=36354567&tid=1542944]: |
0ms |
get settings: |
8ms |
get forum list: |
20ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
68ms |
get topic data: |
11ms |
get forum data: |
3ms |
get page messages: |
55ms |
get tp. blocked users: |
2ms |
| others: | 211ms |
| total: | 384ms |

| 0 / 0 |
