|
|
|
Создание собственного движка БД
|
|||
|---|---|---|---|
|
#18+
Требуется создать свой движек БД. Задача - быстрый поиск/добавление данных в таблицу. Количество таблиц небольшое, зато объем данных значительный - гигабайты. Индексируем много текстовой информации. Из таблиц пока - словарь со словами в нормальной форме и таблица файлов, в которой содержится информация обо всех проиндексированных словах, принадлежащих файлу. Прошу помощи по информационному и математическому обеспечению :) Где почитать о том, какие существуют структуры данных для хранения информации и быстрого к ней доступа? А также какие наиболее эффективные алгоритмы поиска по таким структурам? Можно на английском. Другая проблема - заказчик почему-то настаивает на XML - как формате для хранения проиндексированных данных и словаря. Я в шоке, представляю сколько места ЭТО будет занимать на диске и сколько времени обрабатываться парсером... Хм, на мой взгляд, намного логичнее хранить словарь и список файлов в бинарном формате. Вот только, чтобы ему это доказать аргументированно, мне нужно побольше почитать про форматы хранения и алгоритмы поиска. Помогите пожалуйста :) ЗЫ. Модераторам: если тема не подходит для раздела - перекиньте, куда нужно :) Спасибо. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.03.2007, 00:55 |
|
||
|
Создание собственного движка БД
|
|||
|---|---|---|---|
|
#18+
Неужели самая перспективное напрвление в IT - это, всё-таки, велосипедостроение? :) Рассмотрите, для начала, целесообразность такой разработки. Неужели задача настолько узкоспециализированная, что необходимо частное решение? И кто гарантирует, что заказчик потом не захочет ещё пару "фич", после которых вам действительно придётся писать какой-нибудь свой гибрид Oracle Text с Berkeley DB... Гигабайты XML-я, это вообще... интересно :) Ну а поскольку вы ещё не приступили (надеюсь), к непосредственной реализации всего этого на C++, предлагаю перенести вопрос в более подходящую ветку форума, например, сюда: http://www.sql.ru/forum/actualtopics.aspx?bid=58 нехай там народ пофлеймит в очередной раз по поводу "Создание собственного движка БД"... Модератора в этой ветке нет, поэтому "переспрашивать" там вам придётся самому. Ну а если там желание не отобьют, заходите ещё :) Удачи. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.03.2007, 02:54 |
|
||
|
Создание собственного движка БД
|
|||
|---|---|---|---|
|
#18+
Да, когда я услышал про гигабайты XML, то чуть не заплакал... Хм, я с удовольствием уговорю заказчика использовать внешнюю БД для хранения индекса, если к ней есть биндинги из Java. Мне самому велосипед делать не особо хочется. Подскажите, на какие БД лучше всего посмотреть? Критерии: GPL, быстрое выполение INSET, SELECT. Не особо важен UPDATE. Хранение больших объемов данных - несколько гигабайт. И чтобы это не съедало всю производительность компа :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.03.2007, 08:52 |
|
||
|
Создание собственного движка БД
|
|||
|---|---|---|---|
|
#18+
мускул да и DBA найти несложно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 24.03.2007, 12:02 |
|
||
|
|

start [/forum/topic.php?fid=57&msg=34413067&tid=2029193]: |
0ms |
get settings: |
7ms |
get forum list: |
15ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
162ms |
get topic data: |
6ms |
get forum data: |
2ms |
get page messages: |
25ms |
get tp. blocked users: |
1ms |
| others: | 194ms |
| total: | 418ms |

| 0 / 0 |
