powered by simpleCommunicator - 2.0.61     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / C++ [игнор отключен] [закрыт для гостей] / Создание собственного движка БД
4 сообщений из 4, страница 1 из 1
Создание собственного движка БД
    #34413067
Slader
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Требуется создать свой движек БД. Задача - быстрый поиск/добавление данных в таблицу. Количество таблиц небольшое, зато объем данных значительный - гигабайты. Индексируем много текстовой информации. Из таблиц пока - словарь со словами в нормальной форме и таблица файлов, в которой содержится информация обо всех проиндексированных словах, принадлежащих файлу.
Прошу помощи по информационному и математическому обеспечению :)

Где почитать о том, какие существуют структуры данных для хранения информации и быстрого к ней доступа? А также какие наиболее эффективные алгоритмы поиска по таким структурам?
Можно на английском.

Другая проблема - заказчик почему-то настаивает на XML - как формате для хранения проиндексированных данных и словаря. Я в шоке, представляю сколько места ЭТО будет занимать на диске и сколько времени обрабатываться парсером...
Хм, на мой взгляд, намного логичнее хранить словарь и список файлов в бинарном формате. Вот только, чтобы ему это доказать аргументированно, мне нужно побольше почитать про форматы хранения и алгоритмы поиска.

Помогите пожалуйста :)

ЗЫ. Модераторам: если тема не подходит для раздела - перекиньте, куда нужно :) Спасибо.
...
Рейтинг: 0 / 0
Создание собственного движка БД
    #34413091
Тынц.
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Неужели самая перспективное напрвление в IT - это, всё-таки, велосипедостроение? :)

Рассмотрите, для начала, целесообразность такой разработки. Неужели задача настолько узкоспециализированная, что необходимо частное решение? И кто гарантирует, что заказчик потом не захочет ещё пару "фич", после которых вам действительно придётся писать какой-нибудь свой гибрид Oracle Text с Berkeley DB... Гигабайты XML-я, это вообще... интересно :)

Ну а поскольку вы ещё не приступили (надеюсь), к непосредственной реализации всего этого на C++, предлагаю перенести вопрос в более подходящую ветку форума, например, сюда:
http://www.sql.ru/forum/actualtopics.aspx?bid=58
нехай там народ пофлеймит в очередной раз по поводу "Создание собственного движка БД"...

Модератора в этой ветке нет, поэтому "переспрашивать" там вам придётся самому.

Ну а если там желание не отобьют, заходите ещё :)

Удачи.
...
Рейтинг: 0 / 0
Создание собственного движка БД
    #34413162
Slader
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Да, когда я услышал про гигабайты XML, то чуть не заплакал...

Хм, я с удовольствием уговорю заказчика использовать внешнюю БД для хранения индекса, если к ней есть биндинги из Java. Мне самому велосипед делать не особо хочется.
Подскажите, на какие БД лучше всего посмотреть? Критерии: GPL, быстрое выполение INSET, SELECT. Не особо важен UPDATE. Хранение больших объемов данных - несколько гигабайт. И чтобы это не съедало всю производительность компа :)
...
Рейтинг: 0 / 0
Создание собственного движка БД
    #34413294
Фотография blinded
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
мускул да и DBA найти несложно.
...
Рейтинг: 0 / 0
4 сообщений из 4, страница 1 из 1
Форумы / C++ [игнор отключен] [закрыт для гостей] / Создание собственного движка БД
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]