powered by simpleCommunicator - 2.0.59     © 2026 Programmizd 02
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / Выбор БД (бесплатной)
13 сообщений из 13, страница 1 из 1
Выбор БД (бесплатной)
    #33420703
Arrtem
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Требуется создать довольно массивную базу данных для послудеющего полнотекстового поиска по ней. Всего планируется около 300 - 700 млн. (в главной базе) записей с индекс-текстовым полем длиной предварительно 32 байта и десятком чисел с плавающей запятой. Вспомагательные базы будут содержать двоичные данные, по которым также надо будет делать простые небольшие выборки. Статистики будет мало, критична скорость простой выборки. Пиковая нагрузка - до 50 выборок в секунду.

Посему вопрос, что использовать и сколько это будет стоить вместе с железом? Стоимость критична.
...
Рейтинг: 0 / 0
Выбор БД (бесплатной)
    #33420709
Мимопроходящий
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Привет, Arrtem!
Ты пишешь:

Arrtem A> Требуется создать довольно массивную базу данных для послудеющего полнотекстового поиска по ней.
A> Всего планируется около 300 - 700 млн. (в главной базе) записей с индекс-текстовым полем длиной
A> предварительно 32 байта и десятком чисел с плавающей
A> запятой. Вспомагательные базы будут содержать двоичные данные, по которым
A> также надо будет делать простые небольшие выборки.
A> Статистики будет мало, критична скорость простой выборки. Пиковая нагрузка
A> - до 50 выборок в секунду.

A> Посему вопрос, что использовать и сколько это будет стоить вместе с железом? Стоимость критична.
Курсовик?

--
With best regards, Мимопроходящий.

Posted via ActualForum NNTP Server 1.3
...
Рейтинг: 0 / 0
Выбор БД (бесплатной)
    #33420823
Алексей_3
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Я спец не бошьшой.
Взялбы SQL Server, а из Free выбрал бы FB - даром и сердить, но может возникнуть головняк(план руками писать и всякое такое...), хотя штука стоящая.
...
Рейтинг: 0 / 0
Выбор БД (бесплатной)
    #33421041
gsi___
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Посмотри Berkeley DB

http://www.sleepycat.com/

Не поддерживает SQL, но есть пара моментов..
...
Рейтинг: 0 / 0
Выбор БД (бесплатной)
    #33421737
Arrtem
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
Мимопроходящий
Привет, Arrtem!
Ты пишешь:

Курсовик?

--
With best regards, Мимопроходящий.

Posted via ActualForum NNTP Server 1.3

Так точно :)
...
Рейтинг: 0 / 0
Выбор БД (бесплатной)
    #33422115
Arrtem
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
to gsi___: Почитал, вполне устраивает. Спасибо.

to all Не укажете, где найти тесты производительности по Berkley? И последний вопрос: в Berkley есть полнотекстовый поиск?? Или сами, ручками..
...
Рейтинг: 0 / 0
Выбор БД (бесплатной)
    #33422208
guest_20040621
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
> Требуется создать довольно массивную базу данных для послудеющего
> полнотекстового поиска по ней.

Маленький домашний google?

> Посему вопрос, что использовать и сколько это будет стоить вместе с железом?

labs.google.com + калькулятор

> Стоимость критична.

;))) И в какой бюджет надо уложиться?
...
Рейтинг: 0 / 0
Выбор БД (бесплатной)
    #33422213
Фотография vadiminfo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Курсовик 300-700 млн записей? Конечно, играет роль средний размер одной записи, но все-таки. И скока запрос должен по времени один выполняться? Про 50 одновременно в секунду я и не говорю. Для таких задач, возможно, система ценой 50000$ не такая уж дорогая - типа бесплатно.
...
Рейтинг: 0 / 0
Выбор БД (бесплатной)
    #33422786
Arrtem
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость

vadiminfoКурсовик 300-700 млн записей? Конечно, играет роль средний размер одной записи, но все-таки. И скока запрос должен по времени один выполняться? Про 50 одновременно в секунду я и не говорю. Для таких задач, возможно, система ценой 50000$ не такая уж дорогая - типа бесплатно.

Вот - вот)) Хорошо, отметаем вопрос стоимости.
+ я не верно объяснил кол-во записей. Это я написал для объяснения объема информации - где-то около 70 Гб. во всей базе. А объемы текста, по которому собираюсь вести поиск - это несколько миллионов строк (< 10). Причем не хотелось бы строить сложные ступенчатые индексы самостоятельно.

Но вопрос скорости остается, поэтому вопрос: какая машина должна быть и какую базу лучше использовать, чтобы можно было делать выборку из 1..10 Гб. базы по текстовому полю с несколькими словами и какие при этом ориентировочно будут задержки.

Вопрос 2. Есть машина 2*Xeon 1.8 Ghz, 2Гб. RAM. Какие для такой машины будут задержки с указанной базой? А на P4 3.0 Ghz
...
Рейтинг: 0 / 0
Выбор БД (бесплатной)
    #33423151
aZm
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
а дисковая подсистема какая :)?

---
No Pity. No Mercy. No Regret.
...
Рейтинг: 0 / 0
Выбор БД (бесплатной)
    #33423266
Arrtem
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
RAID 1
...
Рейтинг: 0 / 0
Выбор БД (бесплатной)
    #33423767
Фотография vadiminfo
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Arrtem
Но вопрос скорости остается, поэтому вопрос: какая машина должна быть и какую базу лучше использовать, чтобы можно было делать выборку из 1..10 Гб. базы по текстовому полю с несколькими словами и какие при этом ориентировочно будут задержки.

Мне кажется, с такими требованиям Вы выходите на лидирующие СУБД, в том числе и по TCP тестам (DB2, Оракл, Скуль). В нашей стране остаются, скорее всего, два последние - легче проконсультироваться в реале. Я Ораклист. Могу тока сказать, что в нем полно фич и для текстовых полей. Например, там есть Oracle Text со специальным каким-то индексированием.
Однако, наверное, чтобы Вам сказали что-то в сторону задержек нужны структура таблы, что-то про особенности данных и критичные запросы.
...
Рейтинг: 0 / 0
Выбор БД (бесплатной)
    #33423968
Arrtem
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
vadiminfo Arrtem
Но вопрос скорости остается, поэтому вопрос: какая машина должна быть и какую базу лучше использовать, чтобы можно было делать выборку из 1..10 Гб. базы по текстовому полю с несколькими словами и какие при этом ориентировочно будут задержки.

Мне кажется, с такими требованиям Вы выходите на лидирующие СУБД, в том числе и по TCP тестам (DB2, Оракл, Скуль). В нашей стране остаются, скорее всего, два последние - легче проконсультироваться в реале. Я Ораклист. Могу тока сказать, что в нем полно фич и для текстовых полей. Например, там есть Oracle Text со специальным каким-то индексированием.
Однако, наверное, чтобы Вам сказали что-то в сторону задержек нужны структура таблы, что-то про особенности данных и критичные запросы.

Спасибо, Вадим, это я и хотел узнать. Будем пробовать, может чего и получится..
...
Рейтинг: 0 / 0
13 сообщений из 13, страница 1 из 1
Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / Выбор БД (бесплатной)
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]