Этот баннер — требование Роскомнадзора для исполнения 152 ФЗ.
«На сайте осуществляется обработка файлов cookie, необходимых для работы сайта, а также для анализа использования сайта и улучшения предоставляемых сервисов с использованием метрической программы Яндекс.Метрика. Продолжая использовать сайт, вы даёте согласие с использованием данных технологий».
Политика конфиденциальности
|
|
|
Выбор БД (бесплатной)
|
|||
|---|---|---|---|
|
#18+
Требуется создать довольно массивную базу данных для послудеющего полнотекстового поиска по ней. Всего планируется около 300 - 700 млн. (в главной базе) записей с индекс-текстовым полем длиной предварительно 32 байта и десятком чисел с плавающей запятой. Вспомагательные базы будут содержать двоичные данные, по которым также надо будет делать простые небольшие выборки. Статистики будет мало, критична скорость простой выборки. Пиковая нагрузка - до 50 выборок в секунду. Посему вопрос, что использовать и сколько это будет стоить вместе с железом? Стоимость критична. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.12.2005, 19:29 |
|
||
|
Выбор БД (бесплатной)
|
|||
|---|---|---|---|
|
#18+
Привет, Arrtem! Ты пишешь: Arrtem A> Требуется создать довольно массивную базу данных для послудеющего полнотекстового поиска по ней. A> Всего планируется около 300 - 700 млн. (в главной базе) записей с индекс-текстовым полем длиной A> предварительно 32 байта и десятком чисел с плавающей A> запятой. Вспомагательные базы будут содержать двоичные данные, по которым A> также надо будет делать простые небольшие выборки. A> Статистики будет мало, критична скорость простой выборки. Пиковая нагрузка A> - до 50 выборок в секунду. A> Посему вопрос, что использовать и сколько это будет стоить вместе с железом? Стоимость критична. Курсовик? -- With best regards, Мимопроходящий. Posted via ActualForum NNTP Server 1.3 ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.12.2005, 19:32 |
|
||
|
Выбор БД (бесплатной)
|
|||
|---|---|---|---|
|
#18+
Я спец не бошьшой. Взялбы SQL Server, а из Free выбрал бы FB - даром и сердить, но может возникнуть головняк(план руками писать и всякое такое...), хотя штука стоящая. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 06.12.2005, 21:27 |
|
||
|
Выбор БД (бесплатной)
|
|||
|---|---|---|---|
|
#18+
Посмотри Berkeley DB http://www.sleepycat.com/ Не поддерживает SQL, но есть пара моментов.. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.12.2005, 05:50 |
|
||
|
Выбор БД (бесплатной)
|
|||
|---|---|---|---|
|
#18+
Мимопроходящий Привет, Arrtem! Ты пишешь: Курсовик? -- With best regards, Мимопроходящий. Posted via ActualForum NNTP Server 1.3 Так точно :) ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.12.2005, 12:07 |
|
||
|
Выбор БД (бесплатной)
|
|||
|---|---|---|---|
|
#18+
to gsi___: Почитал, вполне устраивает. Спасибо. to all Не укажете, где найти тесты производительности по Berkley? И последний вопрос: в Berkley есть полнотекстовый поиск?? Или сами, ручками.. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.12.2005, 13:29 |
|
||
|
Выбор БД (бесплатной)
|
|||
|---|---|---|---|
|
#18+
> Требуется создать довольно массивную базу данных для послудеющего > полнотекстового поиска по ней. Маленький домашний google? > Посему вопрос, что использовать и сколько это будет стоить вместе с железом? labs.google.com + калькулятор > Стоимость критична. ;))) И в какой бюджет надо уложиться? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.12.2005, 13:44 |
|
||
|
Выбор БД (бесплатной)
|
|||
|---|---|---|---|
|
#18+
Курсовик 300-700 млн записей? Конечно, играет роль средний размер одной записи, но все-таки. И скока запрос должен по времени один выполняться? Про 50 одновременно в секунду я и не говорю. Для таких задач, возможно, система ценой 50000$ не такая уж дорогая - типа бесплатно. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.12.2005, 13:46 |
|
||
|
Выбор БД (бесплатной)
|
|||
|---|---|---|---|
|
#18+
vadiminfoКурсовик 300-700 млн записей? Конечно, играет роль средний размер одной записи, но все-таки. И скока запрос должен по времени один выполняться? Про 50 одновременно в секунду я и не говорю. Для таких задач, возможно, система ценой 50000$ не такая уж дорогая - типа бесплатно. Вот - вот)) Хорошо, отметаем вопрос стоимости. + я не верно объяснил кол-во записей. Это я написал для объяснения объема информации - где-то около 70 Гб. во всей базе. А объемы текста, по которому собираюсь вести поиск - это несколько миллионов строк (< 10). Причем не хотелось бы строить сложные ступенчатые индексы самостоятельно. Но вопрос скорости остается, поэтому вопрос: какая машина должна быть и какую базу лучше использовать, чтобы можно было делать выборку из 1..10 Гб. базы по текстовому полю с несколькими словами и какие при этом ориентировочно будут задержки. Вопрос 2. Есть машина 2*Xeon 1.8 Ghz, 2Гб. RAM. Какие для такой машины будут задержки с указанной базой? А на P4 3.0 Ghz ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.12.2005, 15:53 |
|
||
|
Выбор БД (бесплатной)
|
|||
|---|---|---|---|
|
#18+
а дисковая подсистема какая :)? --- No Pity. No Mercy. No Regret. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 07.12.2005, 17:20 |
|
||
|
Выбор БД (бесплатной)
|
|||
|---|---|---|---|
|
#18+
Arrtem Но вопрос скорости остается, поэтому вопрос: какая машина должна быть и какую базу лучше использовать, чтобы можно было делать выборку из 1..10 Гб. базы по текстовому полю с несколькими словами и какие при этом ориентировочно будут задержки. Мне кажется, с такими требованиям Вы выходите на лидирующие СУБД, в том числе и по TCP тестам (DB2, Оракл, Скуль). В нашей стране остаются, скорее всего, два последние - легче проконсультироваться в реале. Я Ораклист. Могу тока сказать, что в нем полно фич и для текстовых полей. Например, там есть Oracle Text со специальным каким-то индексированием. Однако, наверное, чтобы Вам сказали что-то в сторону задержек нужны структура таблы, что-то про особенности данных и критичные запросы. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.12.2005, 01:34 |
|
||
|
Выбор БД (бесплатной)
|
|||
|---|---|---|---|
|
#18+
vadiminfo Arrtem Но вопрос скорости остается, поэтому вопрос: какая машина должна быть и какую базу лучше использовать, чтобы можно было делать выборку из 1..10 Гб. базы по текстовому полю с несколькими словами и какие при этом ориентировочно будут задержки. Мне кажется, с такими требованиям Вы выходите на лидирующие СУБД, в том числе и по TCP тестам (DB2, Оракл, Скуль). В нашей стране остаются, скорее всего, два последние - легче проконсультироваться в реале. Я Ораклист. Могу тока сказать, что в нем полно фич и для текстовых полей. Например, там есть Oracle Text со специальным каким-то индексированием. Однако, наверное, чтобы Вам сказали что-то в сторону задержек нужны структура таблы, что-то про особенности данных и критичные запросы. Спасибо, Вадим, это я и хотел узнать. Будем пробовать, может чего и получится.. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 08.12.2005, 08:42 |
|
||
|
|

start [/forum/topic.php?fid=35&msg=33423767&tid=1553708]: |
0ms |
get settings: |
11ms |
get forum list: |
15ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
32ms |
get topic data: |
8ms |
get forum data: |
2ms |
get page messages: |
47ms |
get tp. blocked users: |
1ms |
| others: | 216ms |
| total: | 338ms |

| 0 / 0 |
