какую бд рекомендуете для хранения (один столбец и миллиард строк ) / Сравнение СУБД

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / какую бд рекомендуете для хранения (один столбец и миллиард строк )

35 сообщений из 35, показаны все 2 страниц

все

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38614907

sqlmiha1

Гость

какую бд рекомендуете для хранения
базы "словарь слов" - один столбец и миллиард строк каждая длиной до 128 байт
и быстрых выборок к ней вида
select "слово" from base
?

...

Рейтинг:

0 / 0

15.04.2014, 02:19

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38614917

Alexander Ryndin

Участник

Сообщения: 4 863

Рейтинг: 0 / 0

sqlmiha1какую бд рекомендуете для хранения
базы "словарь слов" - один столбец и миллиард строк каждая длиной до 128 байт
и быстрых выборок к ней вида
select "слово" from base
?key-value. Тот же Oracle NoSQL DB.

...

Рейтинг:

0 / 0

15.04.2014, 03:26

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38614918

sqlmiha1

Гость

Alexander Ryndin, а nosql?

...

Рейтинг:

0 / 0

15.04.2014, 03:28

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38614919

sqlmiha1

Гость

а из бесплатных nosql?

...

Рейтинг:

0 / 0

15.04.2014, 03:29

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38614921

DPH3

Участник

Сообщения: 524

Рейтинг: 0 / 0

sqlmiha1какую бд рекомендуете для хранения
базы "словарь слов" - один столбец и миллиард строк каждая длиной до 128 байт
и быстрых выборок к ней вида
select "слово" from base
?

Не совсем понял, как это - только одни столбец? Или два столбца вида "слово","значение в 128 байт"?
Выбор по слову - только по точному совпадению или по маске/морфологии/и т.п.?
Насколько много чтений, насколько много записей, какого вида записи?
С чем уже имели дело?

...

Рейтинг:

0 / 0

15.04.2014, 03:36

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38614924

sqlmiha1

Гость

DPH3,

столбец один - слово до 128 байт
выбор слов по маске *слово*
записей нет
только чтения до сотни-тысячи в секунду (может больше)
смотри пока mssql / mongodb

...

Рейтинг:

0 / 0

15.04.2014, 03:43

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38614925

sqlmiha1

Гость

смотрЮ пока mssql / mongodb

...

Рейтинг:

0 / 0

15.04.2014, 03:44

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38614930

Alexander Ryndin

Участник

Сообщения: 4 863

Рейтинг: 0 / 0

sqlmiha1а из бесплатных nosql?Oracle NoSQL Community Edition бесплатная

...

Рейтинг:

0 / 0

15.04.2014, 04:30

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38614931

Alexander Ryndin

Участник

Сообщения: 4 863

Рейтинг: 0 / 0

sqlmiha1смотрЮ пока mssql / mongodbПо мне так mongodb - это из пушки по воробьям. Зачем вам документоориентированная база?

...

Рейтинг:

0 / 0

15.04.2014, 04:32

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38614957

29 Белых Котиков

Участник

Откуда: ИТ-бог. Мне доверяют 30 человек.

Сообщения: 2 526

Рейтинг: 0 / 0

OCZ Z-Drive R4 CloudServ и простой текстовый файл, в котором лежат отсортированные слова. Но один поиск по отсортированному файлу потребуется 9 чтений файла. Соответственно, (IOPS на чтение)=9*(количество запросов в секунду)

Никакого кеширования, всё просто и предсказуемо, зато будет гарантированно работать на вашем объёме. Так же, эти ваши 128 гигов можно в памяти разместить.

...

Рейтинг:

0 / 0

15.04.2014, 08:27

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38614964

29 Белых Котиков

Участник

Откуда: ИТ-бог. Мне доверяют 30 человек.

Сообщения: 2 526

Рейтинг: 0 / 0

То есть, 30 обращений к файлу потребуется. Лучше сразу в память загнать массив. Всё остальное работать не будет.

...

Рейтинг:

0 / 0

15.04.2014, 08:45

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38615067

ЕвгенийВ

Участник

Откуда: Москва

Сообщения: 3 430

Рейтинг: 0 / 0

120 гигов вполне влезут в оперативку :)

...

Рейтинг:

0 / 0

15.04.2014, 11:00

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38615072

DPH3

Участник

Сообщения: 524

Рейтинг: 0 / 0

sqlmiha1выбор слов по маске *слово*

А маска какого вида? Только вида "слово%" или и "%слово%"? Решения будут очень разными.

Реально, как правильно говорят, без SSD или загрузки всего объема в память нормально не сделать. Даже если только индекс ветвей B-дерева хранить в памяти, хотя бы один IOPS при чтении потребуется. 1000 IOPS - это уже многовато для обычных дисков.

Если маска - простая, я бы сделал бы просто руками (всей работы на день-два, меньше, чем уже ушло на исследования решений).
MongoDB тут худший вариант )
MySQL - не знаю, как там с оптимизацией размещения индекса в памяти, но решить точно можно.

Если маска - произвольная, то надо смотреть в сторону какого-нибудь elastic search на кластере, но это надолго )

...

Рейтинг:

0 / 0

15.04.2014, 11:04

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38615153

Arm79

Участник

Откуда: МО, Раменское

Сообщения: 3 205

Рейтинг: 0 / 0

sqlmiha1select "слово" from base
Вам же уже сказали в ветке MS SQL, что указанный запрос вернет весь миллиард записей.
Вы определитесь, вам каждый раз нужно запрашивать этот миллиард или это получение одной записи зараз?

...

Рейтинг:

0 / 0

15.04.2014, 12:26

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38615447

sqlmiha1

Гость

уточняю маска вида "слово%" и "%слово%"
запрос вида select slovo from base where slovo=""%слово%""

...

Рейтинг:

0 / 0

15.04.2014, 15:25

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38615464

Dimitry Sibiryakov

Участник

Сообщения: 54 521

Рейтинг: 0 / 0

sqlmiha1уточняю маска вида "слово%" и "%слово%"
запрос вида select slovo from base where slovo=""%слово%""
Тебе нужен Sphinx или другие системы полнотекстового поиска. Ни одна СУБД не справится.
Posted via ActualForum NNTP Server 1.5

...

Рейтинг:

0 / 0

15.04.2014, 15:32

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38615528

servit

Участник

Откуда: г. Кишинёв, Республика Молдова

Сообщения: 3 167

Рейтинг: 0 / 0

sqlmiha1уточняю маска вида "слово%" и "%слово%"
запрос вида select slovo from base where slovo=""%слово%""Для ускорения именно таких запросов, и вообще используя регулярные выражения, в СУБД Caché были добавлены индексы iFind .
Для Вашего случая достаточно будет типа Basic (о iFind на русском ).

...

Рейтинг:

0 / 0

15.04.2014, 15:56

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38615542

ЕвгенийВ

Участник

Откуда: Москва

Сообщения: 3 430

Рейтинг: 0 / 0

sqlmiha1уточняю маска вида "слово%" и "%слово%"
запрос вида select slovo from base where slovo=""%слово%""
Тут только полный скан всего миллиарда.
Нужно оптимизировать хранение, уменьшив чтения диска или грубая сила типа Hadoop .

...

Рейтинг:

0 / 0

15.04.2014, 16:01

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38615559

Arm79

Участник

Откуда: МО, Раменское

Сообщения: 3 205

Рейтинг: 0 / 0

sqlmiha1уточняю маска вида "слово%" и "%слово%"
запрос вида select slovo from base where slovo=""%слово%""
1) Уточните требования по скорости выборки.
2) Уточните, требуется ли многопользовательская работа или доступ локальный

Первоначальное впечатление: %слово% приведет к полному перебору
Если без первого процента - какие-то варианты возможны.

...

Рейтинг:

0 / 0

15.04.2014, 16:08

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38615592

29 Белых Котиков

Участник

Откуда: ИТ-бог. Мне доверяют 30 человек.

Сообщения: 2 526

Рейтинг: 0 / 0

Ну если дополнить словарь огрызками слов, то получим 16 терабайт и 43 обращения к словарю на один поиск. Итого на 100 000 запросов в секунду понадобится массив из 250 мелких SSDшек или примерно пять миллионов рублей.

...

Рейтинг:

0 / 0

15.04.2014, 16:21

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38615736

servit

Участник

Откуда: г. Кишинёв, Республика Молдова

Сообщения: 3 167

Рейтинг: 0 / 0

Arm79Первоначальное впечатление: %слово% приведет к полному переборуЕвгенийВТут только полный скан всего миллиарда.29 Белых КотиковНу если дополнить словарь огрызками слов, то получим 16 терабайт и 43 обращения к словарю на один поиск. Итого на 100 000 запросов в секунду понадобится массив из 250 мелких SSDшек или примерно пять миллионов рублей.Нет, можно задействовать специальные индексы: 15885843

Сделал тест согласно упражнению на книге "Библия" :

1) без индекса

select Id, Para from BookPara where Para like '%огон%'

2) с индексом

select Id, Para from BookPara where id %FIND search_index(ParaStemmedI,'*огон*',1)

Результат:
Количество найденных строкБыстродействие (сек.)Количество обращений к глобаламБез индекса2870.518151845С индексом2870.0091006
Разница налицо.

...

Рейтинг:

0 / 0

15.04.2014, 17:38

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38615749

29 Белых Котиков

Участник

Откуда: ИТ-бог. Мне доверяют 30 человек.

Сообщения: 2 526

Рейтинг: 0 / 0

servit,

Ну если слова на языке, то да, специальные индексы намного лучше. Но так как слов миллиард, скорее всего это что-то вроде уникального идентификатора. А какой размер индекса получился в процентах от таблицы, можете проверить, для интереса?

...

Рейтинг:

0 / 0

15.04.2014, 17:45

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38615777

ЕвгенийВ

Участник

Откуда: Москва

Сообщения: 3 430

Рейтинг: 0 / 0

29 Белых Котиковservit,

Ну если слова на языке, то да, специальные индексы намного лучше. Но так как слов миллиард, скорее всего это что-то вроде уникального идентификатора. А какой размер индекса получился в процентах от таблицы, можете проверить, для интереса?
Однозначно в Библии уникальных слов меньше, чем 1 000 000 000.

...

Рейтинг:

0 / 0

15.04.2014, 18:07

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38615779

Basil A. Sidorov

Участник

Сообщения: 11 633

Рейтинг: 0 / 0

Их меньше, даже если найти скрижали всех мёртвых языков.

...

Рейтинг:

0 / 0

15.04.2014, 18:09

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38615786

servit

Участник

Откуда: г. Кишинёв, Республика Молдова

Сообщения: 3 167

Рейтинг: 0 / 0

29 Белых КотиковА какой размер индекса получился в процентах от таблицы, можете проверить, для интереса?Данные - 8.7 Мб (собственно сам FB2 занимает 6.56 Мб)
Индексы - 16 Мб
Есть ещё несколько системных индексов (ISC.IF.*):

ISC.IF.WordCP - 1.3 Мб
ISC.IF.WordD - 1.5 Мб
ISC.IF.WordI - 1.1 Мб
ISC.IF.WordParts - 1.0 Мб
ISC.IF.WordRI - 1.2 Мб

...

Рейтинг:

0 / 0

15.04.2014, 18:20

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38615813

servit

Участник

Откуда: г. Кишинёв, Республика Молдова

Сообщения: 3 167

Рейтинг: 0 / 0

29 Белых КотиковНу если слова на языке, то да, специальные индексы намного лучше.Для индекса можно указать и не использовать стемминг и декомпозицию, например, заменив
Index ParaStemmedI On (Para) As %iFind.Index.RussianBasic(INDEXOPTION = 1, LOWER = 1);
на
Index ParaStemmedI On (Para) As %iFind.Index.Basic(INDEXOPTION = 0, LOWER = 1);

Данные типы запросов прекрасно работают и для английского (по умолчанию) языка: пробовал с английским индексом, но с французским языком в запросе
select id,Para from BookPara where id %FIND BookPara_ParaStemmedIFind('*огон*',0,'fr')
- результат аналогичный выше.

Как видно, данные типы запросов успешно используют индекс, независимо от языка.

PS: забыл указать - БД Unicode.

...

Рейтинг:

0 / 0

15.04.2014, 19:14

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38616177

S.G.

Участник

Откуда: cartoon network

Сообщения: 30 700

Рейтинг: 0 / 0

sqlmiha1уточняю маска вида "слово%" и "%слово%"
запрос вида select slovo from base where slovo=""%слово%""Не знаю, что за задача, и какие инструменты вы выберете, но советую обязательно перед запросом сделать проверку, что "слово" состоится минимум из 4-х букв.

...

Рейтинг:

0 / 0

16.04.2014, 10:52

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38616241

sphinx_mv

Участник

Сообщения: 1 576

Рейтинг: 0 / 0

S.G.sqlmiha1уточняю маска вида "слово%" и "%слово%"
запрос вида select slovo from base where slovo=""%слово%""Не знаю, что за задача, и какие инструменты вы выберете, но советую обязательно перед запросом сделать проверку, что "слово" состоится минимум из 4-х букв."лес", "дуб", "нос"...

...

Рейтинг:

0 / 0

16.04.2014, 11:33

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38616339

SergSuper

Участник

Откуда: SPb

Сообщения: 5 995

Рейтинг: 0 / 0

sphinx_mvS.G.пропущено...
Не знаю, что за задача, и какие инструменты вы выберете, но советую обязательно перед запросом сделать проверку, что "слово" состоится минимум из 4-х букв."лес", "дуб", "нос"...ёж, уж

...

Рейтинг:

0 / 0

16.04.2014, 12:30

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38617742

Сергей Арсеньев

Участник

Сообщения: 4 121

Рейтинг: 0 / 0

Dimitry SibiryakovНи одна СУБД не справится.
Да ладно, вон в том же Oracle специально для таких запросов придумали Exadata. :)

...

Рейтинг:

0 / 0

17.04.2014, 16:30

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38617836

ЕвгенийВ

Участник

Откуда: Москва

Сообщения: 3 430

Рейтинг: 0 / 0

Сергей АрсеньевDimitry SibiryakovНи одна СУБД не справится.
Да ладно, вон в том же Oracle специально для таких запросов придумали Exadata. :)

http://ru.wikipedia.org/wiki/Exadata]В серверы комплексов X3-8, наследующих машины линейки X2-8, устанавливаются десятиядерные процессоры Xeon E7-8870 (2,4 ГГц) и 2 Тбайт оперативной памяти. Цена за комплекс установлена на уровне $1,65 млн[10].

...

Рейтинг:

0 / 0

17.04.2014, 17:24

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38626437

S.G.

Участник

Откуда: cartoon network

Сообщения: 30 700

Рейтинг: 0 / 0

SergSupersphinx_mvпропущено...
"лес", "дуб", "нос"...ёж, ужда...
но такие слова следует искать не по маске %слово% а по прямому совпадению.
иначе... интересно, сколько раз в словаре из миллиарда слов встретится подстрока "уж" ;)

...

Рейтинг:

0 / 0

26.04.2014, 10:19

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38627579

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

sqlmiha1какую бд рекомендуете для хранения
базы "словарь слов" - один столбец и миллиард строк каждая длиной до 128 байт
и быстрых выборок к ней вида
select "слово" from base
?

Тут вообще не нужна субд.
Просто файл, если нужно, с индексом.

...

Рейтинг:

0 / 0

28.04.2014, 11:52

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38627606

29 Белых Котиков

Участник

Откуда: ИТ-бог. Мне доверяют 30 человек.

Сообщения: 2 526

Рейтинг: 0 / 0

S.G.SergSuperпропущено...
ёж, ужда...
но такие слова следует искать не по маске %слово% а по прямому совпадению.
иначе... интересно, сколько раз в словаре из миллиарда слов встретится подстрока "уж" ;)

Выбирать первые N вариантов, найденных по запросу.

...

Рейтинг:

0 / 0

28.04.2014, 12:12

| Ответить | Цитировать | Написать

какую бд рекомендуете для хранения (один столбец и миллиард строк )

#38627608

29 Белых Котиков

Участник

Откуда: ИТ-бог. Мне доверяют 30 человек.

Сообщения: 2 526

Рейтинг: 0 / 0

MasterZivsqlmiha1какую бд рекомендуете для хранения
базы "словарь слов" - один столбец и миллиард строк каждая длиной до 128 байт
и быстрых выборок к ней вида
select "слово" from base
?

Тут вообще не нужна субд.
Просто файл, если нужно, с индексом.

Отсортированный файл слов фиксированного размера.

...

Рейтинг:

0 / 0

28.04.2014, 12:13

| Ответить | Цитировать | Написать

35 сообщений из 35, показаны все 2 страниц

все

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?all=1&fid=35&tid=1552379]:	0ms
get settings:	7ms
get forum list:	10ms
check forum access:	2ms
check topic access:	2ms
track hit:	180ms
get topic data:	7ms
get forum data:	2ms
get page messages:	40ms
get tp. blocked users:	1ms
others:	237ms

total:	488ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы