Поговорим о масштабировании / Сравнение СУБД

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / Поговорим о масштабировании

25 сообщений из 140, страница 5 из 6

все

Поговорим о масштабировании

#37442364

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

промасштабировался дальшеiv_an_ruПроцы заняты полезным делом. Но если ставить эту конкретную задачу на один ящик с терабайтом ОЗУхи, то считайте сами --- 50 гигафактов в сжатых колонках, примерно по 6 байт на факт, дадут 300 гигабайт.
А запросы тратят CPU больше всего на индексный поиск, агрегацию, скалярные функции или на внутренние нужды?Это уж от запросов зависит, ну и хранимки сами по себе тоже жрут хорошо, тем более что есть ведь и такие "длинные" функции, как применение XSLT или обогащение HTML-ного документа дополнительными сылками.
промасштабировался дальшеiv_an_ruТем более, что они хотят на нём прогнать BSBM / BIBM / TPC-H / RDF-H, и нам совсем не улыбается увидеть публичные отчёты с издевательски большими $/QMpH и $/QphH.

Если они это IBM, то ничего удивительного :)Нет, не IBM, хотя тоже три буквы. Как отчёты опубликуют, так можно будет и сказать, кто.

...

Рейтинг:

0 / 0

15.09.2011, 19:18

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37458216

модель представления данных

Гость

iv_an_ru , кстати у вас виртуоза это СУБД с вертикальным хранением RDF, блокировочник и с кластером архитектуры MPP(shared nothing)?

...

Рейтинг:

0 / 0

28.09.2011, 01:27

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37458383

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

модель представления данных iv_an_ru , кстати у вас виртуоза это СУБД с вертикальным хранением RDF, блокировочник и с кластером архитектуры MPP(shared nothing)?Да, это "жёсткий" блокировочник и shared nothing cluster, версии до седьмой умеют только горизонтально хранить, седьмая (пока ещё не общедоступная) умеет и вертикально хранить (причём не только RDF :). Ну а главный источник доходов --- виртуальная схема, в которой для разработчика приложений нет разницы между таблицами, хранящимися на самой виртуозе и таблицами, лежащими на присоединённых серверах других вендоров.

...

Рейтинг:

0 / 0

28.09.2011, 09:38

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37458786

модель представления данных

Гость

iv_an_ruмодель представления данных iv_an_ru , кстати у вас виртуоза это СУБД с вертикальным хранением RDF, блокировочник и с кластером архитектуры MPP(shared nothing)?Да, это "жёсткий" блокировочник и shared nothing cluster, версии до седьмой умеют только горизонтально хранить, седьмая (пока ещё не общедоступная) умеет и вертикально хранить (причём не только RDF :). Ну а главный источник доходов --- виртуальная схема, в которой для разработчика приложений нет разницы между таблицами, хранящимися на самой виртуозе и таблицами, лежащими на присоединённых серверах других вендоров.
А что значит "жесткий" блокировочник? :)
Да, такая виртуальная схема снимает вопрос о необходимости миграции на другую СУБД. Можно использовать обе :)

Кстати у вас каждая нода владеет своим куском данных и не может передавать их на владение другой ноде как в Oracle RAC, поэтому необходимость в синхронизации блокировок есть только между дублирующими серверами?

...

Рейтинг:

0 / 0

28.09.2011, 12:21

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37458831

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

модель представления данныхА что значит "жесткий" блокировочник? :)Он даже не пытается как-то переупорядочить транзакции, чтобы уменьшить число роллбэков или сделать ещё что умное. Как результат, среди транзакций полная "дедовщина" --- если случается дедлок, то всегда откатывается та транзакция, которая к этому моменту захватила меньше данных, без каких-либо "смягчающих обстоятельств". Для защиты от слишком блокирующих запросов есть "anytime query" --- можно указать, что запрос не должен нормально выполняться дольше такого-то времени, по достижении таймера у запроса возникает иллюзия, что все таблицы внезапно "опустели", и он волей-неволей возвращает частичный результат. Зато при необходимости транзакции могут длиться часами, хорошо бегают распределённые транзакции и checkpoint проходит совершенно незаметно для всех транзакций.

...

Рейтинг:

0 / 0

28.09.2011, 12:44

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37458842

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

модель представления данныхКстати у вас каждая нода владеет своим куском данных и не может передавать их на владение другой ноде как в Oracle RAC, поэтому необходимость в синхронизации блокировок есть только между дублирующими серверами?Совершенно верно. При этом есть возможность эскалации блокировок (автоматической замены многих строковых одной страничной) + возможность создавать частичные индексы + для маньяков возможность на уровне приложения писать в разные индексы таблицы отдельными операторами. Всё это снижает затраты на синхронизацию.

...

Рейтинг:

0 / 0

28.09.2011, 12:49

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37458914

модель представления данных

Гость

iv_an_ru возможность создавать частичные индексы + для маньяков возможность на уровне приложения писать в разные индексы таблицы отдельными операторами. Всё это снижает затраты на синхронизацию.
Частичные индексы - это partial index по диапазонам так понимаю. А что значит писать в разные индексы?
Упрощение взаимодействия по идее должно сильно повысить масштабируемость.

Кстати, примерно во сколько раз получается выигрыш в производительности от применения вертикального хранения, в 2, 5, 10, 100?

...

Рейтинг:

0 / 0

28.09.2011, 13:18

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37458966

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

модель представления данныхiv_an_ru возможность создавать частичные индексы + для маньяков возможность на уровне приложения писать в разные индексы таблицы отдельными операторами. Всё это снижает затраты на синхронизацию.
Частичные индексы - это partial index по диапазонам так понимаю.Это когда в индексе есть только некоторые из колонок primary key, напр.

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.

create table DB.DBA.RDF_QUAD (
  G IRI_ID_8,
  S IRI_ID_8,
  P IRI_ID_8,
  O any,
  primary key (P, S, O, G)
  )
alter index RDF_QUAD on DB.DBA.RDF_QUAD partition (S int (0hexffff00))

create distinct no primary key ref bitmap index RDF_QUAD_SP on RDF_QUAD (S, P) partition (S int (0hexffff00))
create bitmap index RDF_QUAD_POGS on RDF_QUAD (P, O, G, S) partition (O varchar (- 1 , 0hexffff))
create distinct no primary key ref bitmap index RDF_QUAD_GS on RDF_QUAD (G, S) partition (S int (0hexffff00))
create distinct no primary key ref index RDF_QUAD_OP on RDF_QUAD (O, P) partition (O varchar (- 1 , 0hexffff))
;

В таком варианте если будет поиск по таблице с условием S=const, то сначала в RDF_QUAD_SP будут найдены все P, которые встречаются в RDF_QUAD вместе с данным значением S, и потом уже будут поиски в P,S,O,G по двум первым заданным колонкам.
А если только G известно, то ищем G в RDF_QUAD_GS, потом S в RDF_QUAD_SP, потом P и S в P,S,O,G c проверкой G. При этом неполные индексы настолько малы, что ложатся в память, а полных индексов всего два вместо четырёх.

модель представления данныхА что значит писать в разные индексы?
Натурально, особо извратное приложение может, например, сделать пакетный INSERT SOFT в самый локальный для него индекс, посмотреть, что действительно вставилось, и уже только действительно новые строки вставлять в менее удобные индексы.

Упрощение взаимодействия по идее должно сильно повысить масштабируемость.

Кстати, примерно во сколько раз получается выигрыш в производительности от применения вертикального хранения, в 2, 5, 10, 100?[/quot]

...

Рейтинг:

0 / 0

28.09.2011, 13:44

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37458983

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

модель представления данныхУпрощение взаимодействия по идее должно сильно повысить масштабируемость.
Ещё б совпадали "упрощение для машины" и "упрощение для разработчика" :(
модель представления данныхКстати, примерно во сколько раз получается выигрыш в производительности от применения вертикального хранения, в 2, 5, 10, 100?Выигрыш там в памяти. На если после этого активное подмножество начинает целиком умещаться в память, а диск только обновления пишет, то и по скорости выигрыш образуется.

Я вот тут подробней рассказывал, правда не совсем СУБДшникам: Облако и куб: RDF в аналитической базе данных , и тут в конце тоже ссылки на русскоязычные конспекты по RDF/SPARQL .

...

Рейтинг:

0 / 0

28.09.2011, 13:54

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37464491

модель представления данных

Гость

iv_an_ruмодель представления данныхУпрощение взаимодействия по идее должно сильно повысить масштабируемость.
Ещё б совпадали "упрощение для машины" и "упрощение для разработчика" :(

Имеется ввиду разработчик который разрабатывает СУБД или разработчик который разрабатывает БД?
iv_an_ruмодель представления данныхКстати, примерно во сколько раз получается выигрыш в производительности от применения вертикального хранения, в 2, 5, 10, 100?Выигрыш там в памяти. На если после этого активное подмножество начинает целиком умещаться в память, а диск только обновления пишет, то и по скорости выигрыш образуется.

Я вот тут подробней рассказывал, правда не совсем СУБДшникам: Облако и куб: RDF в аналитической базе данных , и тут в конце тоже ссылки на русскоязычные конспекты по RDF/SPARQL .
Интересно, что-то вы там серьёзное делаете :)
На сколько я понял для RDF было отставание в 3 раза от реляционной модели, а после применения работ Абади стало примерно равно?
И "производительность по RDF-H наконец-то оказалась сравнима с производительностью TPC-H" уже с учетом того, что в реляционной модели также применили вертикальное хранение или в реляционной оно не дает заметного выигрыша?

Раньше реляционные сжимались лучше, а сейчас при вертикальном хранении данные сжимаете и насколько хорошо они сжимаются относительно реляционной модели?
Кстати, а почему вы говорите "К тому же эта мера ускоряет чтение с жёсткого диска, но не снижает требований к размеру ОЗУ." В чем проблема хранить в ОЗУ сжатые данные?

...

Рейтинг:

0 / 0

02.10.2011, 20:25

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37464536

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

модель представления данныхНа сколько я понял для RDF было отставание в 3 раза от реляционной модели, а после применения работ Абади стало примерно равно?
...
Раньше реляционные сжимались лучше, а сейчас при вертикальном хранении данные сжимаете и насколько хорошо они сжимаются относительно реляционной модели?
При старом "горизонтальном" хранении TPC-H масштаба 1G ложился в 140000 страниц, RDF-H того же масштаба жрал 630000 страниц.
При новом "вертикальном" хранении тот же TPC-H усох до 90000 страниц, а RDF-H --- до 250000 страниц.

модель представления данныхИ "производительность по RDF-H наконец-то оказалась сравнима с производительностью TPC-H" уже с учетом того, что в реляционной модели также применили вертикальное хранение или в реляционной оно не дает заметного выигрыша?
RDF никогда не догонит "классику" по масштабируемости и по скорости. Но он не догонит на тех задачах, на которых классические методы _применимы_. Когда в базе знаний что-то сделать _можно_, а в базе данных --- _нереально_, уже как-то не важно, во сколько раз база данных была бы быстрее, будь это реально. В итоге будущее, безусловно, за гибридами, чтобы разработчики приложений могли для каждого куска использовать наиболее подходящую комбинацию инструментов.
Ну а пока сообщество старательно делится на СУБД-шников и СУБЗ-сников. Это такой же идиотизм, как если бы строители делились на сторонников использования одних только кирпичей и сторонников использования одного только цементного раствора --- и это после изобретения нормальной кладки :)

RDF-H --- это как раз тест, показывающий самый плохой случай для RDF, если сравнивать с классикой. Методы разгона TPC-D (и теперь TPC-H) полировались десятилетиями, и это ровно то, для чего SQL и создавался в первую очередь. В то же время тупой экспорт этих данных в RDF-H и "лобовой" перевод запросов из SQL в SPARQL не демонстрирует никаких преимуществ базы знаний, они разрабатывались для другого.

модель представления данныхКстати, а почему вы говорите "К тому же эта мера ускоряет чтение с жёсткого диска, но не снижает требований к размеру ОЗУ." В чем проблема хранить в ОЗУ сжатые данные?Чтобы и в памяти хранить сжатые данные, надо многократно разжимать их большими кусками. Это не только расходует время само по себе, но и забивает кэш процессора, что чревато падением производительности остального кода буквально на порядок.

...

Рейтинг:

0 / 0

02.10.2011, 22:47

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37464541

модель представления данных

Гость

Т.е. RDF от вертикального хранения выиграл больше :)

iv_an_ruмодель представления данныхКстати, а почему вы говорите "К тому же эта мера ускоряет чтение с жёсткого диска, но не снижает требований к размеру ОЗУ." В чем проблема хранить в ОЗУ сжатые данные?Чтобы и в памяти хранить сжатые данные, надо многократно разжимать их большими кусками. Это не только расходует время само по себе, но и забивает кэш процессора, что чревато падением производительности остального кода буквально на порядок.
В принципе да. Здесь вопрос в том насколько действительно большой разрыв в производительности систем хранения и исполнения. И насколько неоднородно идет обращение к данным.
Если к одним данным идет в 100 раз больше запросов чем к другим, то да.
Если достаточно однородно, то в любом случае расжать из ОЗУ будет быстрее чем поднять с диска.

...

Рейтинг:

0 / 0

02.10.2011, 23:03

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37464550

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

модель представления данныхВ принципе да. Здесь вопрос в том насколько действительно большой разрыв в производительности систем хранения и исполнения. И насколько неоднородно идет обращение к данным.
Если к одним данным идет в 100 раз больше запросов чем к другим, то да.
Если достаточно однородно, то в любом случае расжать из ОЗУ будет быстрее чем поднять с диска.
Когда-то давно, когда для "крутых персоналок" стандартом были 2 мегабайта ОЗУ, продавал я одну расчётную софтинку, которая просила возмутительные 4 мегабайта ОЗУ. Потом вылез у меня конкурент, который стал как раз сжимать данные, и для многих задач стал укладываться в обычные 2 мегабайта. Обычная задачка у меня обсчитывалась за обеденный перерыв, у него --- за ночь.
Закопал я "вражину" простым демпингом. Если клиент ворчал, что вот люди и на двух считают, и его задача действительно со сжатием влезала в 2 мега, то я обещал ему при покупке моей программулины подарок --- недостающие два мега.

...тогда я пообещал себе, что никогда не буду пытаться сжимать память...

...

Рейтинг:

0 / 0

02.10.2011, 23:27

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37464554

модель представления данных

Гость

iv_an_ru , я согласен, хорошая метафоричная история.
Но допустим доступ к дисковому массиву 600 МБс, доступ к памяти четырехканальной 40 000 МБс, итого примерно 100 раз. Допустим всего ОЗУ 64 ГБ, допустим половина под дисковый кэш (32 ГБ).
Что лучше, иметь доступ к 32 ГБ со скоростью 40 000 МБс (в 100 раз), или к 64 ГБ со скоростью 4 000 МБс (в 10 раз)?
Причем мы говорим именно про дисковый кэш, а не всю память сжимать-разжимать ;)
И причем 600 МБс это последовательные IO к диску, а случайные 60 МБс, т.е. разница будет нет 100 и 10, а 1000 и 100 раз ;)

...

Рейтинг:

0 / 0

02.10.2011, 23:45

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37464572

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

модель представления данных iv_an_ru , я согласен, хорошая метафоричная история.
Но допустим доступ к дисковому массиву 600 МБс, доступ к памяти четырехканальной 40 000 МБс, итого примерно 100 раз. Допустим всего ОЗУ 64 ГБ, допустим половина под дисковый кэш (32 ГБ).
Что лучше, иметь доступ к 32 ГБ со скоростью 40 000 МБс (в 100 раз), или к 64 ГБ со скоростью 4 000 МБс (в 10 раз)?
Причем мы говорим именно про дисковый кэш, а не всю память сжимать-разжимать ;)
И причем 600 МБс это последовательные IO к диску, а случайные 60 МБс, т.е. разница будет нет 100 и 10, а 1000 и 100 раз ;)
Рассмотрим грустный пример. Нужно вам сделать index lookup, взять целое поле по целому ключу, 160 байт на одну строку таблицы, 50 строк в странице.

Несжатая память: вы двоичным поиском дёргаете 8 слов плюс девятое слово-значение, и перед тем "нулевое" слово --- версия индекса, с которой создавалась страница и всякие флаги. Трафик 10 64-битных строк кэша проца, readonly.

Сжатая память: вы разжимаете 8 килобайт (т.е. 1000 строк кэша проца) в 16 килобайт (ещё 2000 строк, причём записи, за что NUMA подтормозит дополнительно). Итого только непосредсвенные затраты на трафик в 400 раз больше --- из 4000 перелопаченных строк реально понадобятся только 10. Такой КПД приводит к тому, что условные 40 000 МБс принесли полезных данных всего-то 100МБс, что удручающе похоже на приличный массив дисков.
А ещё мы нагадили в кэш проца, ну и вообще проц заняли "чем попало", потеряв в скорости.

Получается, что для сжатых страниц дискового кэша в памяти надо завести ещё кэш разжатых страниц. И снабдить всё это подобающими мьютексами (на которых тоже будут случаться тормоза).
Оно того не стоит, чесслово.

Вывод. Если денег на ОЗУ жестоко не хватает, то нужно ещё немножко урезать ОЗУ, а на сэкономленное купить SSD.

...

Рейтинг:

0 / 0

03.10.2011, 00:23

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37464798

модель представления данных

Гость

iv_an_ru в 16 килобайт (ещё 2000 строк, причём записи, за что NUMA подтормозит дополнительно).

А тут NUMA подтормозит в предположении, что проц может писать не в свою память или из-за выяснений куда писать?

iv_an_ruИтого только непосредсвенные затраты на трафик в 400 раз больше --- из 4000 перелопаченных строк реально понадобятся только 10. Такой КПД приводит к тому, что условные 40 000 МБс принесли полезных данных всего-то 100МБс, что удручающе похоже на приличный массив дисков.

В принципе да, только если уж говорим про кэш проца, то это уже не 40 000 МБс и 100 МБс, а на пару порядков больше :)
Но в любом случае конечно index lookup здесь не выиграет.
А вот index scan вполне бы мог ;)

...

Рейтинг:

0 / 0

03.10.2011, 10:52

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37483151

отличие RDF от EAV

Гость

iv_an_ru ,
А в чем отличие RDF от EAV или это синонимы?

...

Рейтинг:

0 / 0

14.10.2011, 20:42

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37483177

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

модель представления данныхiv_an_ru в 16 килобайт (ещё 2000 строк, причём записи, за что NUMA подтормозит дополнительно).

А тут NUMA подтормозит в предположении, что проц может писать не в свою память или из-за выяснений куда писать?Из-за распространения "разметки загрязнений", чтобы другие процессоры пометили строку в кэше как устаревшую, если она содержит данные из свежезаписанного куска памяти.
модель представления данныхiv_an_ruИтого только непосредсвенные затраты на трафик в 400 раз больше --- из 4000 перелопаченных строк реально понадобятся только 10. Такой КПД приводит к тому, что условные 40 000 МБс принесли полезных данных всего-то 100МБс, что удручающе похоже на приличный массив дисков.

В принципе да, только если уж говорим про кэш проца, то это уже не 40 000 МБс и 100 МБс, а на пару порядков больше :)
Но в любом случае конечно index lookup здесь не выиграет.
А вот index scan вполне бы мог ;)Мы говорим про чтение в кэш проца из памяти, а не регистров из кэша. А index scan на большом масштабе... Если что-то не работает _ваапще_, то уже не важно, с какой именно скоростью оно не работает :) Вот на некоторых графических задачах действительно "index lookup" по "плиткам" изображения, там да, успешно сжимают именно память. Классический пример --- RIP на типографских фотовыводителях, особенно постскрипта.

...

Рейтинг:

0 / 0

14.10.2011, 21:29

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37483186

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

отличие RDF от EAV iv_an_ru ,
А в чем отличие RDF от EAV или это синонимы?RDF --- это стандартизованный (потому переносимый) вариант EAV-представления. Я на одном семинаре рисовал разные варианты представления классического "мира кубиков" . Из всех вариантов просто победил самый ограниченный, зато дешёвый :)

...

Рейтинг:

0 / 0

14.10.2011, 21:38

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37483195

модель представления данных

Гость

iv_an_ruМы говорим про чтение в кэш проца из памяти, а не регистров из кэша.
Да :)
С index lookup разобрались. Оверхеды на порядки больше чем выигрыш.

iv_an_ru А index scan на большом масштабе... Если что-то не работает _ваапще_, то уже не важно, с какой именно скоростью оно не работает :)
А вот это не совсем понял.

...

Рейтинг:

0 / 0

14.10.2011, 21:50

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37483208

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

модель представления данныхiv_an_ru А index scan на большом масштабе... Если что-то не работает _ваапще_, то уже не важно, с какой именно скоростью оно не работает :)
А вот это не совсем понял.С ростом базы обычно падает доля предикатов, которые давали бы значения в некоторых коротких диапазонах. Или фильтрация даёт почти уникальные (в масштабе базы) значения, и они оказываются раскиданы очень далеко друг от друга, или фильтрация оставляет такое количество значений, что их за разумное время обработать невозможно вообще --- за время обхода базы либо данные устареют, либо ответ уже не будет нужен, либо осёл/дрессировщик/падишах помрёт. Немудрячий запрос "сумма стоимостей междугородных звонков за сегодня" прекрасно сработает на сырых данных офисной АТС, но невозможен для China Mobile.

...

Рейтинг:

0 / 0

14.10.2011, 22:26

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37483227

модель представления данных

Гость

iv_an_ruмодель представления данныхпропущено...

А вот это не совсем понял.С ростом базы обычно падает доля предикатов, которые давали бы значения в некоторых коротких диапазонах. Или фильтрация даёт почти уникальные (в масштабе базы) значения, и они оказываются раскиданы очень далеко друг от друга, или фильтрация оставляет такое количество значений, что их за разумное время обработать невозможно вообще --- за время обхода базы либо данные устареют, либо ответ уже не будет нужен, либо осёл/дрессировщик/падишах помрёт. Немудрячий запрос "сумма стоимостей междугородных звонков за сегодня" прекрасно сработает на сырых данных офисной АТС, но невозможен для China Mobile.
Т.е. для большой БД здесь два варианта:
1. Или фильтрация даёт почти уникальные (в масштабе базы) значения, и они оказываются раскиданы очень далеко друг от друга
2. или фильтрация оставляет такое количество значений, что их за разумное время обработать невозможно вообще --- за время обхода базы либо данные устареют...

1. Здесь в соответствии с кардинальностью будет выбран:
- index lookup, тогда как мы выяснили сжатие только добавит оверхед и сьест CPU
- index scan, тогда без сжатия пойдет загрузка в базу больших объемов данных и сжатие поможет

2. Здесь естественно идет index scan. На таких объемах данные секционируются по дням или чаще. Дневная секция составит к примеру 10^9 китайцев * 20 звонков за день в среднем = 20 * 10^9. Для сферического DWH в вакууме будет:
объем строки: 8 байт списанные деньги + 8 байт номер исходящего абонента + 8 байт входящего + 8 байт время разговора + хедер строки допустим как в PG 24 байта = 56 байт
объем дневной секции: 56 * 20 * 10^9 = 1.1 ТБ.

На RAID из 24 дисков со скоростью около 1 ГБ/сек эти данные загрузятся за 18 минут = (1100ГБ /1 ГБсек) / 60 сек
Обработает такой поток данных 2 CPU х 6 Cores.

Т.е. за 18 минут мы посчитаем агрегат для материализованного представления которым в дальнейшем и будем пользоваться.

И здесь вопрос, что лучше для увеличения скорости в 2 раза.
- увеличить в 2 раза СХД и CPU(в 2 раза больше дисков и быстрее работает СХД, в 2 раза надо больше CPU)
- увеличить в 4 раза CPU(4 CPU разжимают данные + 4 CPU их обрабатывают)
(предполагаем что сжатие идет в 2 раза, но обычно оно в 3-10 раз)

...

Рейтинг:

0 / 0

14.10.2011, 23:14

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37483237

iv_an_ru

Участник

Откуда: Новосибирск

Сообщения: 14 546

Рейтинг: 0 / 0

(набрал длинный ответ, но случайно нажал Ctrl-A вместо Shift-A, и продолжил набор :(

В двух словах --- 18 минут не получится, потому что по двум номерам "междугородность" не установить --- нужны дополнительные данные для роаминга, редиректов и т.п. Поэтому категорию запросов надо предусмотреть заранее, и либо предусматривать 2.5-нормальную форму для схемы, либо вкладываться в быстрый произвольный доступ, либо и то и то.

...

Рейтинг:

0 / 0

14.10.2011, 23:39

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37483249

модель представления данных

Гость

iv_an_ru(набрал длинный ответ, но случайно нажал Ctrl-A вместо Shift-A, и продолжил набор :(

В двух словах --- 18 минут не получится, потому что по двум номерам "междугородность" не установить --- нужны дополнительные данные для роаминга, редиректов и т.п. Поэтому категорию запросов надо предусмотреть заранее, и либо предусматривать 2.5-нормальную форму для схемы, либо вкладываться в быстрый произвольный доступ, либо и то и то.
(8 байт номер исходящего абонента + 8 байт входящего) имеется ввиду 64 битные идентификаторы на справочники номеров. Справочники по сравнению с таблицей фактов будут на порядки меньше. Сжимать справочники или нет, конечно вопрос.
В любом случае отличие максимум в разы, получается примерно такой порядок на достаточно обычном серверном оборудовании. Хоть в звезде, хоть в снежинке.

...

Рейтинг:

0 / 0

14.10.2011, 23:57

| Ответить | Цитировать | Написать

Поговорим о масштабировании

#37513863

мьюеткс vs IPC

Гость

iv_an_rusoftwarerВ общем-то можно, но вряд ли это оптимальный путь. А вот где, почему и начиная с какого предела "нормальная" база тормозит по сравнению с "восьмушками" - имхо стоит тщательно изучить.Да нечего там было изучать. Очень большая база с RDF и много-много юзеров, каждый из которых ковыряется read-only в одних и тех же "очень активных" данных плюс каких-то неповторяющихся "непопулярных". Под Linux, а у него есть противная особенность: просто вход и выход из мьютекса не стоят почти ничего, а вот начало ожидания на мьютексе стоит примерно столько же, сколько целая выборка строки по ключу. В случае кластера проблемы с мьютексами уменьшились настолько, что экономия перевесила даже IPC. Поскольку для такого эффекта нужно, чтобы сервер "лёг на полку", не справляясь с нагрузкой, на практике такой сценарий просто не должен встречаться.

(Потом появились деньги, и вместо одного ящика поставили 8. Как раз вовремя, потому что база подросла до 2.5e10 фактов, ну и юзеров ещё больше стало.)
А это только в Linux такая особенность, что ожидание занятых ресурсов через мьютекс съедает больше чем межпроцессный обмен по IPC?
Или в Unix(AIX)/Solaris/Windows также?

...

Рейтинг:

0 / 0

07.11.2011, 09:02

| Ответить | Цитировать | Написать

25 сообщений из 140, страница 5 из 6

все

Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / Поговорим о масштабировании

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=35&msg=37483186&tid=1552615]:	0ms
get settings:	8ms
get forum list:	9ms
check forum access:	3ms
check topic access:	3ms
track hit:	41ms
get topic data:	9ms
get forum data:	2ms
get page messages:	40ms
get tp. blocked users:	1ms
others:	281ms

total:	397ms