Большая таблица, мало RAM / Сравнение СУБД

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / Большая таблица, мало RAM

25 сообщений из 87, страница 1 из 4

все

Большая таблица, мало RAM

#37622133

thehil

Гость

Какие существуют бесплатные решения позволяющие работать с большими таблицами (1 млрд.) на железе с ограниченной RAM. Т.е. когда даже индексы целиком не помещаются в память и невозможно расшардить таблицу на несколько машин.
Что можно придумать кроме партицирования чтобы получить хотя бы примерно линейную зависимость производительности от количества строк? При том что даже в случае партицирования могут быть запросы читающие со всех партиций. Спасибо.

...

Рейтинг:

0 / 0

19.01.2012, 13:55

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622146

miksoft

Участник

Сообщения: 36 746

Рейтинг: 0 / 0

thehilЧто можно придумать кроме партицирования чтобы получить хотя бы примерно линейную зависимость производительности от количества строк? При том что даже в случае партицирования могут быть запросы читающие со всех партиций. Спасибо.А она и так будет линейной в худшем случае. И с очень большим множителем (из-за физического ввода-вывода).
Обычно стремятся сделать быстрее, чем линейную. В чем помогают, например, индексы.

...

Рейтинг:

0 / 0

19.01.2012, 13:59

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622152

miksoft

Участник

Сообщения: 36 746

Рейтинг: 0 / 0

thehil,

Вы огласите задачу более детально. Пока же ничего определенного сказать нельзя. Может, любая СУБД будет одинаково плоха. А может, обычные файлы спасут.

...

Рейтинг:

0 / 0

19.01.2012, 14:00

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622156

thehil

Гость

И да, аналитики совсем не нужно, больше на OLTP похоже.

...

Рейтинг:

0 / 0

19.01.2012, 14:00

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622164

thehil

Гость

Производительность не будет линейной хотя бы из за того что при небольшом количестве записей индексы влазят в память, при большом - уже ничего не влазит. Доступ к строкам примерно равномерный, нету распределения по времени. Большинство запросов по ПК, часть - по другим индексированным полям.

...

Рейтинг:

0 / 0

19.01.2012, 14:03

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622185

miksoft

Участник

Сообщения: 36 746

Рейтинг: 0 / 0

thehilПроизводительность не будет линейной хотя бы из за того что при небольшом количестве записей индексы влазят в память, при большом - уже ничего не влазит.Да, по достижении некоторого порога будет скачок, но за ним картина опять будет той же (с индексом - логарифмическйи рост, без индекса - линейный).

...

Рейтинг:

0 / 0

19.01.2012, 14:11

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622193

thehil

Гость

miksoftthehilПроизводительность не будет линейной хотя бы из за того что при небольшом количестве записей индексы влазят в память, при большом - уже ничего не влазит.Да, по достижении некоторого порога будет скачок, но за ним картина опять будет той же (с индексом - логарифмическйи рост, без индекса - линейный).

Это и понятно, цель - преодолеть скачок. Мой первый вариант - партицирование, тут можно надеятся на примерно одинаковою производительность при любом числе строк для запросов по ключу партицирования. Но для остальных запросов будет только хуже.

Нужны ещё варианты. Причем бесплатные.

...

Рейтинг:

0 / 0

19.01.2012, 14:15

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622204

Victor Metelitsa

Участник

Откуда: Тюмень

Сообщения: 2 626

Рейтинг: 0 / 0

А партиционирование где бесплатное?

...

Рейтинг:

0 / 0

19.01.2012, 14:18

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622226

miksoft

Участник

Сообщения: 36 746

Рейтинг: 0 / 0

thehilЭто и понятно, цель - преодолеть скачок.Никак не преодолете. Либо физический ввод/вывод не нужен (нужные данные есть в ОП), либо нужен. Во втором случае совсем другие времена.

Максимум, что в этой ситуации поможет, имхо:
1) правильный алгоритм кэширования, чтобы для наиболее критичных по времени запросов была выше вероятность обойтись данными в ОП.
2) правильное использование индексов и других механизмов СУБД, позволяющие минимизировать физический ввод/вывод. И не вовсе не факт, что партиционирование тут поможет.

Пока не описана четко задача - можно теоретизировать бесконечно. Оптимизировать можно только частный случай.

...

Рейтинг:

0 / 0

19.01.2012, 14:24

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622261

Victor Metelitsa

Участник

Откуда: Тюмень

Сообщения: 2 626

Рейтинг: 0 / 0

В случае Oracle, партишионирование поддерживает только EE - это сотни тысяч долларов на один сервер. С DB2 аналогично.

Postgres?

...

Рейтинг:

0 / 0

19.01.2012, 14:34

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622292

thehil

Гость

Victor Metelitsa,

Да PostgreSQL поддерживает, да и на крайний случай MySQL тоже может.

Насчет подробнестей - уточните что вы ещё хотите услышать?
Есть отностительно слабый сервер, из железа больше ничего. Есть таблица с миллионами строк, хочется чтобы разростание до миллиардов не привело к заметному ухудшению времени отклика. Апп сервер на той же машине. Запросов не много, до нескольких в секунду. Запросы элементарные: дай/удали/измени строку по id в основном (80%), немного запросов по другим полям из этой же таблицы, использующие индекс (10%), есть несколько джойнов с такой же большой таблицей по id. Везде индексы и на небольших объёмах данных отклик устраивает.

...

Рейтинг:

0 / 0

19.01.2012, 14:43

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622296

нелинейную зависимость в OLTP

Гость

thehil , А про нелинейную зависимость в OLTP от размера таблицы это вы тестами определили или предположили?

...

Рейтинг:

0 / 0

19.01.2012, 14:45

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622297

thehil

Гость

Была мысль насчет шардинга mongodb на одной машине, но походу это гиблое дело.

...

Рейтинг:

0 / 0

19.01.2012, 14:45

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622305

thehil

Гость

нелинейную зависимость в OLTP,

Предположин, да и люди выше подтвердили. Пока всё в памяти - логарифмически, как только не влазит - должно хуже. Сейчас попробую провести тест в условиях ограниченной памяти.

...

Рейтинг:

0 / 0

19.01.2012, 14:47

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622307

miksoft

Участник

Сообщения: 36 746

Рейтинг: 0 / 0

thehilЗапросов не много, до нескольких в секунду.Ну тут и с дисковыми чтениями ничего страшного не будет.

...

Рейтинг:

0 / 0

19.01.2012, 14:47

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622315

Сколько ОЗУ? Какая СУБД?

Гость

thehilVictor Metelitsa,

Да PostgreSQL поддерживает, да и на крайний случай MySQL тоже может.

Насчет подробнестей - уточните что вы ещё хотите услышать?
Есть отностительно слабый сервер, из железа больше ничего. Есть таблица с миллионами строк, хочется чтобы разростание до миллиардов не привело к заметному ухудшению времени отклика. Апп сервер на той же машине. Запросов не много, до нескольких в секунду. Запросы элементарные: дай/удали/измени строку по id в основном (80%), немного запросов по другим полям из этой же таблицы, использующие индекс (10%), есть несколько джойнов с такой же большой таблицей по id. Везде индексы и на небольших объёмах данных отклик устраивает.
Сколько ОЗУ? Какая СУБД?
Первые 2-3 уровня индекса будут закэшированы. Партиционирование это фактически ещё один уровень индекса. Здесь удобство бывает в том, что с партициями можно работать как с обычными таблицами и переносить их между тейблспейсами и соотвественно на другие СХД.

...

Рейтинг:

0 / 0

19.01.2012, 14:49

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622322

thehil

Гость

miksoft,

Возможно. Но в любом случае чтение с диска заметно медленнее чем из памяти. В случае с партицирование есть шанс выделить наиболее используемые данные в одну партицию и тогда шанс попадание в кеш индекса для этой партиции должен быть выше.

...

Рейтинг:

0 / 0

19.01.2012, 14:51

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622327

нелинейную зависимость в OLTP

Гость

thehilнелинейную зависимость в OLTP,

Предположин, да и люди выше подтвердили. Пока всё в памяти - логарифмически, как только не влазит - должно хуже. Сейчас попробую провести тест в условиях ограниченной памяти.
Если подтвердиться то только шардинг, кластер или добавлять памяти.

...

Рейтинг:

0 / 0

19.01.2012, 14:52

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622329

нелинейную зависимость в OLTP

Гость

thehilmiksoft,

Возможно. Но в любом случае чтение с диска заметно медленнее чем из памяти. В случае с партицирование есть шанс выделить наиболее используемые данные в одну партицию и тогда шанс попадание в кеш индекса для этой партиции должен быть выше.
Попробуйте "провести тест в условиях ограниченной памяти." и если будут ухудшения, то попробуйте от них избавиться "выделить наиболее используемые данные в одну партицию и тогда шанс попадание в кеш индекса для этой партиции должен быть выше.".

...

Рейтинг:

0 / 0

19.01.2012, 14:54

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622331

thehil

Гость

Сколько ОЗУ? Какая СУБД?Сколько ОЗУ? Какая СУБД?
Первые 2-3 уровня индекса будут закэшированы. Партиционирование это фактически ещё один уровень индекса. Здесь удобство бывает в том, что с партициями можно работать как с обычными таблицами и переносить их между тейблспейсами и соотвественно на другие СХД.
Сейчас PostgreSQL, но возможно поменять на абсолютно любую бесплатную. ОЗУ может меняться, т.к. приложение целиком с базой ставится на клиентский сервер. Давайте предположим что минимум 4 Gb ОЗУ.

...

Рейтинг:

0 / 0

19.01.2012, 14:54

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622335

thehil

Гость

нелинейную зависимость в OLTPthehilнелинейную зависимость в OLTP,

Предположин, да и люди выше подтвердили. Пока всё в памяти - логарифмически, как только не влазит - должно хуже. Сейчас попробую провести тест в условиях ограниченной памяти.
Если подтвердиться то только шардинг, кластер или добавлять памяти.
К сожалению все эти варианты сразу отпадают.

...

Рейтинг:

0 / 0

19.01.2012, 14:55

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622336

miksoft

Участник

Сообщения: 36 746

Рейтинг: 0 / 0

thehilmiksoft,

Возможно. Но в любом случае чтение с диска заметно медленнее чем из памяти.Пока не озвучены четкие цифры вида "такой-то SQL-запрос на таких-то данных отрабывает за X секунд, а допустимо не более чем за Y секунд в Z% случаев" ваши фразы типа "заметно медленнее" - ни о чем.

...

Рейтинг:

0 / 0

19.01.2012, 14:55

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622345

Yo.!

Гость

Victor MetelitsaВ случае Oracle, партишионирование поддерживает только EE - это сотни тысяч долларов на один сервер. С DB2 аналогично.

Partition Views есть в любой оракловой редакции
http://docs.oracle.com/cd/A57673_01/DOC/server/doc/A48506/partview.htm#351

в постгрес взрослого партитионинга нет, но есть те же самые Partition Views

...

Рейтинг:

0 / 0

19.01.2012, 14:58

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622354

Victor Metelitsa

Участник

Откуда: Тюмень

Сообщения: 2 626

Рейтинг: 0 / 0

thehilЕсть отностительно слабый сервер, из железа больше ничего. Есть таблица с миллионами строк, хочется чтобы разростание до миллиардов не привело к заметному ухудшению времени отклика. Апп сервер на той же машине. Запросов не много, до нескольких в секунду. Запросы элементарные: дай/удали/измени строку по id в основном (80%), немного запросов по другим полям из этой же таблицы, использующие индекс (10%), есть несколько джойнов с такой же большой таблицей по id. Везде индексы и на небольших объёмах данных отклик устраивает.

Загрузите тестовыми данными, да посмотрите. Лично мне кажется, что при такой абстрактной постановке и с миллиардами записей будет терпимо работать (причём даже без партишионирования, но при наличии подходящих индексов). Вот бекапы делать - это да...

...

Рейтинг:

0 / 0

19.01.2012, 15:01

| Ответить | Цитировать | Написать

Большая таблица, мало RAM

#37622380

Victor Metelitsa

Участник

Откуда: Тюмень

Сообщения: 2 626

Рейтинг: 0 / 0

Yo.!Victor MetelitsaВ случае Oracle, партишионирование поддерживает только EE - это сотни тысяч долларов на один сервер. С DB2 аналогично.

Partition Views есть в любой оракловой редакции
http://docs.oracle.com/cd/A57673_01/DOC/server/doc/A48506/partview.htm#351

А... Я уже забыл про эту фичу (в DB2 такое можно также на любых версиях)

...

Рейтинг:

0 / 0

19.01.2012, 15:09

| Ответить | Цитировать | Написать

25 сообщений из 87, страница 1 из 4

все

Форумы / Сравнение СУБД [игнор отключен] [закрыт для гостей] / Большая таблица, мало RAM

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=35&msg=37622185&tid=1552593]:	0ms
get settings:	8ms
get forum list:	10ms
check forum access:	2ms
check topic access:	2ms
track hit:	158ms
get topic data:	9ms
get forum data:	2ms
get page messages:	52ms
get tp. blocked users:	1ms
others:	279ms

total:	523ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы