Пара общих вопросов по БД на примере PostgreSQL. / PostgreSQL

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Пара общих вопросов по БД на примере PostgreSQL.

3 сообщений из 3, страница 1 из 1

Пара общих вопросов по БД на примере PostgreSQL.

#38723031

Dymytry

Участник

Откуда: Столица

Сообщения: 112

Рейтинг: 0 / 0

День добрый, уважаемые любители баз данных!
Прошу оказать гуманитарную помощь java-программисту.

Теория:

t1. А почему нельзя сделать индекс на основе hashmap? Время доступа уменьшается до константы. Если нет повторяющихся значений ключей - должно работать.
t2. В индексе, который B+tree, есть leaf nodes, ноды с самой большой глубиной где и хранятся данные, эти ноды связанны между собой последовательно. Вопрос: отличается ли считывание следующего значения внутри такой ноды от перехода в другую ноду? То есть важно ли для нас чтобы все значения которые мы ищем попали в одну ноду?
t3. Бывают ли БД, где все данные упорядочены в соотв. со значениями ключей? То есть при считывании некоторого range не надо бегать считывающим устройством по диску.
t4. Индекс хранится на диске. А нельзя его как-то в оперативную память поместить для ускорения?

Практика:

p1. Общий главный вопрос: в каких ситуациях анализатор может предпочесть seq scan индексу?
По моим наблюдениям, есть два варианта:
1. чем больше проход по leaf nodes, который делает запрос, тем больше вероятность того что индекс вообще не будет использован. Такое бывает, например, при неравномерном распределении значений ключей: к примеру много Y и N.
2. если таблица маленькая. например 100 рядов.

Это так? Есть что-то еще?

p2. В integer типе в БД не бывает переполнения?

p3. Могу ли я в PosgreSQL распечатать как выглядит дерево индекса?

...

Рейтинг:

0 / 0

19.08.2014, 01:53:12

| Ответить | Цитировать | Написать

Пара общих вопросов по БД на примере PostgreSQL.

#38723129

rovan

Гость

Теория.
1. В целом-то, можно. В PG есть такой тип индекса . На практике нет никакого константного времени, работает он незначительно быстрее B-Tree, правда, создаётся быстрее.
2. В случае Index-only скана может оказаться важным, чтобы все значения попали в одну страницу (единица ввода-вывода в PG). Что до ноды - сомневаюсь. Надеюсь, более сведущие коллеги подскажут.
3. Да. Это т.н. кластеризованные таблицы (или Index-organized в Оракле). В PG есть операция кластеризации, т.е. она единоразово упорядочивает данные в таблицы в соответствии с указанным индексом. После любых модификаций она, соответственно, теряет статус кластеризованной.
4. Всё хранится на диске. Однако, при считывании данные попадают в buffer cache. При условии, что данные часто используются, они будут там жить. То есть, если индекс регулярно используется в запросах, то он и так попадёт в оперативную память.

Практика.
1. Если маленькая - да, индекс, скорее всего, проигнорируется. Проход по листьям - в общем, если по индексу идти дороже (больше I/O), чем seq scan-ом, то будет выбран seq scan. Чаще всего seq-scan выпадает на запросы с низкой селективностью (условно говоря, если нам все равно читать половину таблицы, то дешевле просканить всю, чем скакать от индекса к данным.
2. Бывают

Код: plsql

1.
2.

select 9223372036854775807::integer
ERROR:  integer out of range

3. Для получения однозначного ответа на этот вопрос, придётся покопаться в мануалах. Подождём более сведущих коллег.
Для чего распечатка дерева понадобилась?

Общий совет - оценивай всё происходящее в базе не с точки зрения скорости единичной операции, а с точки зрения скорости ввода-вывода.

...

Рейтинг:

0 / 0

19.08.2014, 09:47:24

| Ответить | Цитировать | Написать

Пара общих вопросов по БД на примере PostgreSQL.

#38723412

Ivan Durak

Участник

Откуда: Minsk!!!

Сообщения: 2 602

Рейтинг: 0 / 0

Dymytry А почему нельзя сделать индекс на основе hashmap? Время доступа уменьшается до константы.

не до константы. В память весь он не влезет. А вообще hashmap прекрасно применяются для хэшджоинов например.
t2. В индексе, который B+tree, есть leaf nodes, ноды с самой большой глубиной где и хранятся данные

Ну все данные там не хранятся, за данными в PG таки приходится лазить уже по ссылке в страницу таблицы. Это только в кластерном индексе или покрывающем индексе там данные хранятся.

p1. Общий главный вопрос: в каких ситуациях анализатор может предпочесть seq scan индексу?

По цене (cost) запроса. Цена у поиска по индексу одна, у последовательного скана другая (меньшая).
Вычислив итоговую цену запроса оптимизатор выбирает с наименьшим костом.

...

Рейтинг:

0 / 0

19.08.2014, 13:09:01

| Ответить | Цитировать | Написать

3 сообщений из 3, страница 1 из 1

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Пара общих вопросов по БД на примере PostgreSQL.

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=53&fpage=124&tid=1998532]:	0ms
get settings:	9ms
get forum list:	11ms
check forum access:	3ms
check topic access:	3ms
track hit:	51ms
get topic data:	10ms
get forum data:	3ms
get page messages:	42ms
get tp. blocked users:	2ms
others:	237ms

total:	371ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы