Производительность запроса count / PostgreSQL

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Производительность запроса count

9 сообщений из 9, страница 1 из 1

Производительность запроса count

#33267025

kka

Участник

Сообщения: 25

Рейтинг: 0 / 0

Имеем таблицу в которой храниться около 3.5 милионов записей.
В таблице есть один первичный ключ и кластерный btree индекс по нему (поле doc_id).
Почему запрос select count(*) from docs1 и select count(doc_id) from docs1 выполняються порядка 5 минут?
План запроса

tests=# explain select count(doc_id) from docs1;
QUERY PLAN
----------------------------------------------------------------------
Aggregate (cost=138072.83..138072.83 rows=1 width=4)
-> Seq Scan on docs1 (cost=0.00..128869.06 rows=3681506 width=4)
(2 rows)
То есть делаться полные перебор, почему?

Чего я делаю не так?

PostgreSQL 8.0.3 for Windows на Win2k3 SE, на машине 2*1gHz Xeon'а и 1Гб ОЗУ, винт ATA66 7200rpm.

...

Рейтинг:

0 / 0

13.09.2005, 17:02

| Ответить | Цитировать | Написать

Производительность запроса count

#33267437

поиск рулит

Гость

пройдись поиском по "Count" и "индекс". Обсуждалось. ПРоблема в специфике индексов постгреса ( кажеца - в специфике индексов для версий - строится индекс для всех записей, а актуальность ("не удаленность") проверяется только в самой записи.

...

Рейтинг:

0 / 0

13.09.2005, 20:17

| Ответить | Цитировать | Написать

Производительность запроса count

#33267829

Кувалдин Роман

Участник

Откуда: Московская область

Сообщения: 1 240

Рейтинг: 0 / 0

А как еще можно посчитать количество записей в таблице, нежели чем полным перебором?
И как к этому делу индекс привесить?

В постгресе ни одна агрегатная функция не использует индексов.

...

Рейтинг:

0 / 0

14.09.2005, 09:16

| Ответить | Цитировать | Написать

Производительность запроса count

#33267842

Кувалдин Роман

Участник

Откуда: Московская область

Сообщения: 1 240

Рейтинг: 0 / 0

поиск рулитпройдись поиском по "Count" и "индекс". Обсуждалось. ПРоблема в специфике индексов постгреса ( кажеца - в специфике индексов для версий - строится индекс для всех записей, а актуальность ("не удаленность") проверяется только в самой записи.

Я бы сказал - вообще в специфике индексов в любой БД. Индекс - это некая штука, которая позволяет тебе быстро найти ОДНУ конкретную строку. А число строк с индексом не связано.

...

Рейтинг:

0 / 0

14.09.2005, 09:21

| Ответить | Цитировать | Написать

Производительность запроса count

#33267877

LeXa NalBat

Участник

Откуда: Москва

Сообщения: 2 843

Рейтинг: 0 / 0

Кувалдин РоманА как еще можно посчитать количество записей в таблице, нежели чем полным перебором?Триггерами (при изменении кол-ва строк в таблице) поддерживать [системную] таблицу (table_id,rows_count).

Кувалдин РоманВ постгресе ни одна агрегатная функция не использует индексов.В 8.1 min и max будут использовать индексы, ура! :)

http://developer.postgresql.org/docs/postgres/release.html#RELEASE-8-1

Automatically use indexes for MIN() and MAX() (Tom)

In previous releases, the only way to use an index for MIN() or MAX() was to rewrite the query as SELECT col FROM tab ORDER BY col LIMIT 1. Index usage now happens automatically.

...

Рейтинг:

0 / 0

14.09.2005, 09:36

| Ответить | Цитировать | Написать

Производительность запроса count

#33268085

Кувалдин Роман

Участник

Откуда: Московская область

Сообщения: 1 240

Рейтинг: 0 / 0

LeXa NalBat Кувалдин РоманА как еще можно посчитать количество записей в таблице, нежели чем полным перебором?Триггерами (при изменении кол-ва строк в таблице) поддерживать [системную] таблицу (table_id,rows_count).

Триггеры - в данном случае дополнительный механизм. Хочешь - делай сам системную таблицу, и реализуй его. В БД такую фичу засовывать нет надобности.
Тем более что count по какому-либо условию, которое отсеивает некоторые строки из таблицы, сделает твое значение ненужным. Будешь хранить все возможные count-ы?

select count(id) from table1 where id>100;
select count(id) from table1 where id<100;
select count(id) from table1 where id>200;
select count(id) from table1 where id>50;
select count(...) from table1 where ...;

Кувалдин РоманВ постгресе ни одна агрегатная функция не использует индексов.В 8.1 min и max будут использовать индексы, ура! :)

http://developer.postgresql.org/docs/postgres/release.html#RELEASE-8-1

Automatically use indexes for MIN() and MAX() (Tom)

In previous releases, the only way to use an index for MIN() or MAX() was to rewrite the query as SELECT col FROM tab ORDER BY col LIMIT 1. Index usage now happens automatically.[/quot]

Это называется "kernel hack". Кстати, min и max я всю жизнь так и делал. И не только в постгресе.

...

Рейтинг:

0 / 0

14.09.2005, 10:45

| Ответить | Цитировать | Написать

Производительность запроса count

#33268238

Andrey Daeron

Участник

Откуда: Киев

Сообщения: 1 036

Рейтинг: 0 / 0

Еще можно попробывать делать ANALYZE перед запросом.
Может поможет :)
Опять же где-то проскакивала ссылка на статью по типу "Настройка производительности Postgres" и там этот вопрос поднимался. На сколько я помню - что приблизительное количество строк можно получить из таблиц статистики. Сразу после ANALYZE это значение будет почти всегда точным.
Почти - это если в промежутке кто-то успеет вставить лимон-другой записей :)

...

Рейтинг:

0 / 0

14.09.2005, 11:19

| Ответить | Цитировать | Написать

Производительность запроса count

#33268298

LeXa NalBat

Участник

Откуда: Москва

Сообщения: 2 843

Рейтинг: 0 / 0

Кувалдин РоманТем более что count по какому-либо условию, которое отсеивает некоторые строки из таблицы, сделает твое значение ненужным. Будешь хранить все возможные count-ы?

select count(id) from table1 where id>100;
select count(id) from table1 where id<100;
select count(id) from table1 where id>200;
select count(id) from table1 where id>50;
select count(...) from table1 where ...;Зависит от задачи. Если что-то ОЛАПовидное, то буду.

Кувалдин РоманКстати, min и max я всю жизнь так и делал. И не только в постгресе.Теперь появится для нас замечательный повод поглупеть, и писать просто select min(...). :)

...

Рейтинг:

0 / 0

14.09.2005, 11:31

| Ответить | Цитировать | Написать

Производительность запроса count

#33273229

опять я

Гость

Кувалдин Роман поиск рулитпройдись поиском по "Count" и "индекс". Обсуждалось. ПРоблема в специфике индексов постгреса ( кажеца - в специфике индексов для версий - строится индекс для всех записей, а актуальность ("не удаленность") проверяется только в самой записи.

Я бы сказал - вообще в специфике индексов в любой БД.
не уверен. если бы, к примеру, индекс [каким-то раком] включал в себя только акутальные записи, то достаточно было бы прочитать только индекс, но не таблицу, что видимо было бы таки быстрее (просто по объему данных). Не помню точно, но кааца натыкался (в "сравнении") на упоминание об именно таком (т.е. позволяющем выяснить актуальность записи не тыкаясь в саму таблицу) устройстве индексов для какого-то из версионников.

Что касается каунта по условию - дык задействуй условие заведомо юзающее индекс, и будет тибе щасье.

...

Рейтинг:

0 / 0

16.09.2005, 12:16

| Ответить | Цитировать | Написать

9 сообщений из 9, страница 1 из 1

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / Производительность запроса count

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=53&msg=33273229&tid=2007012]:	0ms
get settings:	6ms
get forum list:	12ms
check forum access:	2ms
check topic access:	2ms
track hit:	101ms
get topic data:	9ms
get forum data:	2ms
get page messages:	35ms
get tp. blocked users:	1ms
others:	242ms

total:	412ms