select count(*) from t - как быстрее получить прибл.к-во / PostgreSQL

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / select count(*) from t - как быстрее получить прибл.к-во

25 сообщений из 38, страница 1 из 2

все

select count(*) from t - как быстрее получить прибл.к-во

#34757609

Winnipuh

Участник

Откуда: Київ

Сообщения: 10 496

Рейтинг: 0 / 0

Можно ли посчитать к-во записей быстро, пусть не точное, приблизительное, скажем если там 11 234 567, а я получу 11 100 000, то это меня устроит, важно масштаб и скорость

...

Рейтинг:

0 / 0

28.08.2007, 12:30

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34757638

untitled

Участник

Сообщения: 143

Рейтинг: 0 / 0

SELECT reltuples FROM pg_class WHERE relname = 'tablename';

...

Рейтинг:

0 / 0

28.08.2007, 12:34

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34757660

Winnipuh

Участник

Откуда: Київ

Сообщения: 10 496

Рейтинг: 0 / 0

untitledSELECT reltuples FROM pg_class WHERE relname = 'tablename';

шайтан! :-)

в чем "приблизительность" количества? у меня совпало сейчас, но юзеров нету.

...

Рейтинг:

0 / 0

28.08.2007, 12:38

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34757677

untitled

Участник

Сообщения: 143

Рейтинг: 0 / 0

это значение, которое было вычислено после analyze

...

Рейтинг:

0 / 0

28.08.2007, 12:40

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34757704

Winnipuh

Участник

Откуда: Київ

Сообщения: 10 496

Рейтинг: 0 / 0

untitledэто значение, которое было вычислено после analyze

т.е. это будет не приблизительное значение, оно может отличаться на порядки, в зависимости от того как давно выполнялся analyze.

...

Рейтинг:

0 / 0

28.08.2007, 12:44

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34757749

untitled

Участник

Сообщения: 143

Рейтинг: 0 / 0

теоретически да.

но при включенном автовакууме это значение всегда будет более-менее правильным.
даже если автовакуума нет, то хорошим решением будет раз в сутки делать vacuum analyze, что, в том числе, обновит эту таблицу с количеством записей.

...

Рейтинг:

0 / 0

28.08.2007, 12:50

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34757786

assa

Участник

Откуда: мы сами не местные

Сообщения: 3 467

Рейтинг: 0 / 0

если нужно именно то, что написано - т.е. каунты _без условий_ - то кажется LeXa NalBat (мои извинения, ежли путаю) неоднократно рекомендовал вести свои таблички на триггерах. Все упирается в соотношение цена(решения)/частота пользования.

...

Рейтинг:

0 / 0

28.08.2007, 12:56

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34757911

Winnipuh

Участник

Откуда: Київ

Сообщения: 10 496

Рейтинг: 0 / 0

assaесли нужно именно то, что написано - т.е. каунты _без условий_ - то кажется LeXa NalBat (мои извинения, ежли путаю) неоднократно рекомендовал вести свои таблички на триггерах. Все упирается в соотношение цена(решения)/частота пользования.

да, понимаю, но для таблицы с 10 млн записей триггеры дороговаты будут...

...

Рейтинг:

0 / 0

28.08.2007, 13:14

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34758026

Rastafarra

Участник

Откуда: Уфа

Сообщения: 111

Рейтинг: 0 / 0

между прочим один умный человек мне советовал делать не count(*), а count(primary_key) :)

обосновывал он свою позицию использованием индексированного поля и скоростью работы с ним.

...

Рейтинг:

0 / 0

28.08.2007, 13:37

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34758138

Nick Gazaloff

Гость

Rastafarraмежду прочим один умный человек мне советовал делать не count(*), а count(primary_key) :)

обосновывал он свою позицию использованием индексированного поля и скоростью работы с ним.

Сделайте explain и убедитесь, что разницы никакой.

...

Рейтинг:

0 / 0

28.08.2007, 14:03

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34758300

LeXa NalBat

Участник

Откуда: Москва

Сообщения: 2 843

Рейтинг: 0 / 0

Nick Gazaloff Rastafarraмежду прочим один умный человек мне советовал делать не count(*), а count(primary_key) :)

обосновывал он свою позицию использованием индексированного поля и скоростью работы с ним.Сделайте explain и убедитесь, что разницы никакой.Да, даже скорее всего выполнение через IndexScan будет медленнее, чем SeqScan, потому что при IndexScan постгрес все равно будет залезать в таблицу.

Но кажется тут проводили тесты, что count(1) немного быстрее из-за меньшей ширины выбираемых полей.

...

Рейтинг:

0 / 0

28.08.2007, 14:41

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34758751

assa

Участник

Откуда: мы сами не местные

Сообщения: 3 467

Рейтинг: 0 / 0

Winnipuhда, понимаю, но для таблицы с 10 млн записей триггеры дороговаты будут...не понял. если вы в триггере напишете "селект каунт()"- то да. а если триггера - "дифференциальные" - то цена зависит не от колич-ва записей, а от частоты вставки/удаления. Нет?
Т.е. надо сравнить возрастание нагрузки при вставке/удалении с частотой выполнения "селект-каунтов". Вот на табличку с ежедневной массовой заливкой и очисткой я бы поостерегся, что да, то да.

...

Рейтинг:

0 / 0

28.08.2007, 16:15

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34758944

alex_v13

Гость

count любого поля будет все равно SeqScan из-за такой реализации в ПГ агрегатных ф-й.

Winnipuh
Если в таблице есть уникальный числовой ключ типа генерируемы по sequence, то max(key) даст точное количество записей и будет пользовать индекс по этому полю. Если нет, то только через tuples

...

Рейтинг:

0 / 0

28.08.2007, 16:57

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34759020

Winnipuh

Участник

Откуда: Київ

Сообщения: 10 496

Рейтинг: 0 / 0

alex_v13count любого поля будет все равно SeqScan из-за такой реализации в ПГ агрегатных ф-й.

Winnipuh
Если в таблице есть уникальный числовой ключ типа генерируемы по sequence, то max(key) даст точное количество записей и будет пользовать индекс по этому полю. Если нет, то только через tuples

вопрос:
если в таблице 1000 записей,
max(key) = 1000

потом удалили 900,
max(key) = 1000

?

...

Рейтинг:

0 / 0

28.08.2007, 17:12

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34759069

assa

Участник

Откуда: мы сами не местные

Сообщения: 3 467

Рейтинг: 0 / 0

Winnipuh alex_v13count любого поля будет все равно SeqScan из-за такой реализации в ПГ агрегатных ф-й.

Winnipuh
Если в таблице есть уникальный числовой ключ типа генерируемы по sequence, то max(key) даст точное количество записей и будет пользовать индекс по этому полю. Если нет, то только через tuples

вопрос:
если в таблице 1000 записей,
max(key) = 1000

потом удалили 900,
max(key) = 1000

?гм. вот можно например вести таблицу вообще без удалений (и апдейтов) (т.е. полный аудит внутри самой себя - все лежит внутри. есть 2 поля- "ключа" - 1 - "эффективный", и 2-й - собственно счетчик всего), тогда предложенное alex_v13 вполне сработает. но как же аккуратно надо все расписывать (через обновляемые вью - наипростейшее решение).

...

Рейтинг:

0 / 0

28.08.2007, 17:23

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34759073

untitled

Участник

Сообщения: 143

Рейтинг: 0 / 0

можно создать два сиквенса - количество внесенных и удаленных, и брать разницу между ними, но лучше сделать отдельную таблицу для статистики и изменять при помощи триггеров в ней значения. этот подход хорош тем, что можно одновременно вести подсчет по различным заранее известным критериям.

...

Рейтинг:

0 / 0

28.08.2007, 17:23

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34759084

LeXa NalBat

Участник

Откуда: Москва

Сообщения: 2 843

Рейтинг: 0 / 0

alex_v13count любого поля будет все равно SeqScan из-за такой реализации в ПГ агрегатных ф-й.

Код: plaintext

1.
2.
3.
4.

create table t1 ( id integer primary key );
insert into t1 select generate_series( 1 , 1000 );
analyze t1;
explain select count(*) from t1 where id between  100  and  200 ;
drop table t1;

Код: plaintext

1.
2.
3.
4.
5.

                                QUERY PLAN
--------------------------------------------------------------------------
 Aggregate  (cost= 4 . 85 .. 4 . 86  rows= 1  width= 0 )
   ->  Index Scan using t1_pkey on t1  (cost= 0 . 00 .. 4 . 60  rows= 100  width= 0 )
         Index Cond: ((id >=  100 ) AND (id <=  200 ))
( 3  rows)

...

Рейтинг:

0 / 0

28.08.2007, 17:26

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34759103

Winnipuh

Участник

Откуда: Київ

Сообщения: 10 496

Рейтинг: 0 / 0

untitledможно создать два сиквенса - количество внесенных и удаленных, и брать разницу между ними, но лучше сделать отдельную таблицу для статистики и изменять при помощи триггеров в ней значения. этот подход хорош тем, что можно одновременно вести подсчет по различным заранее известным критериям .

надо подумать, что будет в случае одновременно активно работающих 100 юзерах

...

Рейтинг:

0 / 0

28.08.2007, 17:30

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34759206

untitled

Участник

Сообщения: 143

Рейтинг: 0 / 0

Winnipuh
надо подумать, что будет в случае одновременно активно работающих 100 юзерах

ну понятно что сначала нужно выяснить необходимость этого. если требуется выводить что-то вроде "на нашем сайте больше 5000 зарегистрированных пользователей" то вполне достаточно брать результаты analyze и не заморачиваться )

...

Рейтинг:

0 / 0

28.08.2007, 17:54

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34759386

alex_v13

Гость

LeXa NalBat

Это такой план на 8.2.4 ?

У меня на 8.1.3 таблички по 50 млн записей со всеми ииндексами, но такой план ни-ни.

Winnipuh
При активной работе пользователей приводящей с частым обновлениям данных в таблицах уменьшение интервала автовакума сильно улучшает общую картину с производительность, а также reltuples становится сильно ближе действительному числу записей. Тот метод который я предожил содержит ряд условностей (выше о них написали) и нужен только если нужно именно точное значение числа записей.

...

Рейтинг:

0 / 0

28.08.2007, 18:49

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34760221

LeXa NalBat

Участник

Откуда: Москва

Сообщения: 2 843

Рейтинг: 0 / 0

alex_v13Это такой план на 8.2.4 ?

У меня на 8.1.3 таблички по 50 млн записей со всеми ииндексами, но такой план ни-ни.8.1.9

...

Рейтинг:

0 / 0

29.08.2007, 09:27

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34761213

Nick Gazaloff

Гость

alex_v13 LeXa NalBat

Это такой план на 8.2.4 ?

У меня на 8.1.3 таблички по 50 млн записей со всеми ииндексами, но такой план ни-ни.

1. У LeXa явно стоит enable_seqscan=false.
2. В данном случае подобный план ничего не улучшает. рекомендую сравнить время выполнения запроса с WHERE (выставив условие, в которое заведомо попадает вся таблица) и без него. Без WHERE будет быстрее.

...

Рейтинг:

0 / 0

29.08.2007, 13:19

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34761315

LeXa NalBat

Участник

Откуда: Москва

Сообщения: 2 843

Рейтинг: 0 / 0

Nick Gazaloff1. У LeXa явно стоит enable_seqscan=false.нет

Nick Gazaloff2. В данном случае подобный план ничего не улучшает.улучшает

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.

                                                      QUERY PLAN
----------------------------------------------------------------------------------------------------------------------
 Aggregate  (cost= 4 . 85 .. 4 . 86  rows= 1  width= 0 ) (actual time= 0 . 501 .. 0 . 503  rows= 1  loops= 1 )
   ->  Index Scan using t1_pkey on t1  (cost= 0 . 00 .. 4 . 60  rows= 100  width= 0 ) (actual time= 0 . 018 .. 0 . 278  rows= 101  loops= 1 )
         Index Cond: ((id >=  100 ) AND (id <=  200 ))
 Total runtime:  0 . 555  ms
( 4  rows)

                                              QUERY PLAN
-------------------------------------------------------------------------------------------------------
 Aggregate  (cost= 21 . 25 .. 21 . 26  rows= 1  width= 0 ) (actual time= 0 . 837 .. 0 . 839  rows= 1  loops= 1 )
   ->  Seq Scan on t1  (cost= 0 . 00 .. 21 . 00  rows= 100  width= 0 ) (actual time= 0 . 044 .. 0 . 610  rows= 101  loops= 1 )
         Filter: ((id >=  100 ) AND (id <=  200 ))
 Total runtime:  0 . 883  ms
( 4  rows)

Nick Gazaloffрекомендую сравнить время выполнения запроса с WHERE (выставив условие, в которое заведомо попадает вся таблица) и без него. Без WHERE будет быстрее.зачем нужно условие where, в которое попадает вся таблица? конечно в этом случае без where будет быстрее.

...

Рейтинг:

0 / 0

29.08.2007, 13:36

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34762825

Nick Gazaloff

Гость

А зачем нужно считать строки с 100-й по 200-ю?

И не надо говорить, что count здесь использует индекс. Индекс использует WHERE.

...

Рейтинг:

0 / 0

29.08.2007, 18:55

| Ответить | Цитировать | Написать

select count(*) from t - как быстрее получить прибл.к-во

#34763605

LeXa NalBat

Участник

Откуда: Москва

Сообщения: 2 843

Рейтинг: 0 / 0

Nick GazaloffА зачем нужно считать строки с 100-й по 200-ю?Чтобы узнать кол-во строк в таблице, удовлетворяющих некоторому условию.

Например, кол-во моделей сотовых телефонов в товарном каталоге: "where category_id='mobile'".

Nick GazaloffИ не надо говорить, что count здесь использует индекс. Индекс использует WHERE.Я бы не сказал, что "count использует индекс" и "индекс использует WHERE" - понятные и математически точные формулировки.

Я привел пример опровеграющий утверждение alex_v13 "count любого поля будет все равно SeqScan из-за такой реализации в ПГ агрегатных ф-й". На словах это опровержение сформулировал бы так: для вычисления count постгрес может использовать план отличный от SeqScan, причем это даст выигрыш в скорости выполнения запроса.

...

Рейтинг:

0 / 0

30.08.2007, 10:35

| Ответить | Цитировать | Написать

25 сообщений из 38, страница 1 из 2

все

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / select count(*) from t - как быстрее получить прибл.к-во

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=53&msg=34757704&tid=2005087]:	0ms
get settings:	6ms
get forum list:	13ms
check forum access:	2ms
check topic access:	2ms
track hit:	48ms
get topic data:	8ms
get forum data:	2ms
get page messages:	57ms
get tp. blocked users:	1ms
others:	222ms

total:	361ms