увеличение производительности разделением таблицы / PostgreSQL

ReSQL.ru

2.0.60

Планшетная версия Контакт Правила FAQ Помощь

Гость

Войти | Профиль | Очистить

Нов. | Гор. | Избр.

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Действия ...

Доб. в избранное
Игнор. тему
Прикреп. тему
Пометить прочит. / непрочит.
Фильтр:
Сообщения автора темы
Сообщение содержит вложения
Сообщение содержит картинки
Сообщение содержит видеоклипы
Сообщение содержит аудиоклипы
Сообщение содержит картинки или видео 18+

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / увеличение производительности разделением таблицы / 13 сообщений из 13, страница 1 из 1

22.03.2006, 12:36

#33616893

DeWiL

Участник

Сообщения: 79
Рейтинг: 0 / 0

увеличение производительности разделением таблицы

Подскажите советом.

Допустим есть некая таблица.

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.

CREATE TABLE i (
    id SERIAL PRIMARY KEY NOT NULL,
    file_name TEXT,
    count_download INT DEFAULT  0 ,
    file_size INT DEFAULT  0 ,
    md5 TEXT DEFAULT crypt(random(),gen_salt('md5'))
    ...
);

В селектах используются только первые два поля, т.е. id и file_name
Таблица еще имеет достаточно большое количество полей с разными атрибутами, которые используются редко, но нужны для каждой записи.

Теперь вопрос. Если разделить записи на две таблицы.
В первой храним только первые два поля, которые используются для частых селектов, во-второй, все остальное с привязкой по id на первую таблицу.

Даст ли такой метод уменьшение времени для селектов?
Что еще можете посоветовать?

Попробовал использовать Inheritance, это только увеличило время, за счет обращения к таблице-наследнику.

Или для PG вообще не важно, сколько полей имеет таблица?

Конечная цель, получить наименьшее время при селектах для первых двух полей.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

22.03.2006, 18:31

#33618300

Funny_Falcon

Участник

Сообщения: 448
Рейтинг: 0 / 0

увеличение производительности разделением таблицы

А запросы-то какие? (примерчик плиз) Ведь в разных ситуациях по разному.
Но если записи апдейтятся редко, и запрос использует индекс, то, думаю, в одной таблице много лучше.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

22.03.2006, 19:37

#33618463

Hordi

Участник

Откуда: Украина,Киев
Сообщения: 168
Рейтинг: 0 / 0

увеличение производительности разделением таблицы

А я думаю - наоборот. Если постоянно извлекается пару основных полей, то постгрес вполне может закешировать всю таблицу, в случае же если таблица большая - в кеш попадет только часть...
Лучше всего тест написать и проверить.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

23.03.2006, 00:02

#33618722

DeWiL

Участник

Сообщения: 79
Рейтинг: 0 / 0

увеличение производительности разделением таблицы

запрос выглядит примерно так

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.

...
FOR row IN
        SELECT id,group_id,count_ch,name
        FROM 01_obj
        WHERE id IN
            (SELECT obj_id FROM 01_file WHERE
                show = 't' AND
                type_id IN (SELECT id FROM type_xml('01',_type)))
        AND group_id IN (SELECT id FROM group_xml('01',_group))
        ORDER BY id
        OFFSET _page * _elements - _elements
        LIMIT _elements
LOOP
...

таблица имеет до 10000 записей.

думаю, что еще над самим селектом можно поработать, оптимизировать.

добавлю к первоначальному своему вопросу следующее:
есть поля которые селектятся все время.
есть которые почти не селектятся.
есть которые апдейтятся.
исходя из этого думаю разделить их на 3 таблицы соответсвенно.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

23.03.2006, 10:55

#33619343

ilejn

Участник

Откуда: Москва
Сообщения: 397
Рейтинг: 0 / 0

увеличение производительности разделением таблицы

HordiА я думаю - наоборот. Если постоянно извлекается пару основных полей, то постгрес вполне может закешировать всю таблицу, в случае же если таблица большая - в кеш попадет только часть...
Лучше всего тест написать и проверить.

Если извлекаемые данные целиком содержатся в индексе,
то Oracle (и IMHO MS SQL) способен не лазить в саму
таблицу вообще. Если PostgreSQL ведет себя так же,
то задача сводится к правильному выбору индексов
над таблицей, т.е. м.б. полезно включить в индекс поле,
которое выбирают, но которое не используется для поиска.

Не совсем понятно, почему автор решил скрыть от общественности,
какие индексы помимо primary key использованы. Именно это
и представляет наибольший интерес.

Если честно, проблема кажется надуманной:
поиск записи по индексу должен очень слабо зависеть от
колонок, которые не входят в индекс.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

23.03.2006, 11:45

#33619596

Hordi

Участник

Откуда: Украина,Киев
Сообщения: 168
Рейтинг: 0 / 0

увеличение производительности разделением таблицы

2ilejn:

Поддерживаю. При поиске по индексу разница при выборке из полной таблицы или усеченной - копейки... Но протестить конкретную реализацию не помешало бы.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

23.03.2006, 16:33

#33621003

DeWiL

Участник

Сообщения: 79
Рейтинг: 0 / 0

увеличение производительности разделением таблицы

Про индексы "ничего не сказал" без злого умыслу :)
Индекс используется обычный на поле file_name типа btree.

Хорошо, если при селектах нет существенной разницы одна или две таблицы, и он все что надо берет в индексах.
А если в строке есть поле счетчика которое часто меняется? Не приводит это к разбуханию таблицы и лишним тормозам на автовакуме?

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

23.03.2006, 17:30

#33621271

ilejn

Участник

Откуда: Москва
Сообщения: 397
Рейтинг: 0 / 0

увеличение производительности разделением таблицы

DeWiL
А если в строке есть поле счетчика которое часто меняется? Не приводит это к разбуханию таблицы и лишним тормозам на автовакуме?

Если размер счетчика не изменяется (он ведь у тебя не VARHCAR, правда?)
и по нему нет индекса, то, исходя изо всех возможных рациональных соображений, описанных проблем быть не должно. PostgreSQL и рациональные соображения крайне редко входят в противоречия друг с другом.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

23.03.2006, 18:12

#33621447

PostgreSQL начинающий

Гость

увеличение производительности разделением таблицы

> таблица имеет до 10000 записей

Смешной объем. Не парьтесь. Была бы табличка на три порядка больше - можно было бы думать об оптимизации.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

24.03.2006, 08:56

#33622275

LeXa NalBat

Участник

Откуда: Москва
Сообщения: 2 843
Рейтинг: 0 / 0

увеличение производительности разделением таблицы

DeWiLзапрос выглядит примерно так ... думаю, что еще над самим селектом можно поработать, оптимизировать.Наверное сначала надо попытаться оптимизировать запрос - это может дать гораздо большую пользу, чем разделение таблицы. Киньте explain analyze запроса, который вы привели.

ilejnЕсли извлекаемые данные целиком содержатся в индексе,
то Oracle (и IMHO MS SQL) способен не лазить в саму
таблицу вообще. Если PostgreSQL ведет себя так же,Постгрес ведет себя иначе - все равно заглядывает в таблицу. Это объясняется используемой транзакционной моделью, досконально обяснить не могу, потому что не уверен в собственном понимании.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

24.03.2006, 11:12

#33622731

Funny_Falcon

Участник

Сообщения: 448
Рейтинг: 0 / 0

увеличение производительности разделением таблицы

ilejnЕсли размер счетчика не изменяется (он ведь у тебя не VARHCAR, правда?)
и по нему нет индекса

Зато есть другие индексы, и они то и будут расти при каждом апдейте счетчика

ilejnPostgreSQL и рациональные соображения крайне редко входят в противоречия друг с другом.
Здесь ты не совсем права: у тебя свои рац. соображения, у создателей Postgres - свои. Если понять их рац. соображения, то начинаешь восхищаться, если цепляешься за собственные - иногда плеваться хочеться. PostgreSQL особенный продукт (как в прочем и остальные) и его надо принимать.

Код: plaintext

1.
2.
3.
4.
5.

select $SONG$
Осень жизни, как и осень года,
Надо благодарно принимать...
Надо благодарно принимать...
$SONG$;

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

24.03.2006, 17:25

#33624322

ilejn

Участник

Откуда: Москва
Сообщения: 397
Рейтинг: 0 / 0

увеличение производительности разделением таблицы

Зато есть другие индексы, и они то и будут расти при каждом апдейте счетчика

Поясни, пожалуйста. У нас есть таблица с полями f1 и f2. По полю f1 есть
индекс, по полю f2 его нет. Мы выполняем UPDATE полей f2 и в результате
этого будет расти индекс по f1. Я тебя правильно понял?

Здесь ты не совсем права: у тебя свои рац. соображения, у создателей Postgres - свои. Если понять их рац. соображения, то начинаешь восхищаться, если цепляешься за собственные - иногда плеваться хочеться. PostgreSQL особенный продукт (как в прочем и остальные) и его надо принимать.

Я не очень хочу вступать в философскую дискуссию, но не могу
не отметить твою неправильную трактовку моей половой принадлежности.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

27.03.2006, 12:00

#33626738

Funny_Falcon

Участник

Сообщения: 448
Рейтинг: 0 / 0

увеличение производительности разделением таблицы

За неправильную трактовку сразу извиняюсь. Помню как-то давно принял девушку за парня ;-) и начал рассказывать о своих взглядах на девушек.
ilejnПоясни, пожалуйста. У нас есть таблица с полями f1 и f2. По полю f1 есть
индекс, по полю f2 его нет. Мы выполняем UPDATE полей f2 и в результате
этого будет расти индекс по f1. Я тебя правильно понял?
Абсолютно. Для индексов в PostgreSQL (насколко я понимаю в данный момент) не существует операции "delete", в том числе и как составной части update. Каждый update для индекса - это всего лишь вставка новой строки. А удаление старых строк происходит только во время VACUUM.

...

Рейтинг:

0 / 0

| Ответить | Цитировать | Написать

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/search_topic.php?author=Carol&author_mode=last_posts&do_search=1]:	0ms
get settings:	7ms
get forum list:	13ms
get settings:	8ms
get forum list:	9ms
check forum access:	2ms
check topic access:	2ms
track hit:	46ms
get topic data:	6ms
get forum data:	2ms
get page messages:	26ms
get tp. blocked users:	1ms
others:	682ms

total:	804ms