SELECT из больших таблиц / PostgreSQL

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / SELECT из больших таблиц

11 сообщений из 11, страница 1 из 1

SELECT из больших таблиц

#39631092

Tupoy1cnik

Гость

Подскажите, пож., каким методом лучше воспользоваться для быстрых SELECTов из больших таблиц без гигантского потребления памяти? Как, например, в том же оракле можно использовать bulk selectы и piplined функции.

...

Рейтинг:

0 / 0

16.04.2018, 19:25

| Ответить | Цитировать | Написать

SELECT из больших таблиц

#39631111

Leonid Kudryavtsev

Участник

Сообщения: 9 300

Рейтинг: 0 / 0

Вопрос задан сильно не конкретно

SELECT он и в африке SELECT.

В Oracle и bulk collect into и pipelined функции совершенно другое и с SELECT'ом связанны крайне опосредованно. При чем размер таблиц и потребление памяти, тоже не ясно.

...

Рейтинг:

0 / 0

16.04.2018, 19:48

| Ответить | Цитировать | Написать

SELECT из больших таблиц

#39631140

kira ivanov

Участник

Откуда: питер

Сообщения: 162

Рейтинг: 0 / 0

Tupoy1cnik,

посмотрите, подумайте, может поможет

YouTube Video

...

Рейтинг:

0 / 0

16.04.2018, 20:38

| Ответить | Цитировать | Написать

SELECT из больших таблиц

#39631149

Maxim Boguk

Участник

Откуда: Melbourne, Австралия

Сообщения: 5 148

Рейтинг: 0 / 0

Tupoy1cnikПодскажите, пож., каким методом лучше воспользоваться для быстрых SELECTов из больших таблиц без гигантского потребления памяти? Как, например, в том же оракле можно использовать bulk selectы и piplined функции.

Гигантского потребления памяти где?? В приложении? В базе?
Какие именно select?

PS: может вам просто курсоры надо использовать?

...

Рейтинг:

0 / 0

16.04.2018, 20:58

| Ответить | Цитировать | Написать

SELECT из больших таблиц

#39631152

Tupoy1cnik

Гость

Если несколько сузить задачу - то нужно перекачивать таблицу большого размера с одного сервера на другой. В силу некоторых причин отдельностоящее etl-средство не подойдет. При этом суперселект пока кажется вариантом не очень.

...

Рейтинг:

0 / 0

16.04.2018, 21:14

| Ответить | Цитировать | Написать

SELECT из больших таблиц

#39631153

Tupoy1cnik

Гость

Вторая задача - перелить в рамках того же сервера таблицу в другую схему с денормализацией. Т.е. классическая задача для dwh

...

Рейтинг:

0 / 0

16.04.2018, 21:18

| Ответить | Цитировать | Написать

SELECT из больших таблиц

#39631174

Tupoy1cnik

Гость

kira ivanov, я правильно понимаю, что CTE для вычисления значений ID для offsetов и есть киллерфича, которую предлагают авторы ролика?
Выглядит дико, если учесть, что все равно миллионы элементов перебрать в индекс онли скан... Но хоть какое-то решение
И так можно приблизительно разбить по ID таблицу и использовать вместо offset. Но видео полезное. Спасибо.

...

Рейтинг:

0 / 0

16.04.2018, 22:07

| Ответить | Цитировать | Написать

SELECT из больших таблиц

#39631283

Maxim Boguk

Участник

Откуда: Melbourne, Австралия

Сообщения: 5 148

Рейтинг: 0 / 0

Tupoy1cnikЕсли несколько сузить задачу - то нужно перекачивать таблицу большого размера с одного сервера на другой. В силу некоторых причин отдельностоящее etl-средство не подойдет. При этом суперселект пока кажется вариантом не очень.

Есть два варианта экономных по памяти:
1)простой и быстрый
psql -h server1 -d db1 -c 'copy (select * from table1) to stdout' | psql -h server2 -d db2 -c 'copy table2 from stdin'
с точностью до опечаток
table2 уже должен быть создан на новой базе
(можно через промежуточный файл но смысла в этом кроме как для отладки - мало).

2)сложный - использовать курсоры в приложении и fetch next N rows (N 1000-10000) чтобы вычитывать таблицу не всю скопом а по частям.

--
Maxim Boguk
dataegret.ru

...

Рейтинг:

0 / 0

17.04.2018, 08:23

| Ответить | Цитировать | Написать

SELECT из больших таблиц

#39631284

Maxim Boguk

Участник

Откуда: Melbourne, Австралия

Сообщения: 5 148

Рейтинг: 0 / 0

Tupoy1cnikВторая задача - перелить в рамках того же сервера таблицу в другую схему с денормализацией. Т.е. классическая задача для dwh

Ну тут вообще приложение не причем
insert into table2 select (что там вам надо с любыми joins и тд)
т.е. сделать все внутри базы...
и никакого лишнего расхода по памяти не будет

--
Maxim Boguk
dataegret.ru

...

Рейтинг:

0 / 0

17.04.2018, 08:24

| Ответить | Цитировать | Написать

SELECT из больших таблиц

#39631285

Maxim Boguk

Участник

Откуда: Melbourne, Австралия

Сообщения: 5 148

Рейтинг: 0 / 0

Tupoy1cnikkira ivanov, я правильно понимаю, что CTE для вычисления значений ID для offsetов и есть киллерфича, которую предлагают авторы ролика?
Выглядит дико, если учесть, что все равно миллионы элементов перебрать в индекс онли скан... Но хоть какое-то решение
И так можно приблизительно разбить по ID таблицу и использовать вместо offset. Но видео полезное. Спасибо.

Перебирать всю таблицу через limit/offset - технология столь же популярная сколь и неработающая на больших обьемах (она замедляется как N^2 от размера таблицы и ускорения offset через IOS ^2 зависимость не убирают).
По диапазонам ID лучше - но все равно плохо... как надо - я вам уже отписал.

--
Maxim Boguk
dataegret.ru

...

Рейтинг:

0 / 0

17.04.2018, 08:26

| Ответить | Цитировать | Написать

SELECT из больших таблиц

#39632745

MasterZiv

Участник

Откуда: Питер

Сообщения: 32 427

Рейтинг: 0 / 0

Tupoy1cnikПодскажите, пож., каким методом лучше воспользоваться для быстрых SELECTов из больших таблиц без гигантского потребления памяти? Как, например, в том же оракле можно использовать bulk selectы и piplined функции.

Во-первых, bulk selectы и piplined функции никак не помогают выполнению быстрых SELECT-ов из больших таблиц.
Во-вторых, метод прост, но тебе он не понравится -- индексы ...

...

Рейтинг:

0 / 0

18.04.2018, 18:00

| Ответить | Цитировать | Написать

11 сообщений из 11, страница 1 из 1

Форумы / PostgreSQL [игнор отключен] [закрыт для гостей] / SELECT из больших таблиц

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=53&msg=39631285&tid=1995826]:	0ms
get settings:	6ms
get forum list:	10ms
check forum access:	2ms
check topic access:	2ms
track hit:	134ms
get topic data:	6ms
get forum data:	2ms
get page messages:	38ms
get tp. blocked users:	1ms
others:	189ms

total:	390ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы