Пейджинг с limit/offset и общее количество элементов / Java

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Java [игнор отключен] [закрыт для гостей] / Пейджинг с limit/offset и общее количество элементов

25 сообщений из 28, страница 1 из 2

все

Пейджинг с limit/offset и общее количество элементов

#39211785

psyh103

Гость

Всем привет! Прошу теоретическо-стратегической помощи в довольно конкретном вопросе. Уверен опытные бекенд программисты решали эту задачу тысячи раз, я хочу знать самое оптимальное решение.
Задача :
В таблице десятки миллионов строк (одна таблица уже около 40ГБ и растет)
Нужно по определенному фильтру сделать SELECT (в результате получается несколько тысяч результатов, например 87300), и на клиент передать только 50 результатов. Но при этом сообщить ему (клиенту) также и общее количество результатов (87300).
Т.е. классический пейджинг с limit/offset

Я вижу два варианта решения
1) Вариант : делаю два запроса:
1. COUNT (SELECT..WHERE....) - получаю total
2. SELECT..WHERE....LIMIT=50 - получаю 50 результатов

2) Вариант : выбираю все при помощи hibernate (или чего-то аналогичного) в java List<Results>, беру list.size(), и выбираю 50 первых результатов

В первом случае меня смущает то, я всегда делаю два запроса подряд к базе (вместо одного)
Во втором то, что я выгружаю 87300 объектов в оперативную память в JVM (а при этом аналогичный запрос приходит он нескольких сотен пользователей одновременно и для каждого нужно все результаты тянуть в оперативку)

Правильно ли я понимаю работу памяти во втором случае?
Какой вариант "дешевле" и принято использовать, как наиболее рациональный?
Может есть третий путь?

...

Рейтинг:

0 / 0

09.04.2016, 23:20:28

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39211788

Usman

Участник

Откуда: من ألماتي

Сообщения: 5 723

Рейтинг: 0 / 0

psyh1031) Вариант : делаю два запроса:Можно одним запросом (Oracle):

Код: sql

SELECT COUNT(*) OVER () AS Total, t.* FROM my_table t

...

Рейтинг:

0 / 0

09.04.2016, 23:50:27

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39211790

Usman

Участник

Откуда: من ألماتي

Сообщения: 5 723

Рейтинг: 0 / 0

Пардон, это не совсем то, что нужно

...

Рейтинг:

0 / 0

10.04.2016, 00:03:09

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39211792

rdm

Участник

Сообщения: 727

Рейтинг: 0 / 0

psyh103, hibernate не будет 87300 загружать - Criteria/HQL/Sort/Limit

...

Рейтинг:

0 / 0

10.04.2016, 00:10:15

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39211793

rdm

Участник

Сообщения: 727

Рейтинг: 0 / 0

Разве offset/limit правильный подход? Может лучше primaty key < :lastId / limit?

...

Рейтинг:

0 / 0

10.04.2016, 00:12:52

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39211812

Usman

Участник

Откуда: من ألماتي

Сообщения: 5 723

Рейтинг: 0 / 0

Usman

Код: sql

SELECT COUNT(*) OVER () AS Total, t.* FROM my_table t

Можно использовать как подзапрос:

Код: sql

SELECT t.* FROM (SELECT COUNT(*) OVER () AS Total, t.* FROM my_table t WHERE ...) t WHERE ROWNUM <= 50

...

Рейтинг:

0 / 0

10.04.2016, 01:09:30

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39211814

psyh103

Гость

rdmpsyh103, hibernate не будет 87300 загружать - Criteria/HQL/Sort/Limit

А что он тогда в ListArray результатов имеет? ссылки только на строки в таблице что ли?

rdmРазве offset/limit правильный подход? Может лучше primaty key < :lastId / limit?

Да, действительно так выглядит правильней, спасибо за рекомендацию

...

Рейтинг:

0 / 0

10.04.2016, 01:13:56

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39211815

Usman

Участник

Откуда: من ألماتي

Сообщения: 5 723

Рейтинг: 0 / 0

psyh103В таблице десятки миллионов строкЭто что-то вроде архива (т.е. данные в таблицах не подвергается изменениям) ?psyh103Нужно по определенному фильтру сделать SELECTЕсть ли вероятность того, что можно предугадать действия пользователя (хотя бы частично) ?

...

Рейтинг:

0 / 0

10.04.2016, 01:16:06

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39211817

psyh103

Гость

UsmanЭто что-то вроде архива (т.е. данные в таблицах не подвергается изменениям)
нет не архив, данные постоянно обновляются

UsmanЕсть ли вероятность того, что можно предугадать действия пользователя (хотя бы частично) ?

Если имеется ввиду набор фильтров, то почти всегда один и тот же фильтр, а вот результаты постоянно изменяются, т.к. в той большой таблице все время меняются данные, которые влияют на выборку по фильтру

...

Рейтинг:

0 / 0

10.04.2016, 01:22:28

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39211818

psyh103

Гость

UsmanUsman

Код: sql

SELECT COUNT(*) OVER () AS Total, t.* FROM my_table t

Можно использовать как подзапрос:

Код: sql

SELECT t.* FROM (SELECT COUNT(*) OVER () AS Total, t.* FROM my_table t WHERE ...) t WHERE ROWNUM <= 50

Спасибо, выглядит, как хорошее решение.

...

Рейтинг:

0 / 0

10.04.2016, 01:23:46

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39211836

вадя

Участник

Откуда: Екатеринбург

Сообщения: 19 399

Рейтинг: 0 / 0

psyh103,
конкретный вид sql строки будет зависить от используемой базы.
при большом объеме данных count лучше вынести в отдельный запрос, он будет выполняться дольше, чем запрос с выводом 50 записей.
сначала выведутся данные, а с задержкой общее число записей.

...

Рейтинг:

0 / 0

10.04.2016, 04:17:30

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39211837

вадя

Участник

Откуда: Екатеринбург

Сообщения: 19 399

Рейтинг: 0 / 0

UsmanUsman

Код: sql

SELECT COUNT(*) OVER () AS Total, t.* FROM my_table t

Можно использовать как подзапрос:

Код: sql

SELECT t.* FROM (SELECT COUNT(*) OVER () AS Total, t.* FROM my_table t WHERE ...) t WHERE ROWNUM <= 50

надеюсь, что ТС тоже оракл, а также, что select count не будет выполняться в каждой строке.
но зачем иметь столбеу с одни числом повторяемым 88

...

Рейтинг:

0 / 0

10.04.2016, 04:25:36

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39211838

вадя

Участник

Откуда: Екатеринбург

Сообщения: 19 399

Рейтинг: 0 / 0

Usmanпропущено...
Можно использовать как подзапрос:

Код: sql

SELECT t.* FROM (SELECT COUNT(*) OVER () AS Total, t.* FROM my_table t WHERE ...) t WHERE ROWNUM <= 50

надеюсь, что у ТС тоже оракл, а также, что select count не будет выполняться в каждой строке.
но зачем иметь столбец с одни числом повторяемым 80 0000+ раз?
память надо разумно использовать

...

Рейтинг:

0 / 0

10.04.2016, 04:30:23

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39211840

вадя

Участник

Откуда: Екатеринбург

Сообщения: 19 399

Рейтинг: 0 / 0

UsmanUsman

Код: sql

SELECT COUNT(*) OVER () AS Total, t.* FROM my_table t

Можно использовать как подзапрос:

Код: sql

SELECT t.* FROM (SELECT COUNT(*) OVER () AS Total, t.* FROM my_table t WHERE ...) t WHERE ROWNUM <= 50

сначала выполнится запрос отбирающий 80 000+ строк, потом из него выберется 50 строк — это очень долго.

...

Рейтинг:

0 / 0

10.04.2016, 04:45:13

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39212013

just_vladimir

Участник

Сообщения: 864

Рейтинг: 0 / 0

Очевидно, что рабочий вариант это только первый, как именно его реализовывать - одним запросом, в котором доп.колонкой добавить общее количество или двумя отдельными запросами уже вопрос вкуса и конкретной СУБД, это все будут работающие варианты.

...

Рейтинг:

0 / 0

10.04.2016, 20:25:00

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39212090

Usman

Участник

Откуда: من ألماتي

Сообщения: 5 723

Рейтинг: 0 / 0

just_vladimirОчевидно, что рабочий вариант это только первый+512

...

Рейтинг:

0 / 0

11.04.2016, 01:42:48

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39212097

вадя

Участник

Откуда: Екатеринбург

Сообщения: 19 399

Рейтинг: 0 / 0

Usmanjust_vladimirОчевидно, что рабочий вариант это только первый+512
только порядок селектов обратный

...

Рейтинг:

0 / 0

11.04.2016, 03:59:19

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39212132

Blazkowicz

Участник

Сообщения: 25 080

Рейтинг: 0 / 0

psyh1031) Вариант : делаю два запроса:
1. COUNT (SELECT..WHERE....) - получаю total
2. SELECT..WHERE....LIMIT=50 - получаю 50 результатов

Вполне стандартный подход. Все так делают.

psyh1032) Вариант : выбираю все при помощи hibernate (или чего-то аналогичного) в java List<Results>, беру list.size(), и выбираю 50 первых результатов

В hibernate много такого чего в чем-то аналогичном может и не быть.

psyh103В первом случае меня смущает то, я всегда делаю два запроса подряд к базе (вместо одного)

Ну, если это смущает только вас и не смущает DBA, то, наверное, не страшно.

psyh103Во втором то, что я выгружаю 87300 объектов в оперативную память в JVM (а при этом аналогичный запрос приходит он нескольких сотен пользователей одновременно и для каждого нужно все результаты тянуть в оперативку)

Ну, зачем так сразу. Hibernate может много чего предложить для решения этого вопроса. Например существует такой метод
http://docs.jboss.org/hibernate/orm/5.0/javadocs/org/hibernate/Session.html#createFilter-java.lang.Object-java.lang.String-
Если, я правильно понял, то ему можно скормить ленивую коллекцию и потом загружать ее постраничено через Query
Другая сторона вопроса это кэш второго уровня. Не зачем читать все объекты из БД для каждого пользователя. Можно их сформировать из кэша. Правда, тут есть нюанс, в виде того как работает кеш. Он собирает новые объекты из слепка. Поэтому каждый пользователь расходует память. Но это вполне можно оптимизировать, если иметь, например, список id. В общем, есть над чем подумать.

psyh103[b]Правильно ли я понимаю работу памяти во втором случае?

Да, но есть варианты.

psyh103Какой вариант "дешевле" и принято использовать, как наиболее рациональный?

Два запроса к БД, скорее всего, будут рациональнее. Но если между сервером и БД воткнуть толковый кэш, то будет "еще более рационально". Поэтому я за Hibernate + Paging любым удобным для вас способом (JPQL, HQL, Criteria API, Lazy Collection)

...

Рейтинг:

0 / 0

11.04.2016, 08:24:06

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39212343

Partisan M

Участник

Сообщения: 1 391

Рейтинг: 0 / 0

BlazkowizcВполне стандартный подход. Все так делают.

Все, кто не понимает, что делает. Вполне стандартная ошибка.

Правильные подходы следующие:

- иметь в таблице поле, подходящее для счётчика записей и делать в цикле выбор диапазонов по этому счётчику. Например, в Oracle уже есть такое поле ROWID.
- в процедурном SQL соответствующей СУБД делать в цикле выборку с использованием курсора. Метод довольно универсальный, поскольку в популярных СУБД курсоры есть. Хотя синтакис зависит от СУБД.

Неправильно использование OFFSET... LIMIT и Hibernate. Способ с OFFSET...LIMIT неэффективен, потому что будут считываться все записи с начала и уже потом из них выбираться нужные. Способ с Hibernate неправильгный потому, что в нём Hibernate испольхуется не по назначению. Следовательно, вряд ли можно надеяться на особую эффективность.

...

Рейтинг:

0 / 0

11.04.2016, 11:22:44

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39212373

just_vladimir

Участник

Сообщения: 864

Рейтинг: 0 / 0

Partisan MСпособ с OFFSET...LIMIT неэффективен, потому что будут считываться все записи с начала и уже потом из них выбираться нужные.
Реквестирую пруфлинк по этому поводу

...

Рейтинг:

0 / 0

11.04.2016, 11:42:04

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39212404

Blazkowicz

Участник

Сообщения: 25 080

Рейтинг: 0 / 0

Partisan MВсе, кто не понимает, что делает. Вполне стандартная ошибка.

Ой, да.

Partisan M- иметь в таблице поле, подходящее для счётчика записей и делать в цикле выбор диапазонов по этому счётчику. Например, в Oracle уже есть такое поле ROWID.

Ага. Еще один ID, который нужно генерировать правильным образом. Я понимаю, что кроме Oracle других RDBMS не существует. Но все же, у ТС может и MySQL оказаться.

Partisan M- в процедурном SQL соответствующей СУБД делать в цикле выборку с использованием курсора. Метод довольно универсальный, поскольку в популярных СУБД курсоры есть. Хотя синтакис зависит от СУБД.

Курсор. На трехзвенке. Опять, с условием, что у нас только Oracle?

Partisan MНеправильно использование OFFSET... LIMIT и Hibernate. Способ с OFFSET...LIMIT неэффективен, потому что будут считываться все записи с начала и уже потом из них выбираться нужные. Способ с Hibernate неправильгный потому, что в нём Hibernate испольхуется не по назначению. Следовательно, вряд ли можно надеяться на особую эффективность.
Возможно. Если автор им особо и не пользуеются и изучать не хочет, то и приплетать ORM, наверное, смысла нет.

...

Рейтинг:

0 / 0

11.04.2016, 12:01:32

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39212423

Сергей Арсеньев

Участник

Сообщения: 4 121

Рейтинг: 0 / 0

Partisan M- в процедурном SQL соответствующей СУБД делать в цикле выборку с использованием курсора.
Содержит плюсы и минусы.
Главный из последних, заключен в сценарии, при котором пользователь почти никогда не переходит на последнюю страницу. А просто меняет условие посмотрев первые одну-две.

...

Рейтинг:

0 / 0

11.04.2016, 12:16:49

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39212580

lleming

Участник

Сообщения: 1 905

Рейтинг: 0 / 0

just_vladimirPartisan MСпособ с OFFSET...LIMIT неэффективен, потому что будут считываться все записи с начала и уже потом из них выбираться нужные.
Реквестирую пруфлинк по этому поводу

если Order by есть то неэффективно. а так вполне себе эффективно. (postgresl)

Limit (cost=1.15..1.73 rows=5 width=857) (actual time=0.042..0.054 rows=5 loops=1)
-> Seq Scan on individual (cost=0.00..228311.98 rows=1979148 width=857) (actual time=0.016..0.039 rows=15 loops=1)
Filter: (pol_id = 1)
Rows Removed by Filter: 9
Total runtime: 0.124 ms

тут правильнее будет сказать что если offset приближается к максимальному количеству строк

Код: plsql

 where pol_id = 1 offset 100000 limit 5

то становится неэффективным тут лучше уже

Код: sql

where id > 100000 limit 5

Но редкий пользователь дошагает до 100000-ой страницы т.к. что в общем случае OFFSET...LIMIT вполне эффективно.

...

Рейтинг:

0 / 0

11.04.2016, 14:39:39

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39212778

just_vladimir

Участник

Сообщения: 864

Рейтинг: 0 / 0

llemingjust_vladimirпропущено...

Реквестирую пруфлинк по этому поводу

если Order by есть то неэффективно. а так вполне себе эффективно. (postgresl)

Limit (cost=1.15..1.73 rows=5 width=857) (actual time=0.042..0.054 rows=5 loops=1)
-> Seq Scan on individual (cost=0.00..228311.98 rows=1979148 width=857) (actual time=0.016..0.039 rows=15 loops=1)
Filter: (pol_id = 1)
Rows Removed by Filter: 9
Total runtime: 0.124 ms

тут правильнее будет сказать что если offset приближается к максимальному количеству строк

Код: plsql

 where pol_id = 1 offset 100000 limit 5

то становится неэффективным тут лучше уже

Код: sql

where id > 100000 limit 5

Но редкий пользователь дошагает до 100000-ой страницы т.к. что в общем случае OFFSET...LIMIT вполне эффективно.
Ну Вы как бы подтверждаете обратное, что у limit/offset все хорошо, а то некоторые голословно кидаются в него фекалиями, называя ошибкой его использование.

...

Рейтинг:

0 / 0

11.04.2016, 16:08:33

| Ответить | Цитировать | Написать

Пейджинг с limit/offset и общее количество элементов

#39212851

вадя

Участник

Откуда: Екатеринбург

Сообщения: 19 399

Рейтинг: 0 / 0

Код: sql

where id > 100000 limit 5

это становится хорошо только в одном случае - если сортировак по id

...

Рейтинг:

0 / 0

11.04.2016, 17:00:30

| Ответить | Цитировать | Написать

25 сообщений из 28, страница 1 из 2

все

Форумы / Java [игнор отключен] [закрыт для гостей] / Пейджинг с limit/offset и общее количество элементов

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=59&msg=39211818&tid=2124170]:	0ms
get settings:	8ms
get forum list:	17ms
check forum access:	3ms
check topic access:	3ms
track hit:	43ms
get topic data:	11ms
get forum data:	2ms
get page messages:	66ms
get tp. blocked users:	1ms
others:	187ms

total:	341ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы