Выборка данных без дубликатов из таблицы в 200000 записей / Firebird, InterBase

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Firebird, InterBase [игнор отключен] [закрыт для гостей] / Выборка данных без дубликатов из таблицы в 200000 записей

47 сообщений из 47, показаны все 2 страниц

все

Выборка данных без дубликатов из таблицы в 200000 записей

#32240073

Nikita Krivtsov

Гость

Господа! Хелп!!

Третий день парюсь над SQL-запросом, ничего не получается, скорее всего туплю, и решение должно быть очевидным...

Задача:
выбрать из таблицы: ID товара (GOOD_ID) и его цену(PRICE_I), причем цена должна быть выбрана для самой последней дате изменения товара (EDIT_TIME).

В таблице 200000 записей! Т.е. сложные запросы с подзапросами вешают сервак намертво :)

Сама таблица: GOOD_ID, PRICE_I, EDIT_TIME, ....

Для примера данные:

Код: plaintext

1.
2.
3.
4.
5.
6.
7.

GOOD_ID     PRICE_I      EDIT_TIME
 4103          12 , 56          17 . 04 . 2001 
 4103          12 , 11          19 . 11 . 2003          <- нужно
 4103          9 , 78            22 . 05 . 2002 
 4103          9 , 32            13 . 09 . 2002 
 4104          2 , 26            26 . 02 . 2001 
 4104          2 , 11            26 . 03 . 2002 
 4104          3 , 51            26 . 08 . 2003     <- нужно

Вариант с процедурами не подходит, нужен именно SQL-запрос.

Подозреваю, что нужно юзать псевдонимы и RDB$DB_KEY???

...

Рейтинг:

0 / 0

19.08.2003, 12:28:59

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240124

Dnico

Участник

Откуда: Москва

Сообщения: 3 184

Рейтинг: 0 / 0

А кто мешает выполнить

Код: plaintext

SELECT * FROM PROCEDURE(...);

...

Рейтинг:

0 / 0

19.08.2003, 12:47:01

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240129

Johnmen

Участник

Откуда: Москва

Сообщения: 4 025

Рейтинг: 0 / 0

SELECT T1.GOOD_ID, T1.PRICE_I FROM Table T1
WHERE T1.EDIT_TIME=
(SELECT MAX(T2.EDIT_TIME) FROM Table T2
WHERE T2.GOOD_ID=T1.GOOD_ID)
...

...

Рейтинг:

0 / 0

19.08.2003, 12:49:45

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240146

Moses

Гость

А индекс на EDIT_TIME есть?

...

Рейтинг:

0 / 0

19.08.2003, 13:00:25

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240154

Dnico

Участник

Откуда: Москва

Сообщения: 3 184

Рейтинг: 0 / 0

Ну так-то оно так, но сколько будет выполнять ся этот запрос?
Можно прикинуть 200000 * 200000 ? Или я ошибаюсь ?

...

Рейтинг:

0 / 0

19.08.2003, 13:05:11

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240168

Johnmen

Участник

Откуда: Москва

Сообщения: 4 025

Рейтинг: 0 / 0

>Dnico

200000*200000 - это количество минут или секунд ?
:)

...

Рейтинг:

0 / 0

19.08.2003, 13:11:23

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240192

Moses

Гость

>200000*200000 - это количество минут или секунд ?
Это видимо двести тысяч РАЗ по двести тыщ запросов.
Секунды зависят от железки;-)
И, осмелюсь предположить, _от индексов_.

...

Рейтинг:

0 / 0

19.08.2003, 13:20:47

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240194

Fighter

Гость

> 200000*200000 - это количество минут или секунд ?
Количество проходов причём натурал!

...

Рейтинг:

0 / 0

19.08.2003, 13:21:15

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240198

Johnmen

Участник

Откуда: Москва

Сообщения: 4 025

Рейтинг: 0 / 0

>Moses

Если запросов, то я вижу 1*200000
И, конечно, индексирование влияет... (на скорость)...
:)

...

Рейтинг:

0 / 0

19.08.2003, 13:23:21

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240222

Dnico

Участник

Откуда: Москва

Сообщения: 3 184

Рейтинг: 0 / 0

Johnmen
А самому проверить ? Я вот ради интереса проверил ... у меня зашкалило за 24 мульена ... а зписей 17000.

Ну так как?

...

Рейтинг:

0 / 0

19.08.2003, 13:32:11

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240240

Johnmen

Участник

Откуда: Москва

Сообщения: 4 025

Рейтинг: 0 / 0

>Dnico

Что проверить ?
Количество выполненных запросов ? Количество времени ? Другое ?

...

Рейтинг:

0 / 0

19.08.2003, 13:38:10

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240247

Dnico

Участник

Откуда: Москва

Сообщения: 3 184

Рейтинг: 0 / 0

Johnmen

Кол-во запросов!
А время зависит от индексов. Это как раз самое простое - добавил индекс и гуляй себе ...

...

Рейтинг:

0 / 0

19.08.2003, 13:40:26

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240271

Johnmen

Участник

Откуда: Москва

Сообщения: 4 025

Рейтинг: 0 / 0

>Dnico

Количество запросов = 1*200000.
А что такое у тебя "24 мульена " ? И где это видно ?

...

Рейтинг:

0 / 0

19.08.2003, 13:48:06

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240279

Nikita Krivtsov

Гость

Зделал, как посоветовал Johnmen:

SELECT T1.GOOD_ID, T1.PRICE_I FROM PRICES T1
WHERE T1.EDIT_TIME=
(SELECT MAX(T2.EDIT_TIME) FROM PRICES T2
WHERE T2.GOOD_ID=T1.GOOD_ID)

И пошёл курить:

------ Performance info ------
Prepare time = 0ms
Execute time = 6m 27s 953ms
Avg fetch time = 15 518,12 ms
Current memory = 11 717 858
Max memory = 12 439 626
Memory buffers = 2 048
Reads from disk to cache = 9 410
Writes from cache to disk = 6
Fetches from cache = 6 716 061

P.S. Индекса на EDIT_TIME нет.

...

Рейтинг:

0 / 0

19.08.2003, 13:51:10

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240283

Dnico

Участник

Откуда: Москва

Сообщения: 3 184

Рейтинг: 0 / 0

Johnmen

Откуда взяться 1*200000 ?

Для каждой записи из T1 используется проход по всем записям в T2.

Умножаем ... получаем !!!

...

Рейтинг:

0 / 0

19.08.2003, 13:52:03

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240307

Johnmen

Участник

Откуда: Москва

Сообщения: 4 025

Рейтинг: 0 / 0

>Nikita Krivtsov

Если идет борьба за производительность, то делай, как уже советовал Dnico, ХП. Тогда достаточно будет одного запроса с соотвествующим ORDER BY и прописанной логикой "отброса" ненужных записей в ХП.

>Dnico
>Откуда взяться 1*200000 ?

Основной запрос - 1, для каждой записи основного (200000)- вложенный запрос. Итого 1*200000 запросов.

>Для каждой записи из T1 используется проход по всем записям в T2.

Ну да, кто спорит ?

>Умножаем ... получаем !!!

Так что же получаем ? Чего и в каких единицах ?

...

Рейтинг:

0 / 0

19.08.2003, 14:02:19

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240318

Dnico

Участник

Откуда: Москва

Сообщения: 3 184

Рейтинг: 0 / 0

Лучше всего всеже использовать процедуру:

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.

CREATE PROCEDURE  "proc"  
RETURNS (
    ID VARCHAR( 10 ),
    DT DATE,
    PRICE FLOAT)
AS
BEGIN
  FOR SELECT ID, MAX(DT) FROM TABLE GROUP BY ID INTO :ID, :DT DO BEGIN
    SELECT DISTINCT PRICE FROM TABLE WHERE ID = :ID AND DT = :DT INTO :PRICE;
    SUSPEND;
  END
END

...

Рейтинг:

0 / 0

19.08.2003, 14:08:44

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240319

Nikita Krivtsov

Гость

Вчера делал такой запрос:

Код: plaintext

1.
2.
3.
4.
5.

SELECT
a.GOOD_ID, a.price_i
FROM PRICES a
where exists (
SELECT GOOD_ID, max(EDIT_TIME)
FROM PRICES where pricelist_id= 2  and a.RDB$DB_KEY=prices.RDB$DB_KEY group by GOOD_ID

(where pricelist_id=2 ) -идентификатор прайс-листа, впринципе не столь важен для нашего запроса

Он не совсем правильный, но может быть от него отталкиваться???
По крайней мере выполнялся несколько секунд.

P.S. Да забыл указать, что после выборки из таблицы где 200000 записей, в результате должно получиться 10000 записей.

И еще такая проблема: изменять базу я не могу, т.е. не могу индексы добавить, не могу процедуры и т.д.

...

Рейтинг:

0 / 0

19.08.2003, 14:08:55

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240495

Johnmen

Участник

Откуда: Москва

Сообщения: 4 025

Рейтинг: 0 / 0

>Dnico

Это те же 200000 запросов...

>Nikita Krivtsov

Максимально быстро, в один запрос (ХП) :

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.

CREATE PROCEDURE MyProc 
RETURNS (I INTEGER, P NUMERIC( 15 ,  2 ), D TIMESTAMP)
AS
DECLARE VARIABLE ICURR INTEGER;
BEGIN
  ICURR= 0 ;
  FOR SELECT GOOD_ID, pr, dt FROM PRICES
      ORDER BY GOOD_ID, PRICE_I DESC INTO :I, :P, :D DO BEGIN
      IF (I<>ICURR) THEN SUSPEND;
      ICURR=I;
      END
  END

Обращение к ХП - как обычно, SELECT * FROM MyProc

...

Рейтинг:

0 / 0

19.08.2003, 15:14:25

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240615

Vagoo

Участник

Сообщения: 39

Рейтинг: 0 / 0

Может быть так:

select GOOD_ID, EDIT_TIME, max(PRICE_I)
from TABLE
order by GOOD_ID
having EDIT_TIME = (select max(EDIT_TIME) from TABLE)

...

Рейтинг:

0 / 0

19.08.2003, 16:31:25

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240661

Johnmen

Участник

Откуда: Москва

Сообщения: 4 025

Рейтинг: 0 / 0

>Vagoo

Не может быть так...:)

...

Рейтинг:

0 / 0

19.08.2003, 16:59:49

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240750

Maks_f

Участник

Откуда: Одесса

Сообщения: 213

Рейтинг: 0 / 0

Осмелюсь предположить что записи в таблице просто не разграничены периодами предположим по месячно, предлагаю завести поле которое будет обозначать период и ес-но индекс по этому полю, а далее я думаю ни какой вложеный запрос не положит сервак, так как будет выбираться не все ко-во записей а только по текущему периоду, однако надо бы устаканить случай когда запись по данному критерю последний раз появлялась в предыдущих периодах , однако это очень просто реализовать в процедуре. У нас так все прекрасно работает проблем нет.

...

Рейтинг:

0 / 0

19.08.2003, 17:50:14

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240980

Fighter

Гость

2 Johnmen
> Основной запрос - 1, для каждой записи основного (200000)- вложенный
> запрос. Итого 1*200000 запросов.

Для основного прохода считывается 200000 записей и для каждой записи опять же считывается 200000 записей! Отсюда и 200000*200000!

...

Рейтинг:

0 / 0

20.08.2003, 04:15:22

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32240986

StarWind

Участник

Откуда: г. Иркутск

Сообщения: 1 850

Рейтинг: 0 / 0

Народ, начнем с того что давайте заведем индексы по дате...
это первое...
далее декартово произведение кол-ва записей это при джойнах...
в данном случае будет просто сумма.
подобный запрос который предлагали у меня работает менее секунды, при индексах разумеется. А Having вообще враги придумали, по крайней мереэто более чем не подходит для данного случая, потому как последний вообще не ходит по индексам и отрабатывает он после получение результатов от секции Where после группировки и подсчета агрегатных функций. ТОбишь когда про индексы и вспоминать как-то поздно...

...

Рейтинг:

0 / 0

20.08.2003, 04:58:51

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32241142

Johnmen

Участник

Откуда: Москва

Сообщения: 4 025

Рейтинг: 0 / 0

>Fighter

Чего 200000*200000 ??? Убитых енотов ? Буказоидов ? Другое ?
Вообще непонятно, о чем спор...

...

Рейтинг:

0 / 0

20.08.2003, 09:31:13

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32241212

Dnico

Участник

Откуда: Москва

Сообщения: 3 184

Рейтинг: 0 / 0

Johnmen
Извиняй за грубость, но для непонятливых :

Не Убитых енотов, не Буказоидов и уж точно не Другое, а просто IB(FB) читает записи
и количество этих чтений 200000*200000 = 40 000 000 000 (записей).
Такой запрос будет неделю выполняться ...

P.S. И эту проблему не решить иначе, чем использовать ХП, а поскольку у
Nikita Krivtsov нет возможности вносить изменения (хотя почему такие жесткие условия), то решения просто нет ...

...

Рейтинг:

0 / 0

20.08.2003, 10:06:09

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32241227

Dnico

Участник

Откуда: Москва

Сообщения: 3 184

Рейтинг: 0 / 0

StarWind

подобный запрос который предлагали у меня работает менее секунды, при индексах разумеется.

Не забывай про кол-во записей в таблице, у меня тоже "быстро" (30 сек) , но их там 17000. А тут и индексов нет ...

...

Рейтинг:

0 / 0

20.08.2003, 10:13:26

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32241249

StarWind

Участник

Откуда: г. Иркутск

Сообщения: 1 850

Рейтинг: 0 / 0

Dnico

Сорри, я забыл указать кол-во записей в таблицах... порядка 300000 пропишу прописью, триста тысяч!
и не надо заливать что ХП единственная возможность

...

Рейтинг:

0 / 0

20.08.2003, 10:20:26

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32241304

Dnico

Участник

Откуда: Москва

Сообщения: 3 184

Рейтинг: 0 / 0

StarWind
НЕ ВЕРЮ - ПИШИ ЗАПРОС ПРОВЕРЮ НА СВОИХ 300000 записях ... Индекс по дате есть ... и по ID тоже ...

...

Рейтинг:

0 / 0

20.08.2003, 10:38:10

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32241325

Johnmen

Участник

Откуда: Москва

Сообщения: 4 025

Рейтинг: 0 / 0

>Dnico
>Извиняй за грубость, но для непонятливых :

Да все нормально. И я к ним не отношусь.
А по поводу чтений - неужели ты думаешь, что за 1 (одну) операцию чтения читается одна запись ??? :)
Поверь, это совсем не так. Единицой чтения является страница. На которой м.б. несколько записей. Поэтому указанное тобой произведение 200000*200000 ни о чем не говорит.
И уж тем более неделя здесь совсем неуместна...:)

...

Рейтинг:

0 / 0

20.08.2003, 10:44:59

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32241356

Dnico

Участник

Откуда: Москва

Сообщения: 3 184

Рейтинг: 0 / 0

Johnmen
Если вдаваться в подробности, то я согласен, там все не так просто, но все равно существует элементарные операции выборки записей. Так вот я говорю об этом количестве выборок ... И существует еще и реальный пример, который показывает статистику выполнения запроса. Могу показать ...

...

Рейтинг:

0 / 0

20.08.2003, 10:52:37

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32241364

StarWind

Участник

Откуда: г. Иркутск

Сообщения: 1 850

Рейтинг: 0 / 0

select * from table1 where dtime = (select max(dtime) from table1)

...

Рейтинг:

0 / 0

20.08.2003, 10:57:21

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32241382

Dnico

Участник

Откуда: Москва

Сообщения: 3 184

Рейтинг: 0 / 0

StarWind

Ну и что дает этот запрос ? Ничего того, что нужно ... Тем более одну запись ...

...

Рейтинг:

0 / 0

20.08.2003, 11:03:02

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32241389

Johnmen

Участник

Откуда: Москва

Сообщения: 4 025

Рейтинг: 0 / 0

>StarWind

Ни-ни...:)

>Dnico

Да нет, не надо...

Уже отклонились от темы. А по ней видится 2 решения, каждое из которых надо попробовать :
1. Индекс+Запрос
2. ХП с соотв-ей логикой
И п.2, скорее всего, в данном случае, самое быстрое решение.

...

Рейтинг:

0 / 0

20.08.2003, 11:04:31

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32241397

StarWind

Участник

Откуда: г. Иркутск

Сообщения: 1 850

Рейтинг: 0 / 0

сорри, протупил с запросом....
но честно гвооря надо проэксперементировать

...

Рейтинг:

0 / 0

20.08.2003, 11:06:48

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32241409

Dnico

Участник

Откуда: Москва

Сообщения: 3 184

Рейтинг: 0 / 0

Johnmen
Вот я и говорю, что через запрос это просто почти невозможно ... очень долго.

...

Рейтинг:

0 / 0

20.08.2003, 11:10:54

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32241626

Vagoo

Участник

Сообщения: 39

Рейтинг: 0 / 0

**************************************************************
select good_id, price, last_edt
from table_2000 t1
where last_edt=(select max(last_edt) from table_2000 t2 where t2.good_id = t1.good_id)

------ Performance info ------
Prepare time = 3ms
Execute time = 16s 516ms
Avg fetch time = 4 129,00 ms
Current memory = 18 118 656
Max memory = 18 398 384
Memory buffers = 2 048
Reads from disk to cache = 0
Writes from cache to disk = 6
Fetches from cache = 8 033 956

**************************************************************

select t1.good_id, price, max(t1.last_edt)
from table_2000 t1
group by good_id, price
having last_edt=(select max(t2.last_edt) from table_2000 t2 where t2.good_id = t1.good_id)

------ Performance info ------
Prepare time = 4ms
Execute time = 16s 188ms
Avg fetch time = 952,24 ms
Current memory = 18 124 800
Max memory = 18 398 384
Memory buffers = 2 048
Reads from disk to cache = 0
Writes from cache to disk = 0
Fetches from cache = 7 840 702

**************************************************************
select good_id, max(last_edt), (select max(price) from table_2000 t2 where t2.table_id = t1.table_id) as price
from table_2000 t1
group by good_id

------ Performance info ------
Prepare time = 6ms
Execute time = 127ms
Avg fetch time = 7,47 ms
Current memory = 18 263 128
Max memory = 18 518 296
Memory buffers = 2 048
Reads from disk to cache = 0
Writes from cache to disk = 6
Fetches from cache = 14 057

...

Рейтинг:

0 / 0

20.08.2003, 12:28:12

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32242050

Johnmen

Участник

Откуда: Москва

Сообщения: 4 025

Рейтинг: 0 / 0

>Vagoo

В последнем примере ошибка :) И даже не одна...

...

Рейтинг:

0 / 0

20.08.2003, 15:48:22

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32242093

Vagoo

Участник

Сообщения: 39

Рейтинг: 0 / 0

> Johnmen

Может быть.
Зато оно работает и дает правильный результат :)

...

Рейтинг:

0 / 0

20.08.2003, 16:06:56

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32242124

Dnico

Участник

Откуда: Москва

Сообщения: 3 184

Рейтинг: 0 / 0

Vagoo

Execute time = 127ms Отличный результат, только вот один вопрос: По каким полям у тебя индексы и какой план получается?

P.S. И ище у тебя комп случаем не 64-х процессорный ? А то я уже минут пять жду результатов по этому запросу?

...

Рейтинг:

0 / 0

20.08.2003, 16:24:22

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32242125

Johnmen

Участник

Откуда: Москва

Сообщения: 4 025

Рейтинг: 0 / 0

>Vagoo

И результат дает неверный :) Неверный принципиально !
Верный результат - это тебе так кажется, поскольку он основан на твоих данных, которые обладают специфической однобокостью. (Напр. макс. дате соответствует макс.цена, что не явл-ся обязятельным)

...

Рейтинг:

0 / 0

20.08.2003, 16:24:24

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32242169

Dnico

Участник

Откуда: Москва

Сообщения: 3 184

Рейтинг: 0 / 0

Вот мои результаты :

Код: plaintext

1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.

select id, max(dt), (select max(price) from delivery t2 where t2.id = t1.id) as price
from delivery t1
group by id

Адаптированный план
PLAN (T2 INDEX (DELIVERY_IDX1)) PLAN (T1 ORDER DELIVERY_IDX1)

 /* DELIVERY_IDX1 - индекс по ID */ 


 ------ Performance info ------
 
Prepare time = 0ms
Execute time = 16m 16s 634ms
Avg fetch time =  39   065 , 36  ms
Current memory =  9   726   892 
Max memory =  9   861   124 
Memory buffers =  2   048 
Reads from disk to cache =  112   868 
Writes from cache to disk =  6 
Fetches from cache =  627   087   723

...

Рейтинг:

0 / 0

20.08.2003, 16:47:52

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32242215

Vagoo

Участник

Сообщения: 39

Рейтинг: 0 / 0

> Dnico

select id, max(dt), (select max(price) from delivery t2 where t2.id = t1.id) as price
from delivery t1 group by id

В твоем запросе существует один ID , который по всей видимости товар.
А у меня GOOD_ID - товар, TABLE_ID - идентификатор записи, он же праймери кей, естественно он же и индекс.

Поэтому и время отличается, наверное.

> Johnmen

Что касается однобокости - то действительно я таблицу сгенерил. Но после этого внес руками изменения в несколько рекордов, для контроля.

...

Рейтинг:

0 / 0

20.08.2003, 17:11:44

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32242282

Johnmen

Участник

Откуда: Москва

Сообщения: 4 025

Рейтинг: 0 / 0

>Dnico

Вот это абсолютно похоже на правду ! Единственное не max(price), а max(date).

>Vagoo

Еще раз попытаюсь объяснить, что твой запрос ПРИНЦИПИАЛЬНО НЕВЕРЕН !
Потому, что соединять надо не по ключу, а по идентификатору товара !

...

Рейтинг:

0 / 0

20.08.2003, 17:53:06

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32242357

Vagoo

Участник

Сообщения: 39

Рейтинг: 0 / 0

> Johnmen

Я не отрицаю, что запрос принципиально не верен. Я его сделал случайно и очень удивился когда оно заработало.

Более того, специально слепил таблицу на 200000 строк и убедился что цена получается неправильная, хоть и работает бысто :(

Но почему тогда запрос из таблицы в 2000 строк дает верный результат ?

...

Рейтинг:

0 / 0

20.08.2003, 18:51:19

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32242709

Dnico

Участник

Откуда: Москва

Сообщения: 3 184

Рейтинг: 0 / 0

И все равно получается ерунда ... не дает все это нужного результата ... УВЫ!

...

Рейтинг:

0 / 0

21.08.2003, 10:17:19

| Ответить | Цитировать | Написать

Выборка данных без дубликатов из таблицы в 200000 записей

#32243137

Vagoo

Участник

Сообщения: 39

Рейтинг: 0 / 0

Да, не дает...

Прошу прощения за мороку.

...

Рейтинг:

0 / 0

21.08.2003, 12:59:35

| Ответить | Цитировать | Написать

47 сообщений из 47, показаны все 2 страниц

все

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?all=1&fid=40&tid=1580085]:	0ms
get settings:	5ms
get forum list:	12ms
check forum access:	3ms
check topic access:	3ms
track hit:	49ms
get topic data:	8ms
get forum data:	2ms
get page messages:	54ms
get tp. blocked users:	1ms
others:	209ms

total:	346ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы