powered by simpleCommunicator - 2.0.18     © 2024 Programmizd 02
Map
Форумы / Другие СУБД [игнор отключен] [закрыт для гостей] / Дублирование записей LEFT JOIN
2 сообщений из 2, страница 1 из 1
Дублирование записей LEFT JOIN
    #40022769
bob_roman
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Гость
СУБД Impala
Добрый день.
Есть две таблицы:
Первая: activity_report - активности пользователей:
PK - id пользователя
event_time - время события на ПК
... - в этой табличке 5 млн. записей

и вторая: v_calls - телефонные звонки пользователя
pk - id пользователя
begintime, endtime - время начала и окончания телефонного звонка.
... в этой табличке 100 тыс. записей.

Надо выбрать все записи из первой таблицы, исключая те, в которых время события на ПК пересекалось по времени с телефонным звонком этого же пользователя.
Запрос:
SELECT * FROM activity_record AS ar
LEFT JOIN v_calls AS vc ON ar.pk=vc.pk AND ar.event_time NOT BETWEEN vc.begintime and vc.endtime
возвращает 62 млн записей, т.е. работает некорректно, получается он формирует декартово произведение таблиц по полю pk, запписи из первой таблицы входят в выборку несколько раз.

Уникальных ключей в таблицах нет.

Как исправить запрос?

Спасибо!
...
Рейтинг: 0 / 0
Дублирование записей LEFT JOIN
    #40022790
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Убрать outer join, фильтровать по not exists.
...
Рейтинг: 0 / 0
2 сообщений из 2, страница 1 из 1
Форумы / Другие СУБД [игнор отключен] [закрыт для гостей] / Дублирование записей LEFT JOIN
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали тему (1): Анонимы (1)
Читали форум (1): Анонимы (1)
Пользователи онлайн (8): Анонимы (5), Google Bot, Bing Bot, Yandex Bot
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]