Count unique blob / Oracle

ReSQL.ru

Мобильная версия Контакт Правила FAQ Помощь

Гость

Войти | Регистрация | Профиль | Очистить

Новые сообщения | Избранное

Форумы | Пользователи | Статистика | Мод. лог | Поиск

Цитировать

Написать

Автор*:

Ввести пароль для входа

Тема*:

Сообщение

Данное сообщение тематическое

Сообщение содержит картинки или видео 18+

Автор:

ВНИМАНИЕ! На данном подфоруме действуют строгие правила. Удостоверьтесь, что ваше сообщение соответствует им!

Форум или тема закрыты для гостей. Необходима авторизация!

Загрузить последнюю сохраненную версию

Вложение:

Вставить как галерею

Максимальный размер вложений: 4,0 МБ, аудио/видео: 8,0 МБ. Картинки большего размера ужимаются, если возможно.

Введите код, изображенный на картинке. Если код нечитаемый, кликните картинку, чтобы загрузить другой вариант.

Отправляя сообщение, я выражаю свое согласие с правилами форума и принимаю пользовательское соглашение.

Доб. в избранное | Игнор. тему | Прикреп. тему | Пометить прочит. / непрочит. | Фильтр

Форумы / Oracle [игнор отключен] [закрыт для гостей] / Count unique blob

9 сообщений из 9, страница 1 из 1

Count unique blob

#39733879

iof63

Гость

Приветствую!
Имеется Oracle DB 11.2.0.3. Таблица с BLOB картинками, порядка ~млн. записей. Нужно подсчитать кол-во уникальных?
Пока пришла только мысль - вычислять хэш MD5, у которых dbms_lob.getlength(blob)>0, и по нему считать кол-во уникальных.
Но возможно есть другой, более "оптимальный" способ?

...

Рейтинг:

0 / 0

16.11.2018, 09:22:58

| Ответить | Цитировать | Написать

Count unique blob

#39733887

miksoft

Участник

Сообщения: 36 746

Рейтинг: 0 / 0

Первичное сравнение можно проводить по длине, а следующим шагом сравнивать содержимое для тех, у кого одинаковая длина.

...

Рейтинг:

0 / 0

16.11.2018, 09:48:16

| Ответить | Цитировать | Написать

Count unique blob

#39733963

MaximaXXL

Участник

Откуда: Киев

Сообщения: 653

Рейтинг: 0 / 0

iof63,

Не так часто приходилось работать с LOB, но у них есть DBMS_LOB.COMPARE - она чем то не устраивает?

...

Рейтинг:

0 / 0

16.11.2018, 11:24:27

| Ответить | Цитировать | Написать

Count unique blob

#39733977

Lary Denis

Участник

Сообщения: 108

Рейтинг: 0 / 0

MaximaXXL, что с чем компарить? или нужно декартово произведение?

...

Рейтинг:

0 / 0

16.11.2018, 11:45:15

| Ответить | Цитировать | Написать

Count unique blob

#39733984

MaximaXXL

Участник

Откуда: Киев

Сообщения: 653

Рейтинг: 0 / 0

Lary Denis,

Есть dbms_crypto.hash которое работает с лобами, а потом (если надо) сделать DBMS_LOB.COMPARE

...

Рейтинг:

0 / 0

16.11.2018, 11:57:49

| Ответить | Цитировать | Написать

Count unique blob

#39733985

-2-

Участник

Сообщения: 15 349

Рейтинг: 0 / 0

iof63,

order member function

...

Рейтинг:

0 / 0

16.11.2018, 11:58:46

| Ответить | Цитировать | Написать

Count unique blob

#39733993

iof63

Гость

miksoft,
По MD5 выяснилось (ушло ~23мин.), что уникальных ~20% записей, т.е. основная часть данных - дубли. Сомневаюсь, что вытащив повторяющиеся по длине записи, и затем сделать по ним хэш, суммировать с не повторяющимися по длине, будет эффективнее, в плане скорости. Будет время, - проверю обязательно. Спасибо.

MaximaXXL , Вы не уяснили суть задачи.

...

Рейтинг:

0 / 0

16.11.2018, 12:05:09

| Ответить | Цитировать | Написать

Count unique blob

#39734012

andreymx

Участник

Откуда: Запорожье

Сообщения: 56 486

Рейтинг: 0 / 0

iof63miksoft,
По MD5 выяснилось (ушло ~23мин.), что уникальных ~20% записей, т.е. основная часть данных - дубли. Сомневаюсь, что вытащив повторяющиеся по длине записи, и затем сделать по ним хэш, суммировать с не повторяющимися по длине, будет эффективнее, в плане скорости. Будет время, - проверю обязательно. Спасибо.

MaximaXXL , Вы не уяснили суть задачи.совпадение МД5 в общем случае не означает совпадения контента

...

Рейтинг:

0 / 0

16.11.2018, 12:26:30

| Ответить | Цитировать | Написать

Count unique blob

#39734063

iof63

Гость

-2-order member functionБеглым взглядом пока не сообразил, как это использовать в данном случае. Почитаю.
andreymxсовпадение МД5 в общем случае не означает совпадения контентаПонимаю, - вероятность коллизий есть, минимальна - но есть, сократить можно, например SH1 вместо MD5 использовать. Ни в чем нельзя быть уверенным.

...

Рейтинг:

0 / 0

16.11.2018, 12:58:09

| Ответить | Цитировать | Написать

9 сообщений из 9, страница 1 из 1

Форумы / Oracle [игнор отключен] [закрыт для гостей] / Count unique blob

Читали тему (0):

Читали форум (0):

Пользователи онлайн (0):

start [/forum/topic.php?fid=52&fpage=94&tid=1883169]:	0ms
get settings:	6ms
get forum list:	17ms
check forum access:	3ms
check topic access:	3ms
track hit:	207ms
get topic data:	8ms
get forum data:	2ms
get page messages:	31ms
get tp. blocked users:	1ms
others:	223ms

total:	501ms

	Необходимые cookie
	Cookie для сбора статистики
	Cookie для маркетинга и рекламы