Гость
Целевая тема:
Создать новую тему:
Автор:
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / коллизии md5 / 2 сообщений из 2, страница 1 из 1
23.06.2013, 03:11
    #38307256
PsychoPM
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
коллизии md5
скрипт поиска картинок в сутки берет около 50 тысяч картинок из интернета

есть дубликаты и чтобы постоянно не расширять дисковое пространство в качестве краткосрочного решения думаю сделать md5 хеши файлов.

и сравнивать md5($file1) === md5($file2)
а что если возникнет коллизия? нужное точное соответствие картинок их описанию


может сравнивать ещё размеры и форматы файлов чтобы на 100% быть уверенным что ошибки не будет?
кто нибудь решал подобные вопросы?
...
Рейтинг: 0 / 0
23.06.2013, 11:55
    #38307310
vkle
Участник
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
коллизии md5
Для простой проверки идентичности файлов можно добавить дополнительно проверку с другим алгоритмом, sha1, например.

Метаданные тоже есть смысл учесть. Если в двух файлах картинка одна и та же по содержанию, размеру и прочим графическим характеристикам, но метаданные разные (например, удалены в одном файле), тогда как они должны считаться - разными или одинаковыми.
...
Рейтинг: 0 / 0
Форумы / PHP, Perl, Python [игнор отключен] [закрыт для гостей] / коллизии md5 / 2 сообщений из 2, страница 1 из 1
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]