powered by simpleCommunicator - 2.0.51     © 2025 Programmizd 02
Форумы / Firebird, InterBase [игнор отключен] [закрыт для гостей] / Применение HASH()
25 сообщений из 32, страница 1 из 2
Применение HASH()
    #39624858
Фотография DarkMaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Приветствую.

Напомните плиз, вызов HASH() для бинарного блоба не несет за собой каких-то подводных камней?
...
Рейтинг: 0 / 0
Применение HASH()
    #39624868
Фотография Симонов Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DarkMaster,

вроде нет, кроме того что текущая HASH использует не очень качественный алгоритм хеширования
В 4.0 можно использовать более криптографические алгоритмы
...
Рейтинг: 0 / 0
Применение HASH()
    #39624876
Фотография DarkMaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Симонов Денис,

Спасибо. Ну у меня собственно задача обеспечения уникальности хэша не стоит.
...
Рейтинг: 0 / 0
Применение HASH()
    #39625052
WildSery
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Прочитал "более криптографические", подумал про себя "более криптостойкие".
Прочитал далее о низких требованиях к уникальности хэша и понял, что ничего из вашего диалога не понял.
...
Рейтинг: 0 / 0
Применение HASH()
    #39625055
Фотография Симонов Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
...
Рейтинг: 0 / 0
Применение HASH()
    #39625067
Фотография DarkMaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
WildSery,

Да там все просто - есть файлы, которые пользователи у меня пихают в БД через web морду. У разных пользователей эти файлы могут быть идентичны. Эти файлы (в базе - блобы) потом отдаются на обработку внешнему сервису, за который мы платим денежку. Чтобы немного снизить количество обращений к сервису с уже обработанными (такими же загруженными ранее файлами) - хочу прикрутить HASH() рядом с блобом. Т.е. по размеру файла + хэшу я просто проверяю, не был ли раньше уже загружен такой же файл и нужно ли его отдавать на обработку сервису или достаточно достать уже обработанные результаты. Думаю для этого уникальности HASH() хватит. Если не хватит - прикручу что-то еще.
...
Рейтинг: 0 / 0
Применение HASH()
    #39625078
WildSery
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DarkMaster,

Для описанной задачи уникальность хеша как раз ОЧЕНЬ поможет.
Поскольку увидев, что на сервере уже лежит файл с таким же хешем, его обязательно надо скачать, и сравнить уже побайтово у себя.
Чем больше коллизий - тем больше скачивать файлов.
...
Рейтинг: 0 / 0
Применение HASH()
    #39625095
Фотография Старый плюшевый мишка
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
WildSeryDarkMaster,

Для описанной задачи уникальность хеша как раз ОЧЕНЬ поможет.
Поскольку увидев, что на сервере уже лежит файл с таким же хешем, его обязательно надо скачать, и сравнить уже побайтово у себя.
Чем больше коллизий - тем больше скачивать файлов.

Помойму это будет настолько редко, что этой лишней работой можно пренебречь. Разве что из любви к искусству.
...
Рейтинг: 0 / 0
Применение HASH()
    #39625100
Arioch
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
....а можно два хэша держать, например

какая вероятность, что одновременно совпадут размер, md4 и sha256 (да, беру устаревшие хэши, для демонстрации)?
...
Рейтинг: 0 / 0
Применение HASH()
    #39625103
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ariochкакая вероятность, что одновременно совпадут размер, md4 и sha256 (да, беру устаревшие
хэши, для демонстрации)?

Ненулевая. Но если аффтару этого достаточно...
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Применение HASH()
    #39625105
Фотография Симонов Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Arioch,

какая разница в Firebird до 4.0 нет ни того ни другого

DarkMasterДумаю для этого уникальности HASH() хватит.

коллизии всё равно будут, но раз цель не полностью убрать повторную обработку, а лишь снизить количество обращений к сервису, то пойдёт
...
Рейтинг: 0 / 0
Применение HASH()
    #39625106
Arioch
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Симонов Денискакая разница в Firebird до 4.0 нет ни того ни другого

UDF же....
...
Рейтинг: 0 / 0
Применение HASH()
    #39625109
Фотография Симонов Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Arioch,

ну раз UDF то алгоритм можно любой использовать, необязательно "устаревший"
...
Рейтинг: 0 / 0
Применение HASH()
    #39625110
Basil A. Sidorov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Симонов Денисколлизии всё равно будут, но раз цель не полностью убрать повторную обработку, а лишь снизить количество обращений к сервису... то не выйдет.
Если хэши разные, то файлы гарантированно отличаются, но если хэши одинаковые, то файлы надо проверить по-байтово.
...
Рейтинг: 0 / 0
Применение HASH()
    #39625117
Фотография Симонов Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. Sidorov,

ключевое слово здесь снизить, а не исключить. Если надо совсем исключить, то ты прав
...
Рейтинг: 0 / 0
Применение HASH()
    #39625123
Фотография DarkMaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Basil A. SidorovСимонов Денисколлизии всё равно будут, но раз цель не полностью убрать повторную обработку, а лишь снизить количество обращений к сервису... то не выйдет.
Если хэши разные, то файлы гарантированно отличаются, но если хэши одинаковые, то файлы надо проверить по-байтово.

Повторяю. Мне НЕ нужен 100% уникальный хэш. Если будет 1-2-10 ложных срабатываний на 10000 - меня это вполне устроит.
...
Рейтинг: 0 / 0
Применение HASH()
    #39625128
Dimitry Sibiryakov
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DarkMasterПовторяю. Мне НЕ нужен 100% уникальный хэш. Если будет 1-2-10 ложных срабатываний на 10000
- меня это вполне устроит.
То есть тебя устраивает, что для 1-2-10 файлов результаты обработки будут неправильные?..
Posted via ActualForum NNTP Server 1.5
...
Рейтинг: 0 / 0
Применение HASH()
    #39625131
Фотография Симонов Денис
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
ой блин. Протупил и правда не выйдет. Хеши одинаковые, размеры одинаковые, но файлы разные. Новый файл не закачен
...
Рейтинг: 0 / 0
Применение HASH()
    #39625134
Фотография DarkMaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Dimitry SibiryakovDarkMasterПовторяю. Мне НЕ нужен 100% уникальный хэш. Если будет 1-2-10 ложных срабатываний на 10000
- меня это вполне устроит.
То есть тебя устраивает, что для 1-2-10 файлов результаты обработки будут неправильные?..


Меня устраивает их повторная обработка.
...
Рейтинг: 0 / 0
Применение HASH()
    #39625136
WildSery
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DarkMasterПовторяю. Мне НЕ нужен 100% уникальный хэш. Если будет 1-2-10 ложных срабатываний на 10000 - меня это вполне устроит.Тогда вполне. Думаю, будет меньше.
...
Рейтинг: 0 / 0
Применение HASH()
    #39625137
Котовасия
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
DarkMasterDimitry Sibiryakovпропущено...

То есть тебя устраивает, что для 1-2-10 файлов результаты обработки будут неправильные?..


Меня устраивает их повторная обработка.
У тебя будут ложные отказы, а не ложные срабатывания.
...
Рейтинг: 0 / 0
Применение HASH()
    #39625139
Фотография DarkMaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Ребят, вы куда-то не в ту степь поскакали :) Мне просто нужно проверить в первом приближении , обрабатывался уже файл или нет. В любом случае есть вариант "обработать принудительно". Пользователя же просто спрашивают "смотри, вот тут у нас уже что-то похожее есть" - это оно?
...
Рейтинг: 0 / 0
Применение HASH()
    #39625140
WildSery
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Котовасия,

Если обработка занимает заметно больше скачки/закачки, то плюс будет заметный.
Если нет - то только лишний геморрой.
...
Рейтинг: 0 / 0
Применение HASH()
    #39625142
Фотография Старый плюшевый мишка
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
Котовасия
У тебя будут ложные отказы, а не ложные срабатывания.
Ой.
...
Рейтинг: 0 / 0
Применение HASH()
    #39625146
Фотография DarkMaster
Скрыть профиль Поместить в игнор-лист Сообщения автора в теме
Участник
КотовасияУ тебя будут ложные отказы, а не ложные срабатывания.

Проверка это что? Отказ или срабатывание?-)
...
Рейтинг: 0 / 0
25 сообщений из 32, страница 1 из 2
Форумы / Firebird, InterBase [игнор отключен] [закрыт для гостей] / Применение HASH()
Целевая тема:
Создать новую тему:
Автор:
Закрыть
Цитировать
Найденые пользователи ...
Разблокировать пользователей ...
Читали форум (0):
Пользователи онлайн (0):
x
x
Закрыть


Просмотр
0 / 0
Close
Debug Console [Select Text]