|
|
|
Поиск копий файлов в папке с подпапками. Может кому пригодится
|
|||
|---|---|---|---|
|
#18+
Наконец-то почистил архив фоток. За 10 лет там такой бардак устроили, что руками нереально разгребать. Одно и тоже понакопировали в разные папки. Удалилось 13 Гб из 120. Прога в аттаче (исходник на C# и батник для компиляции) Ищет дубли по содержимому и переносит их в отдельную подпапку. Если кому надо - пользуйтесь. Для компиляции запустить compile.cmd Саму прогу так запускатьFindFileCopy <folder> [-clean] [-main:subfolder1;subfolder2...] Параметры: <folder> папка внутри которой идет поиск -main:subfolder1;subfolder2... перечень подпапок, которые считать оригиналами (из них копии не убираются) -clean создать подпапку _double_copy_XXXX и туда переместить найденные повторы вместе с путями, иначе только сообщения о повторах. Пример: FindFileCopy c:\Foto -clean -main:2014;2015;2016 Если запустить просто FindFileCopy c:\Foto то только напишет где дубли, ничего переносить не будет ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 14.05.2016, 20:14 |
|
||
|
Поиск копий файлов в папке с подпапками. Может кому пригодится
|
|||
|---|---|---|---|
|
#18+
Dima T, а учитывается поворот фотографий? а то ведь в одном каталоге может лежать фото, а в другом - такое же, только повернутое. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.05.2016, 08:53 |
|
||
|
Поиск копий файлов в папке с подпапками. Может кому пригодится
|
|||
|---|---|---|---|
|
#18+
Dima TИщет дубли по содержимому Ну так этого добра типа dblfiles в нете аки грязи. И с гуями, и cli, и со всякоразными наворотами... Dima TИщет дубли по содержимому Я, конечно, в шарпах нуль - но чисто на взгляд дубли ищутся по MD5 содержимого, а не по самомУ содержимому. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.05.2016, 10:02 |
|
||
|
Поиск копий файлов в папке с подпапками. Может кому пригодится
|
|||
|---|---|---|---|
|
#18+
eNoseа учитывается поворот фотографий? а то ведь в одном каталоге может лежать фото, а в другом - такое же, только повернутое. Не, только поиск одинаковых файлов. AkinaЯ, конечно, в шарпах нуль - но чисто на взгляд дубли ищутся по MD5 содержимого, а не по самомУ содержимому. Там три проверки: сначала совпадение размера файла, потом MD5 от первых 16 Кб, потом полный MD5. Думаю это равносильно сравнению содержимого. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.05.2016, 10:11 |
|
||
|
Поиск копий файлов в папке с подпапками. Может кому пригодится
|
|||
|---|---|---|---|
|
#18+
Dima TДумаю это равносильно сравнению содержимого. Да, вероятность коллизии пренебрежимо мала - но тем не менее она не нулевая. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.05.2016, 10:20 |
|
||
|
Поиск копий файлов в папке с подпапками. Может кому пригодится
|
|||
|---|---|---|---|
|
#18+
Dima T , Auslogics Duplicate File Finder чем не устроил? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.05.2016, 11:08 |
|
||
|
Поиск копий файлов в папке с подпапками. Может кому пригодится
|
|||
|---|---|---|---|
|
#18+
Dima Tпотом полный MD5зачем полный мд5, не проще (и надёжнее) ли сравнивать уже 2 файла целиком? ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.05.2016, 11:18 |
|
||
|
Поиск копий файлов в папке с подпапками. Может кому пригодится
|
|||
|---|---|---|---|
|
#18+
tanglirDima Tпотом полный MD5зачем полный мд5, не проще (и надёжнее) ли сравнивать уже 2 файла целиком? В худшем случае тормоза будут: если мы имеем N разных файлов одинакового размера с одинаковыми первыми 16 кб, то каждый файл будет прочитан N-1 раз. А так каждый файл по 1 разу читается. И потом MD5 посчитать кода меньше, чем содержимое сравнивать. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.05.2016, 12:07 |
|
||
|
Поиск копий файлов в папке с подпапками. Может кому пригодится
|
|||
|---|---|---|---|
|
#18+
Dima Tесли мы имеем N разных файлов одинакового размераА вот было бы интересно посчитать распределение длин файлов. Что-то мне подсказывает, что (если речь об исходных фотографиях с фотоаппарата, а не уменьшенных копиях) распределение будет довольно равномерным с очень малым количеством совпадений по размеру. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.05.2016, 12:26 |
|
||
|
Поиск копий файлов в папке с подпапками. Может кому пригодится
|
|||
|---|---|---|---|
|
#18+
В случае с фотками думаю немного одинакового размера. Возьмем другой, вполне реальный случай: N копий в разных папках, тогда для сравнения по содержимому надо будет (N-1)*2 чтения файла целиком. А так только N. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.05.2016, 13:03 |
|
||
|
Поиск копий файлов в папке с подпапками. Может кому пригодится
|
|||
|---|---|---|---|
|
#18+
Dima TN копий в разных папках, тогда для сравнения по содержимому надо будет (N-1)*2 чтения файла целиком.Это если сравнивать только попарно и ничего не кэшировать. Однако при современных объемах ОЗУ не вижу проблемы держать в памяти даже несколько десятков файлов, чего более чем достаточно для фотографий. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.05.2016, 13:09 |
|
||
|
Поиск копий файлов в папке с подпапками. Может кому пригодится
|
|||
|---|---|---|---|
|
#18+
Дима. Я пару лет назад реализовал для себя imagehash на Java. https://special.habrahabr.ru/kyocera/p/237307/ самый первый и самый жлобский вариант где идет сравнение 8x8 биткарт. Обнаружил у себя в коллекции фоток - целые директории копий (да такое бывает). ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.05.2016, 14:28 |
|
||
|
Поиск копий файлов в папке с подпапками. Может кому пригодится
|
|||
|---|---|---|---|
|
#18+
jmp_original Dima T , Auslogics Duplicate File Finder чем не устроил? так каждый может ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.05.2016, 15:10 |
|
||
|
Поиск копий файлов в папке с подпапками. Может кому пригодится
|
|||
|---|---|---|---|
|
#18+
Charles Weylandтак каждый может Да, я уже понял. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.05.2016, 16:06 |
|
||
|
Поиск копий файлов в папке с подпапками. Может кому пригодится
|
|||
|---|---|---|---|
|
#18+
maytonДима. Я пару лет назад реализовал для себя imagehash на Java. https://special.habrahabr.ru/kyocera/p/237307/ самый первый и самый жлобский вариант где идет сравнение 8x8 биткарт. Можно попробовать это запилить, на поиски однотипных фоток (обычно 3-4 в одном месте и "потом выберем получше"). Теоретически 2/3 должно удалится, но тут сразу встает административная проблема: кто досортирует, т.е. примет решение что именно эта фотка лишняя. У меня таких решительных нет, потому и лежит весь архив как есть. Удалил 10% уже хорошо. maytonОбнаружил у себя в коллекции фоток - целые директории копий (да такое бывает). Хоть кому-то пригодилось :) Цель была именно такая - похерить задвоения. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 16.05.2016, 21:03 |
|
||
|
Поиск копий файлов в папке с подпапками. Может кому пригодится
|
|||
|---|---|---|---|
|
#18+
Dima T, у меня аналогичное есть на питоне. Чака называется. но цель другая - переименовать файлы чтобы расположить их в порядке возрастная времени съемки, чтобы собирать с разных фотоаппаратов все фото в одну кучу. ... |
|||
|
:
Нравится:
Не нравится:
|
|||
| 17.05.2016, 11:20 |
|
||
|
|

start [/forum/topic.php?fid=16&msg=39236561&tid=1340717]: |
0ms |
get settings: |
7ms |
get forum list: |
14ms |
check forum access: |
3ms |
check topic access: |
3ms |
track hit: |
180ms |
get topic data: |
9ms |
get forum data: |
2ms |
get page messages: |
55ms |
get tp. blocked users: |
2ms |
| others: | 237ms |
| total: | 512ms |

| 0 / 0 |
