Парам — бой!.. Программы — ликвидаторы копий

В одном из последних номеров «Мегабайта» (а точнее — в №7 в статье «Борьба с парообразованием») речь шла о программе ImageDupeless, крайне успешно справляющейся с проблемой поиска и устранения картинок-дубликатов, отъедающих драгоценные мегабайты и даже гигабайты на наших с вами винчестерах. Правда, радость пользования ImageDupeless изрядно омрачается ее статусом — shareware, так что сегодня речь пойдет о лучших бесплатных аналогах этой программы.

Компаратор картинок 1.2
Freeware
timall.narod.ru
Windows 9x/ME/2000/XP
Размер: 652 Кбайт
Минимальные системные требования: Pentium 100 МГц, RAM 32 МБайт, 600 КБайт на жестком диске
Кроме всего, отечественная разработка. Обещания крайне радужные: оригинальный алгоритм, оптимизация для работы с изображениями в различных разрешениях, устойчивость к неоднородному балансу. Мало того, заявлено, что скорость обработки выше, чем у пакетов-конкурентов, при аналогичном уровне достоверности.

На деле же — все, как в том анекдоте: «А это была демо-версия!» При первом запуске программа «радует» новостью о том, что для работы ей жизненно необходима библиотечка Borland Database Engine (BDE). Если у вас ее нет (вероятнее всего), то скачать можно на том же сайте, что и программу. Размер ее, кстати, 4 Мбайт! Вот она, обратная сторона freeware. Делать нечего, скачиваем, распаковываем, открываем… Да-а, пользователям, живущим в режиме 800×600, можно посочувствовать — окно еле-еле влезает в экран, кнопки огромные, окошки для просмотра крохотные. Ладно, лишь бы работала хорошо.
В отличие от ImageDupeless, идеология программы крайне проста — никаких тебе «галерей» (то есть неких профайлов с информацией о файлах): просто задаешь папку, программа неторопливо обрабатывает каждый файл и тут же ищет дубликаты в соответствии с заданным процентом схожести. Интересно, что процент задается не одним числом, а границами — верхней и нижней, причем нижнюю можно опустить хоть до нуля! Ничего хорошего, правда, не получится, кроме тонн найденных псевдодубликатов. Более-менее приличных результатов поиска мне удалось добиться при установке нижней границы схожести, которая составляет 90%. Скорость поиска (после загрузки) действительно очень высока. «Легкие» дубли, то есть практически идентичные картинки, программа находила с легкостью. Более «сложные», сильно разнящиеся дубли (которые ImageDupeless находил все!), программа лишь частично обнаруживала при установке нижней границы схожести порядка 85-87%, только вот мусора при этом находилось столько, что поиск дубликатов в этом хаосе становился ничуть не менее легким занятием, чем ручной поиск дубликатов. Отсюда простой вывод: многотысячные коллекции с высокой точностью поиска оперативно обработать таким софтом не получится. Поэтому разработчик предлагает функцию «сравнить группы». Суть такова: задаются папки (желательно, предварительно очищенные от дубликатов) и сравниваются между собой. Этакое «бюджетное» решение проблемы работы с большим количеством файлов за счет разбития последних на подгруппы.
Результаты поиска, что обидно, показаны в виде таблицы, но только попарно, поэтому при наличии более 2-х дубликатов вы получите несколько пар картинок, сравнить которые будет непросто. Зато переключение между парами происходит быстро, дубли можно посмотреть, удалить, скопировать или переписать в отдельную папку.

DupDetector 3.0
Freeware
www.prismaticsoftware.com
Windows 95/98/Me/XP/2K/NT4
Размер: 554 Кбайт
Минимальные системные требования: 486 или Pentium, RAM 2 Мбайт, 10 Мбайт на жестком диске
Эта программа куда лучше предыдущей: умеет создавать «галереи» (datafile), которые отличаются крайне скромными размерами. Поиск выполняется в одном из трех режимов: сравнение всех картинок в заданном каталоге, сравнение двух «галерей» (при этом файлы в пределах одной галереи друг с другом не сравниваются), сравнение заданной картинки с галереей. Сами же галереи создаются в разделе Get data -> Build. Процесс, опять же, неторопливый, зато поиск дублей потом выполняется очень быстро. Кстати, ограничение на количество файлов в галерее действует только в среде W9x и составляет 32000 штук. Критерием в процессе поиска дублей являются те же верхние и нижние границы, существует также возможность выбора метода сравнения. Результаты поиска отображаются только попарно (что, как отмечалось выше, неудобно при наличии массы дубликатов одного и того же файла), переход от пары к паре медленный (хотя и побыстрее, чем в ранних версиях). Что касается качества поиска, то здесь все не так просто. В узком диапазоне (от 95 до 100%) программа находит только «легкие» дубли, то есть почти идентичный файлы. Выставляем порядка 87% или 90% — находит даже самые «сложные» копии, но за такой высший пилотаж, не всегда доступный и в ImageDupeless, приходится расплачиваться кучами найденного мусора.
Подведем итоги: с бесплатными аналогами ImageDupeless далеко не все гладко, начиная от неудобных маленьких иконок и попарного режима вывода результатов, до недостатков самих алгоритмов поиска дублей. Лично мне DupDetector куда более симпатичен — и функций больше, и алгоритм мощнее, и галереи создавать умеет. А когда он еще и научится находить дубли с высокой точностью и почти без мусора, то ImageDupeless точно придется потесниться.


Рекомендуем почитать: