快速删掉文件夹里重复或者相似的图片

需求:快速删掉文件夹里重复或者相似的图片

一.软件推荐

1.电脑重复资源查找器

免费,简单好操作,在各种图像格式间比较内容,内置高速比较算法,灵活的扫描源:驱动器、文件夹、文件及类型,结果可复用:能保存 / 载入重复图片列表,支持所有常见图片类型(1,000 种以上)。

2.Duplicate Cleaner

Duplicate Cleaner Pro (官网:Duplicate Cleaner - Remove duplicate files)中文版是一款功能非常强大的重复文件查找工具,这个是无需注册、无需安装的单文件绿色便携版!程序可以帮助你快速的查找重复的图片、音乐等各种文件,可以根据字节、MD5、SHA等多种方式来 快速扫描!它可以同时搜索多个文件夹,支持按文件名称、大小和时间进行搜索。

3.DoubleKiller Pro

DoubleKiller Pro是一款小巧易用的多功能电脑重复文件清理软件,可以帮助你以文件名、大小、创建时间或CRC32校验值等特征快速扫描电脑中的所有重复文件,同时还能够支持搜索不同驱动器的指定类型的重复文件,并进行清除,很好解决电脑使用久了之后导致大量重复文件的堆积,占据电脑的大量内存的问题。

二.Github项目(python)实现

找相似图像:

1.FileManager

该项目支持22项功能如下:

  • 导出文件信息
  • 查找重复文件(基于大小和修改时间的判断方式, 以及基于文件 hash 值的判断方式)
  • 文件还原与备份(增量备份、文件同步、 文件还原)
  • 根据样本或者记录删除文件或者还原文件
  • 一键清空目录下所有空 文件夹
  • 搜索文件或者文件夹(可搜索隐藏文件)
  • 拷贝目录结构(导出到文件、 从文件恢复目录结构、导出目录结构到新目录下)
  • 比对文本文件内容(比对文 章、文档、代码的差异并将结果输出,可批量比对)
  • 计算文件 hash 值
  • 校 对字符串(校对两个字符串是否一致,包含忽略大小写,前后空格,以及忽略所 有空格)
  • 提取视频帧图像(可以批量快速提取指定视频的某一帧或者某一秒 的图像)
  • 查找相似图片(根据算法计算图片的相似度,并将满足相似度阈值 的图片移动到指定目录,可以有效找出不同分辨率、不同大小甚至是经过裁剪或 者加过水印的相似图片)
  • 查找相似视频(比对视频帧图像的相似度找出相似 视频并导出)
  • 以图搜图(选中图片在另一任意目录中搜索与之相似的图片)
  • 以视频搜相似视频(选中视频在另一任意目录中搜索与之相似的视频,主要 用于找出内容一样但是分辨率不同,或者内容一样只是水印有差异的视频)
  • 批量重命名
  • 合并视频(将选中的视频合并为一个视频,可以指定视频帧率)
  • 裁剪视频(集合了之前 video_cut 项目的代码)
  • 批量裁剪视频(选中多个 视频批量裁剪,用于去除视频片头片尾特别好用)
  • 提取音频和转换音频格式 (可以从视频中提取音频,也可以进行音频格式转换,可以指定音频帧率格式, 不一定支持所有音频格式)
  • 找出损坏或者不完整的视频(基于 ffmpeg)
  • 获取时间戳(时间与时间戳之间相互转换)以及修改文件的时间戳 所有的文件删除、文件更新操作进行防呆保护,最大限度保证数据安全!所 有操作都有日志,方便追溯和还原。涉及程序配置内容修改的操作会有权限验证


所有操作均可通过GUI界面进行操作,源码分享实属良心。

2.Imagededup

具体使用方法参考:https://github.com/chinalu/imagedups

安装
python setup.py install
使用方法
仅显示重复的图片:imagedups -p /path/to/image/folder1  
[+]开头的文件是保留的文件;
[-]开头的文件是可以清理的文件。
递归查找文件:imagedups -r -p /path/to/image/folder
查找并删除文件:imagedups -r -d -p /path/to/image/folder
删除文件是不进行确认:imagedups -r -d -N -p /path/to/image/folder
请做好数据备份

3.PicSniffer

主要采用Inception-v3模型对图片进行特征提取

文章首发地址: FUNNY AI

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/265232.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

在网络应用中配置和使用静态SOCKS5代理

在网络应用中配置和使用静态SOCKS5代理可以帮助保护用户的隐私和安全,同时提高网络连接的速度和稳定性。下面将介绍如何在网络应用中配置和使用静态SOCKS5代理。 一、了解静态SOCKS5代理 静态SOCKS5代理是指使用静态IP地址和端口的SOCKS5代理服务器。这种代理服务…

Python基础之print函数详解

文章目录 1、print语法格式2、sep可选关键字参数3、file可选关键字参数4、end可选关键字参数5、flush可选关键字参数6\. print 不换行Python字符串格式化符号:格式化操作符辅助指令:关于Python技术储备一、Python所有方向的学习路线二、Python基础学习视频三、精品Python学习书…

金士顿u盘写保护解决

1、已经尝试 改注册表、使用命令行无用,无法格式化。 2、有效方法 使用ChipGenius查看u盘信息 我的主控型号就是IS918M_GA - F/W 13008SE39_4G6002 下载对应主控型号的量产工具 网友提供的下载网址:https://modou.lanzoul.com/b036ysufc,密…

SSL证书HTTPS保护服务

SSL证书属于数字证书的其中一种,广泛用于https协议,从而可以让数据传输在加密前提下完成,确保HTTPS网络安全是申请SSL证书必要工作。 SSL证书是主要用于https是一种加密协议,仔细观察网站地址会发现目前主流的网址前面都会有http…

【学习笔记】python仅拷贝list的值,引出浅拷贝与深拷贝

一、python 仅拷贝list的值(来源于gpt) 在 Python 中,可以使用切片或 copy() 方法来仅拷贝列表的值。 1、使用切片 a [1, 2, 3, 4, 5] b a[:] # 通过切片来拷贝 a 的值 在上面的代码中,我们使用切片来拷贝列表 a 的值&#xff…

k8s volumes and data

Overview 传统上,容器引擎(Container Engine)不提供比容器寿命更长的存储。由于容器被认为是瞬态(transient)的,这可能会导致数据丢失或复杂的外部存储选项。Kubernetes卷共享 Pod 生命周期,而不是其中的容器。如果容器终止,数据…

图的搜索(二):贝尔曼-福特算法、狄克斯特拉算法和A*算法

图的搜索(二):贝尔曼-福特算法、狄克斯特拉算法和A*算法 贝尔曼-福特算法 贝尔曼-福特(Bellman-Ford)算法是一种在图中求解最短路径问题的算法。最短路径问题就是在加权图指定了起点和终点的前提下,寻找从…

22款奔驰GLS450升级香氛负离子 车载香薰功能

相信大家都知道,奔驰自从研发出香氛负离子系统后,一直都受广大奔驰车主的追捧,香氛负离子不仅可以散发出清香淡雅的香气外,还可以对车内的空气进行过滤,使车内的有害气味通过负离子进行过滤,达到车内保持清…

windows MYSQL解决中文乱码问题

1.首先确保你已经把mysql配置了环境变量 2.打开window终端 3.输入mysql -u root -p 4.输入密码,就是安装的时候设置的root超级管理员权限密码 5.输入: SHOW VARIABLES LIKE ‘character%’; 出现上图,说明就会出现中文乱码问题。 6.该怎么办…

SAP 组合替代简介

我们开始测试一下组合替代,并不是单个物料的替代关系,物料的成组的替代。也有顾问称之为平行后继物料(Parallel Discontinuation) 在企业在执行物料替换时并不是单一地仅对某一种物料进行替换。事实上,有些时候正因为某些关键组件被新的物料所替换,导致了其他的组件也被迫…

基于ssm的星空游戏购买下载平台的设计与实现论文

摘 要 随着科学技术的飞速发展,各行各业都在努力与现代先进技术接轨,通过科技手段提高自身的优势,商品交易当然也不能排除在外,随着商品交易管理的不断成熟,它彻底改变了过去传统的经营管理方式,不仅使商品…

在javaweb项目中resource目录和webapp目录的区别

resource存放的是一些配置文件,这些文件一般都是与java代码相关的配置文件,比如这里的jdbc配置文件,在java中可以使用这个目录下的文件,不用写全路径 webapp存放的是web的资源文件,如jsp,html,css,js文件,在网页请求会…