位置: IT常识 - 正文

python如何判断文件夹内的重复图片(python 文件判断)

编辑:rootadmin

推荐整理分享python如何判断文件夹内的重复图片(python 文件判断),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:python如何判断文件已经读完,Python如何判断文件存在,python如何判断文件大小,python如何判断文件已经读完,python如何判断文件或文件夹,Python如何判断文件存在,python如何判断文件类型,python如何判断文件已经读完,内容如对您有帮助,希望把文章链接给更多的朋友!

步骤

python如何判断文件夹内的重复图片(python 文件判断)

1、首先将所有的图片按照图片大小(byte)进行分类,然后再进行分类比较。

2、重复图片很有可能连续出现(因为重复图片大小相同)

如果要判断文件夹中是否有相同的图片,则需要对文件夹中的所有图片进行分类,并逐一判断两张图片是否相同。

如果文件夹中有1000张图片,则第一张图片需要与剩余的999张图片进行比较,第二张图片需要与剩余的998张图片进行比较,第三张图片需要与剩余的997张图片进行比较,以此类推。

实例

if__name__=='__main__':load_path='E:\\测试图片集(未去重)'#要去重的文件夹save_path='E:\\测试图片集(重复照片)'#空文件夹,用于存储检测到的重复的照片os.makedirs(save_path,exist_ok=True)#获取图片列表file_map,字典{文件路径filename:文件大小image_size}file_map={}image_size=0#遍历filePath下的文件、文件夹(包括子目录)forparent,dirnames,filenamesinos.walk(load_path):#fordirnameindirnames:#print('parentis%s,dirnameis%s'%(parent,dirname))forfilenameinfilenames:#print('parentis%s,filenameis%s'%(parent,filename))#print('thefullnameofthefileis%s'%os.path.join(parent,filename))image_size=os.path.getsize(os.path.join(parent,filename))file_map.setdefault(os.path.join(parent,filename),image_size)#获取的图片列表按文件大小image_size排序file_map=sorted(file_map.items(),key=lambdad:d[1],reverse=False)file_list=[]forfilename,image_sizeinfile_map:file_list.append(filename)#取出重复的图片file_repeat=[]forcurrIndex,filenameinenumerate(file_list):dir_image1=file_list[currIndex]dir_image2=file_list[currIndex+1]result=比较两张图片是否相同(dir_image1,dir_image2)if(result=="两张图相同"):file_repeat.append(file_list[currIndex+1])print("\n相同的图片:",file_list[currIndex],file_list[currIndex+1])else:print('\n不同的图片:',file_list[currIndex],file_list[currIndex+1])currIndex+=1ifcurrIndex>=len(file_list)-1:break#将重复的图片移动到新的文件夹,实现对原文件夹降重forimageinfile_repeat:shutil.move(image,save_path)print("正在移除重复照片:",image)

以上就是python判断文件夹内的重复图片的方法,希望对大家有所帮助。更多Python学习指路:Python基础教程

本文链接地址:https://www.jiuchutong.com/zhishi/310591.html 转载请保留说明!

上一篇:phpcms怎么修改后台文章排序(phpcms默认密码)

下一篇:js箭头函数是什么(javascript 箭头)

  • 内蒙古注册税务师协会
  • 资产负债表怎么填
  • 用友取消操作在哪里
  • 备用金可以不要发票吗
  • 利税总额是应交还是已交
  • 转登记为小规模纳税人未抵扣的进项税额
  • 不得抵扣的进项税额的情形有
  • 进口货物会计分录举例
  • 所得税季度预缴纳税申报表中弥补以前年度亏损
  • 押金 保证金
  • 已经给员工交了社保能退吗
  • 增值税专用发票电子版
  • 金税三期里有员工无工资如何申报?
  • 税收编码选错了,发票已经开出去几个月了,还有影响吗
  • 房租开的专票怎么做账
  • 认证后的发票可以留存多久
  • 承包方给发包方付费
  • 重点创业人群
  • 个体不超过10万怎么交税
  • 小微企业增值税最新优惠政策
  • 临时工的个人所得税怎么算
  • 城镇土地使用税的计税依据
  • 已进行账务处理怎么处理
  • 结息的会计分录怎么写
  • 出口退税的钱退到哪里了
  • 社保打入其他公司代扣分录怎么做?
  • 未分配利润怎么处理
  • 股东个人财产转让流程
  • 应收账款和预收账款有什么区别
  • 网络环境中存在不同网段的nvr
  • 公司收到医疗保障事务中心的转账
  • 非累积带薪缺勤什么时候确认
  • linux中loop的含义
  • codeigniter 教程
  • 生产成本二级科目会计分录
  • 微软 new bing 广告收入
  • vue中$route
  • fping命令参数
  • mdadm命令用不了
  • 生育津贴的钱怎么取出来
  • 库存商品的盘盈盘亏
  • java多线程经典案例
  • 帝国cms灵动标签怎么调用
  • python smote算法
  • 员工高铁票能抵扣吗
  • sqlserver存储过程if语句
  • sql2008怎么查询
  • 电子税务局实名核验失败
  • 付款后退货
  • 计提资产减值准备时,借记的科目是
  • 库存股增加记哪一方
  • 律师事务所的所属行业是什么
  • 一般纳税人改成小规模可以吗
  • 公司租用员工车辆维修费能报销吗
  • 开办幼儿园的流程图
  • 营改增后税率表
  • 上个月的发票可以作废吗
  • 进项税额准予抵扣是什么意思
  • 错账查找方法主要有
  • excel日记账系统的设置
  • ubuntu18 ssh
  • dos命令 新建文件
  • 电脑主板bios是什么意思
  • linux which ls
  • win10怎么把系统盘迁移到另一块盘
  • win11系统ie浏览器
  • opengl英文
  • three.js怎么用
  • js中的
  • javascript折叠菜单
  • python常见算法
  • Shell脚本统计文件行数
  • jquery返回顶部
  • django返回json数据
  • jquery中遍历指定的对象和数组是哪个方法
  • js实现复制文本
  • 支部书记讲党课主题教育
  • 12366国税网上申报
  • 什么是增值税税率是多少
  • 发生技术入股递增怎么办
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设