位置: IT常识 - 正文

python如何判断文件夹内的重复图片(python 文件判断)

编辑:rootadmin

推荐整理分享python如何判断文件夹内的重复图片(python 文件判断),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:python如何判断文件已经读完,Python如何判断文件存在,python如何判断文件大小,python如何判断文件已经读完,python如何判断文件或文件夹,Python如何判断文件存在,python如何判断文件类型,python如何判断文件已经读完,内容如对您有帮助,希望把文章链接给更多的朋友!

步骤

python如何判断文件夹内的重复图片(python 文件判断)

1、首先将所有的图片按照图片大小(byte)进行分类,然后再进行分类比较。

2、重复图片很有可能连续出现(因为重复图片大小相同)

如果要判断文件夹中是否有相同的图片,则需要对文件夹中的所有图片进行分类,并逐一判断两张图片是否相同。

如果文件夹中有1000张图片,则第一张图片需要与剩余的999张图片进行比较,第二张图片需要与剩余的998张图片进行比较,第三张图片需要与剩余的997张图片进行比较,以此类推。

实例

if__name__=='__main__':load_path='E:\\测试图片集(未去重)'#要去重的文件夹save_path='E:\\测试图片集(重复照片)'#空文件夹,用于存储检测到的重复的照片os.makedirs(save_path,exist_ok=True)#获取图片列表file_map,字典{文件路径filename:文件大小image_size}file_map={}image_size=0#遍历filePath下的文件、文件夹(包括子目录)forparent,dirnames,filenamesinos.walk(load_path):#fordirnameindirnames:#print('parentis%s,dirnameis%s'%(parent,dirname))forfilenameinfilenames:#print('parentis%s,filenameis%s'%(parent,filename))#print('thefullnameofthefileis%s'%os.path.join(parent,filename))image_size=os.path.getsize(os.path.join(parent,filename))file_map.setdefault(os.path.join(parent,filename),image_size)#获取的图片列表按文件大小image_size排序file_map=sorted(file_map.items(),key=lambdad:d[1],reverse=False)file_list=[]forfilename,image_sizeinfile_map:file_list.append(filename)#取出重复的图片file_repeat=[]forcurrIndex,filenameinenumerate(file_list):dir_image1=file_list[currIndex]dir_image2=file_list[currIndex+1]result=比较两张图片是否相同(dir_image1,dir_image2)if(result=="两张图相同"):file_repeat.append(file_list[currIndex+1])print("\n相同的图片:",file_list[currIndex],file_list[currIndex+1])else:print('\n不同的图片:',file_list[currIndex],file_list[currIndex+1])currIndex+=1ifcurrIndex>=len(file_list)-1:break#将重复的图片移动到新的文件夹,实现对原文件夹降重forimageinfile_repeat:shutil.move(image,save_path)print("正在移除重复照片:",image)

以上就是python判断文件夹内的重复图片的方法,希望对大家有所帮助。更多Python学习指路:Python基础教程

本文链接地址:https://www.jiuchutong.com/zhishi/310591.html 转载请保留说明!

上一篇:phpcms怎么修改后台文章排序(phpcms默认密码)

下一篇:js箭头函数是什么(javascript 箭头)

  • 什么是涉税信息
  • 少数股东损益是
  • 固定资产接受捐赠的计入什么科目
  • 技术服务的分录
  • 采购砂石料无发票对税务有影响
  • 转正后个税增加
  • 注册资金印花税减半政策
  • 内部报送会计信息有哪些
  • 应收账款让售账务处理
  • 固定资产被盗报警
  • 银行汇兑怎么做账
  • 收到社保中心的生育经贴怎么做账
  • 供应商不给货款怎么办
  • 变更法人税务怎么变更
  • 哪些外籍个人应在中国缴纳个税?
  • 外地预缴附加税减半
  • 审计报告格式与范文怎么写?
  • 资产折旧出现负数
  • 收到往来款的账务处理
  • pavmail.exe - pavmail进程是什么文件 有什么用
  • 公司报销医疗费的范围
  • 农民专业合作社税收优惠政策
  • 图像类别
  • 长期借款的概念
  • 其他应付款转资本公积股东决议
  • 高新技术企业如何在电子税务局备案
  • nginx配置php项目
  • 盈余公积提取和结转
  • 最简单的上传php文件
  • 长期应付款核算范围有哪些
  • 对标是啥
  • usermod修改密码
  • php获取ua
  • 交易性金融资产属于什么科目
  • 对公账号备用金怎么用
  • 销售包装什么意思
  • 单位交的那部分医保去哪了
  • SQLite教程(三):数据表和视图简介
  • 报销加油费怎么做账
  • 购汽车能抵扣进项吗
  • 进出口企业需要英文公章吗
  • 帐载金额
  • 收伙食费入什么科目
  • 恢复mysql数据库
  • 人员经费指的是
  • mysql简单操作
  • 在建工程什么情况下算竣工
  • 新增项目和延续项目
  • 接受土地使用权的会计分录
  • 收到的出口退税款需要并入利润总额吗
  • 调整期初库存商品分录
  • 客户逾期不付款,需要赔多少违约金
  • 开出去的发票
  • 征税体制
  • 单位结算卡和回单卡
  • 减免税怎么做会计分录
  • 支付银行手续费等直接收费金融服务
  • sql批量修改数据语句
  • mysql多表内连接查询
  • mysql搜索字段内容
  • win10的数据使用量是什么
  • win8.1如何关闭开机密码
  • 轻量级个人用linux桌面系统
  • mac打开safari快捷键
  • windows 10预览版
  • centos 安装7z
  • php创建注释的方法
  • linux系列
  • opensuse怎么安装软件
  • opengl坐标系原点
  • js的上传文件
  • 定制家具加盟品牌
  • 自动释放池原理,本质
  • node.js中fs模块
  • bash脚本加密
  • jquery动态添加div
  • android局部界面切换
  • 房产税季度缴纳几号之前
  • todesk点不了
  • 国税申报时间2023
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设