位置: IT常识 - 正文

python如何判断文件夹内的重复图片(python 文件判断)

编辑:rootadmin

推荐整理分享python如何判断文件夹内的重复图片(python 文件判断),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:python如何判断文件已经读完,Python如何判断文件存在,python如何判断文件大小,python如何判断文件已经读完,python如何判断文件或文件夹,Python如何判断文件存在,python如何判断文件类型,python如何判断文件已经读完,内容如对您有帮助,希望把文章链接给更多的朋友!

步骤

python如何判断文件夹内的重复图片(python 文件判断)

1、首先将所有的图片按照图片大小(byte)进行分类,然后再进行分类比较。

2、重复图片很有可能连续出现(因为重复图片大小相同)

如果要判断文件夹中是否有相同的图片,则需要对文件夹中的所有图片进行分类,并逐一判断两张图片是否相同。

如果文件夹中有1000张图片,则第一张图片需要与剩余的999张图片进行比较,第二张图片需要与剩余的998张图片进行比较,第三张图片需要与剩余的997张图片进行比较,以此类推。

实例

if__name__=='__main__':load_path='E:\\测试图片集(未去重)'#要去重的文件夹save_path='E:\\测试图片集(重复照片)'#空文件夹,用于存储检测到的重复的照片os.makedirs(save_path,exist_ok=True)#获取图片列表file_map,字典{文件路径filename:文件大小image_size}file_map={}image_size=0#遍历filePath下的文件、文件夹(包括子目录)forparent,dirnames,filenamesinos.walk(load_path):#fordirnameindirnames:#print('parentis%s,dirnameis%s'%(parent,dirname))forfilenameinfilenames:#print('parentis%s,filenameis%s'%(parent,filename))#print('thefullnameofthefileis%s'%os.path.join(parent,filename))image_size=os.path.getsize(os.path.join(parent,filename))file_map.setdefault(os.path.join(parent,filename),image_size)#获取的图片列表按文件大小image_size排序file_map=sorted(file_map.items(),key=lambdad:d[1],reverse=False)file_list=[]forfilename,image_sizeinfile_map:file_list.append(filename)#取出重复的图片file_repeat=[]forcurrIndex,filenameinenumerate(file_list):dir_image1=file_list[currIndex]dir_image2=file_list[currIndex+1]result=比较两张图片是否相同(dir_image1,dir_image2)if(result=="两张图相同"):file_repeat.append(file_list[currIndex+1])print("\n相同的图片:",file_list[currIndex],file_list[currIndex+1])else:print('\n不同的图片:',file_list[currIndex],file_list[currIndex+1])currIndex+=1ifcurrIndex>=len(file_list)-1:break#将重复的图片移动到新的文件夹,实现对原文件夹降重forimageinfile_repeat:shutil.move(image,save_path)print("正在移除重复照片:",image)

以上就是python判断文件夹内的重复图片的方法,希望对大家有所帮助。更多Python学习指路:Python基础教程

本文链接地址:https://www.jiuchutong.com/zhishi/310591.html 转载请保留说明!

上一篇:phpcms怎么修改后台文章排序(phpcms默认密码)

下一篇:js箭头函数是什么(javascript 箭头)

  • 进项税有余额但没有余额
  • 用于员工福利的会计分录
  • 小规模纳税人应交增值税怎么算
  • 小规模纳税人实收资本
  • 哪些企业需要纳税
  • 有红字发票如何入账
  • 两地拿工资怎么扣个税
  • 苗木属于农产品中哪一类
  • 事假扣薪
  • 结转入库材料计划成本的会计分录例题
  • 专票可以当费用票吗
  • 含税进货价款怎么算
  • 劳务费增值税专用发票虚开一万元怎么补救
  • 劳务派遣公司是干嘛的
  • 增值税需要计提吗
  • 员工报销医药费计入什么费用
  • 城镇土地使用税会计分录怎么做
  • 对方承担税费怎么做会计分录
  • 能抵扣税款的发票有哪些
  • 资本资产定价模型
  • 现金流量表根据什么原则编制
  • 什么是研发投入和成本
  • 诉讼费做账科目
  • 生产的废材料处理如何记账是否缴税?
  • 工程上的材料费进什么科目
  • 剩余材料出售
  • 旅游服务业账务处理办法
  • 什么叫绝地求生
  • 公司党员活动日方案
  • nw.exe是什么进程
  • css禁用button按钮
  • 房产权利转移
  • vue跳转到外部链接且带上参数
  • 阿巴拉契亚国家步道的英文怎么说
  • 不得税前扣除的项目有哪些
  • 手把手教你如何从一无所有到财务自由
  • 持有至到期投资账务处理
  • js-cookie vue
  • php第三方支付
  • 电子客票行程单怎么获取
  • 预缴税款从哪里查
  • 员工体检费发票可以抵扣进项吗
  • 二手固定资产怎么折旧
  • python中类方法有什么用
  • 固定资产折旧费计入成本吗
  • 社会保险差额缴纳
  • 事业单位结余是什么意思
  • 员工工伤申请流程
  • 建筑工程老项目开票截止日期
  • 预算会计年末如何结账
  • 待报解预算收入给我转了钱是什么意思
  • 企业进行资产评估的目的可能是
  • 增值税结转是月结转还是年度
  • 净资产收益率计算公式
  • 直接成本包括哪些
  • window怎么操作
  • xp系统没有声音没有音频设备
  • mac如何更换系统
  • win8系统应用软件颜色不正常怎么办
  • win10怎么查看windows版本
  • ubuntu 编译安装
  • centos5.4
  • win10更新后安装包会自动删除吗
  • pavprsrv.exe - pavprsrv是什么进程 有什么用
  • node.js go
  • linux生成文件
  • node.js中的http.response.end方法使用说明
  • 你有一份来信
  • 收集linux日志
  • 浏览器窗口上线怎么办
  • node的理解
  • android下的单元测试要配置以下说法不正确的是
  • python爬虫从入门到精通
  • 工信部新车申报目彿
  • 如何打印纳税申报表
  • 广东省电子税务局app下载官网
  • 车辆购置税查询不到
  • 12366重庆电子税务局
  • 别墅与普通住宅的优缺点
  • 如何用微信进行社保认证
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设