位置: IT常识 - 正文

YoloV7训练最强操作教程.(yolov3训练)

发布时间:2024-01-10
YoloV7训练最强操作教程. YoloV7训练最强操作攻略

推荐整理分享YoloV7训练最强操作教程.(yolov3训练),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolov5训练过程,yolov5 训练时间,yolov2训练,yolov5训练,yolov5训练效果差,yolov2训练,yolov1训练过程,yolov3训练,内容如对您有帮助,希望把文章链接给更多的朋友!

本文主要带领大家使用yolov7对口罩目标检测数据集进行实践,主要就是希望通过本教程可以让各位使用yolov7对自己的数据集进行训练,测试,预测。代码数据集训练模型链接在最后!

2022-11-20更新:在b站上传了一个yolov7的视频教学,配合本博文使用.链接B站中的数据集链接,这个是一个1.1w张识别人是否带口罩的目标检测数据集,里面有voc格式和yolo格式.这个是yolov7训练好的代码和模型文件,里面有训练好的yolov7-tiny,yolov7,yolov7w6的权重,可以直接使用检测。在yolov7中添加pyqt5作为可视化界面的教程、视频讲解、源码。链接2022-12-28更新:在B站和github上更新了yolov5和yolov7的热力图可视化,不需要对源码作任何修改,即插即用,有兴趣可以去看看。2023-1-9更新:B站和博客上上传了DAMO-YOLO的教程.2023-1-28更新:B站教学链接和博客 YOLOV7改进-添加EIOU,SIOU,AlphaIOU,FocalEIOU.2023-1-31更新:B站教学链接 YOLOV7改进-添加注意力机制 附带几十种注意力机制代码.2023-2-11更新:B站教学链接 YOLOV7改进-Wise IoU 参考.2023-2-18更新:B站教学链接 YOLOV7改进-添加可变形卷积DCNV2.2023.2.26 更新B站教学链接 可视化并统计预测结果的TP,FP,FN2023.2.26 更新B站教学链接 YOLOV7改进-添加SAConv.重磅!!!!! YOLO模型改进集合指南-CSDN2023-11月份会更新一个yolov7+byteTrack(2021年目标跟踪SOTA)源码,有兴趣的请点赞并关注,敬请期待!另外这里打个广告,就是我自己整合并开源的一个基于pytorch-image-classifier代码,这个是示例博客,功能和可视化都非常全,有兴趣的可以看看,谢谢!正文开始:1. 下载源码和数据集

对于源码各位看官可以直接下载本链接的代码,本链接代码包含了一些便捷工具,比如voc格式转yolo,分割数据集等等,本链接的代码会随着官网的更新而更新,所以不用害怕代码版本旧的问题啦! 这里我准备了一个口罩目标检测数据集,如果各位目前没有数据集的可以下载一下这个数据集作为本博客的实践数据集案例。

2.配置环境

环境配置可以参考本博主的另外一篇文章基于pytorch的花朵分类,安装过程出现有什么问题,可以私信博主或者留言,博主看到会尽力帮助大家解决问题。

3. 处理数据集

总所周知,yolo系列的大部分源码都是需要使用yolo格式的标注文件,那么网上大部分数据集都是voc格式,那么这里就需要做一个格式的转换,我们下面分两种情况:

VOC数据集格式

如果你的数据集格式是VOC格式的话,一般就会有图片和xml后缀的文件,这个xml后缀的文件就是你的数据集的标签文件,在代码中,我们的dataset文件夹就是数据集的存储的位置,其中图片存放在dataset/VOCdevkit/JPEGImages文件夹中,标签文件需要存放在dataset/VOCdevkit/Annotations文件夹中,dataset/VOCdevkit/txt文件夹是存储转换后的yolo格式标签文件.。(这个文件创不创建都可以,转换的时候会自动检测,不存在的话会自动创建)

当然自己也可以修改imgpath(存放图像的路径),xmlpath(存在voc标注格式的路径),txtpath(存放转换的yolo格式的路径),不过博主建议一般就不要修改,因为有些看主的动手能力相对差一点,修改后有报错可能不会处理,建议还是按照博主路径和示例来是最稳妥的。 对应的数据放置好后,我们需要运行xml2txt.py,其中这个文件有一个postfix参数,其为你图像的后缀格式,默认为jpg,如果你的图像是bmp或者png可以修改这个参数,当然其不支持混合的后缀格式,其会导致输出文件找不到的错误信息,这个请大家注意!这个文件会把Annotations文件夹中的xml文件读取到内存,然后进行转换成yolo格式并保存到dataset/VOCdevkit/txt文件夹中,其中运行截图如下图所示:

每个文件的转换都会单独有一行的输出,如果某个文件转换有问题或者你的标注文件里面有其他格式的文件存在都会提示对应的信息,比如如果某个文件转换失败的话,会提示报错信息,但是不会终止程序,只是这个文件就不转换了,最后会有一个this file convert failure下方有一个列表,如果这个列表为空,就是证明全部转换成功,如果不为空,列表里面的文件路径就是转换出错的标注文件,这种你可以看一下报错信息,如果奇奇怪怪的基本就不用理了,但是需要注意的一点是如果全部都转换出错了,那很有可能就是你存放的位置不对等等,这些需要根据报错信息检查。第二个列表是你这个数据集中的类别信息,这个类别信息是有用的,我们需要手动复制到data/data.yaml文件的names里面,如下图所示: 其中蓝色框是固定的路径(如果你按照本教程操作),黄色框是根据你数据集的类别进行修改,比如当前数据集是三个类别,我们就设置为3,红色款就是我们这个xml2txt.py输出的信息,那么类别的名字是可以改的,假设我们第三个类别代表的意思是不正确佩戴口罩,那么我们修改为mask_incorrect都是可以的,不过建议不要包含中文。

YOLO数据集格式YoloV7训练最强操作教程.(yolov3训练)

如果你自己的数据集是YOLO格式的话,那么你就直接把全部图片放到dataset/VOCdevkit/VOC2007/JPEGImages文件夹中,标签文件txt放到dataset/VOCdevkit/VOC2007/txt中,然后需要自行修改一下data/data.yaml中的类别数和类别名字,对于YOLO格式的数据集,一般会单独有一个classes.txt来记录类别信息。

分割数据集

无论对于VOC格式数据集还是YOLO格式数据集,按照上述步骤处理好后运行split_data.py,这个文件也有一个postfix参数,默认为jpg,如果自己的数据集不是jpg后缀的话,请自行修改,当然不支持混合后缀格式,请大家注意!split_data.py中还有val_size,test_size参数,其为比例系数,默认为0.1,0.2,如有需要请自行修改。运行成功后,其会自动创建下图这些文件夹,然后把对应的图片和标签文件复制到对应的文件夹中。 当你完成这一步的时候,数据集就处理完成。

4. 训练

对于训练,我们分为两个来说,因为yolov7是有两个训练的文件,一个是train.py,一个是train_aux.py。其中如果你是下载本文章的代码,那么预训练权重是已经下载好到项目中的weights文件夹,那么下面开始训练的教程:

训练-train.py

我们先解释一下重点的参数的意思:

weights 预训练文件权重路径,这个可以在weights文件夹中找到。cfg 模型配置文件路径,这个可以在cfg/training文件夹中找到。data 数据配置文件的路径,默认就是data/data.yaml。hyp 超参数配置文件路径,这个可以在data文件夹中可以找到。epochs 学习次数。batch-size 一次迭代的数据量。img-size 训练的图像输入大小。resume 是否继续上一次未完成的训练。device 训练所使用的的设备。label-smoothing 标签平滑的值。name 日志模型保存的文件夹名字。project 日志模型保存的文件夹中的上一级文件夹的路径。workers dataloader中的workers数量。single-cls 是否把所有类别当做一个类别去训练。就是不分类别的意思。multi-scale 多尺度训练。

对于大部分项目,我们只需要关注weights,cfg,epochs,batch-size,img-size这几个参数即可,其中weights与cfg需要相匹配,就是你选择yolov7-tiny的配置文件,你就要选择yolov7-tiny的权重,如下图所示: 那么我们就可以开始训练,其中我们这里就使用yolov7-tiny进行演示,如果需要训练其他模型,请自行更改–weights和–cfg参数的路径即可,有一个点注意的就是目前的这个train.py只支持训练yolov7-tiny,yolov7,yolov7x这三个模型: 其他的模型是要在另外一个训练脚本train_aux.py中训练,我们下边会进行演示,我们的参数设置如下: 然后运行train.py文件即可,接下来就是漫长的训练时间,当训练结束后,我们可以在控制台看到以下信息: 其中最后会输出训练时间,精度指标,保存的模型路径和大小。

训练-train_aux.py

首先这个脚本文件所训练的模型都是比较大的,一般没有服务器的话可能就训练不起来,这个操作上跟train.py一模一样,只是cfg和weights只支持下面的这些模型: 因为这个train_aux.py只支持训练带有p6检测层的模型,然后我们的训练参数设置如下: 主要就是修改了weights和cfg参数,因为带有p6检测层的模型都比较大,因此这里epochs只设置为50做个演示,然后我们就可以运行train_aux.py,等待训练完成即可。

–hyp参数

hyp参数是超参数的配置文件路径,对于新手来说,一般默认即可,就是不需要修改你基本都可以得到一个比较好的结果,对于想调参的看官,可以自行打开对应的文件进行修改,配置文件中每个参数官方都给出比较详细的解释。

4. 测试

第三步我们主要分别介绍了train.py和train_aux.py两个训练脚本的一些重要参数和如何使用,第四步我们主要介绍如何使用训练好的模型对我们的测试集进行计算指标。我们计算指标的脚本是test.py,下面对一些重点的参数进行讲解:

weights 训练好的模型权重路径。data 数据配置文件路径。模型就是data/data.yaml(如果你按照本博客操作的话)batch-size 测试一次迭代的数据量。img-size 测试的图像大小,一般跟训练的时候保持一致。conf-thres 目标的置信度阈值。iou-thres nms中iou阈值。task 任务类型,支持测试(train,val,test)集合,默认是test,还支持计算fps,只需要设置为speed。augment 是否采用测试阶段数据增强(TTA)。verbose 代码中注释是写显示每个类别的ap,但是实际使用起来没有区别。save-txt 是否需要把识别的结果存为txt。save-hybrid 测试的时候感觉跟save-txt没什么区别,如有了解可以留言。save-conf 是否保存置信度,需要配合save-txt一起使用。save-json 是否需要把识别结果保存为coco-json格式。name 精度指标保存的文件夹名字。project 精度指标保存的文件夹中的上一级文件夹的路径。 我们训练成功后可以在runs/train中的文件集里面找到以下文件: 其中weights里面都是训练保存的权重,其他的都是一些指标文件,自己可以打开看看,这里就不细讲了,都是一些比较常见的指标。 我们参数设置如下,主要就是weights的路径,这里我们选用best.pt,就是在训练过程中验证集精度最好的模型。 运行结束后,你可以看到下图: 显示的是每个类别和总体的指标和一些推理耗时信息。你还可以在runs/test中的文件夹里面找到对应的指标图像: 5. 预测

第五步就是预测脚本detect.py的教程,其大部分参数跟test.py类似,我们先解释一下重点的参数:

weights 训练好的模型权重路径。source 检测的数据路径。(支持图像,文件夹(里面是存放图片),视频)img-size 测试的图像大小,一般跟训练的时候保持一致。conf-thres 目标的置信度阈值。iou-thres nms中iou阈值。augment 是否采用测试阶段数据增强(TTA)。verbose 代码中注释是写显示每个类别的ap,但是实际使用起来没有区别。save-txt 是否需要把识别的结果存为txt。save-conf 是否保存置信度,需要配合save-txt一起使用。name 精度指标保存的文件夹名字。project 精度指标保存的文件夹中的上一级文件夹的路径。

我们的参数设置如下: 那么我们跟使用test.py一致,也是用best.pt进行检测,source我们设置为测试集的图片路径。运行完成后,你可以在runs/detect文件夹中找到对应保存的图像数据。

6.后续

后续还会更新实用性比较高的基于yolov7的口罩检测项目(带pyqt界面,训练数据集更加大,检测效果更加好),可以用作课程项目或者毕业设计等等,请各位多多关注。 代码数据集模型链接

如果内容对你有帮助,麻烦点个赞,谢谢!有计算机视觉合作项目可以私信作者!
本文链接地址:https://www.jiuchutong.com/zhishi/290676.html 转载请保留说明!

上一篇:科西嘉岛上的Speloncato市,法国 (© Jon Ingall/Alamy)(科西嘉岛攻略)

下一篇:cocos入门3:脚本编程(cocos creator脚本开发指南)

  • v460593798(v460 联想)

    v460593798(v460 联想)

  • 微信朋友圈显示位置怎么设置(微信朋友圈显示地址怎么设置)

    微信朋友圈显示位置怎么设置(微信朋友圈显示地址怎么设置)

  • 华为手机语音助手怎么一喊就出来(华为手机语音助手怎么关闭)

    华为手机语音助手怎么一喊就出来(华为手机语音助手怎么关闭)

  • 苹果13怎么设置右侧左滑返回(苹果13怎么设置来电闪光灯)

    苹果13怎么设置右侧左滑返回(苹果13怎么设置来电闪光灯)

  • 红米耳机左耳连不上(红米耳机左右连接)

    红米耳机左耳连不上(红米耳机左右连接)

  • 无推广中单元是什么意思(无推广中单元被驳回怎么解决)

    无推广中单元是什么意思(无推广中单元被驳回怎么解决)

  • wcf是什么(wcf是什么意思手办)

    wcf是什么(wcf是什么意思手办)

  • 华为手机怎么查真伪(华为手机怎么查询生产日期)

    华为手机怎么查真伪(华为手机怎么查询生产日期)

  • 苹果x硬性oled柔性oled区别(苹果x柔性oled屏幕怎么样)

    苹果x硬性oled柔性oled区别(苹果x柔性oled屏幕怎么样)

  • 系统测试的目的和意义

    系统测试的目的和意义

  • opporeno十倍变焦多少w快充(opporeno十倍变焦版手机)

    opporeno十倍变焦多少w快充(opporeno十倍变焦版手机)

  • 淘宝上明明写了备注却没有了(淘宝上明明写了备注却没有了显示?)

    淘宝上明明写了备注却没有了(淘宝上明明写了备注却没有了显示?)

  • 路由器连接猫网线接法(路由器连接猫网络灯一直闪)

    路由器连接猫网线接法(路由器连接猫网络灯一直闪)

  • oppo手机密码忘记了怎么弄(oppo手机密码忘了怎么强制解开)

    oppo手机密码忘记了怎么弄(oppo手机密码忘了怎么强制解开)

  • 美团怎么能异地点餐(美团怎么能异地下单)

    美团怎么能异地点餐(美团怎么能异地下单)

  • vivo手机显示hd是什么意思(vivo现实hd)

    vivo手机显示hd是什么意思(vivo现实hd)

  • 荣耀20可以屏幕解锁吗(荣耀20可以屏幕指纹解锁吗)

    荣耀20可以屏幕解锁吗(荣耀20可以屏幕指纹解锁吗)

  • 蓝牙耳机的使用方法及步骤(蓝牙耳机的使用范围是多少)

    蓝牙耳机的使用方法及步骤(蓝牙耳机的使用范围是多少)

  • switch可以连笔记本屏幕吗(switch可以连笔记本屏幕吗hdmi)

    switch可以连笔记本屏幕吗(switch可以连笔记本屏幕吗hdmi)

  • 萌推有成功退款的吗(有没有人在萌推退款成功)

    萌推有成功退款的吗(有没有人在萌推退款成功)

  • 怎么拦截网络电话(怎么拦截网络电话虚拟号码)

    怎么拦截网络电话(怎么拦截网络电话虚拟号码)

  • 抖音下载的游戏在哪(怎么把抖音里的游戏卸载掉)

    抖音下载的游戏在哪(怎么把抖音里的游戏卸载掉)

  • Cannot read properties of undefined (reading ‘validate‘)“(cannot read properties null)

    Cannot read properties of undefined (reading ‘validate‘)“(cannot read properties null)

  • 生产调味料用什么手续
  • 增值税纳税义务发生时间的规定
  • 财务软件交多少钱印花税
  • 库存股增加为什么资产减少
  • 个体如何申请电子公章流程
  • 其他货币资金的科目编码
  • 年数总和法怎么做
  • 增值税发票什么时候认证
  • 以不动产投资入股增值税
  • 工业企业会计报告
  • 小规模纳税人进项发票怎么做账
  • 物业公司收到开发代付物业管理费怎么做账
  • 报销跨月还能报销吗
  • 缴纳增值税金税率是多少
  • 外币报表折算差额在会计报表中应作为
  • 个人出租房屋税率表2023年
  • 二甲醚增值税税率9%
  • 计提的管理费用要结转吗
  • 物业收取的滞纳金怎么算
  • 销售返点的账务处理及税务处理
  • 投资利润率的计算结果不受建设期的长短
  • 行政罚款计入什么会计科目
  • 租赁合同未付款生效吗
  • 小规模开3%专票可享受减免
  • 会议费 报销
  • 应付账款转营业外收入需要什么条件
  • 土地使用权出让金收费标准
  • 预计毛利率
  • Win11怎么隐藏底部
  • 网关设置
  • 没收到windows11更新
  • 成品油企业自用油需要开具发票吗
  • PHP:Memcached::deleteByKey()的用法_Memcached类
  • 无人蹭网 网络还不好
  • 雄性和雌性的匹配
  • 缴纳水利建设基金计入什么科目
  • 已失效是什么意思
  • 个体工商户经济类型是内资吗
  • css代码基础
  • 发票纳税识别号和名称打印出来不齐怎么回事
  • 节日购买什么礼物发放职工
  • mysql 子表
  • 财务状况简单说明
  • 单位全额承担社保能税前扣除吗
  • 增值税包括哪三种类型
  • sql server中字符串常量只能用双引号括起来
  • 申报企业所得税会计分录怎么写
  • 小规模企业增值税税收优惠政策2023
  • 扇贝的储存方式
  • 购买办公楼分期合同
  • 业务招待费可以结转下年抵扣吗
  • mysql日志的作用
  • sql优化的一般步骤
  • 海尔电脑优盘启动键
  • windows vista server
  • windows7/vista/server(no slic)
  • windows key查询
  • openeuler操作系统安装方法
  • linux系统没有yum
  • 延迟windows更新
  • 深入了解linux内核
  • 勒索病毒一般勒索多少钱
  • windows8.1crazy error
  • win10软件报错
  • win10 rs3
  • js必须掌握的
  • js仿QQ中对联系人向左滑动、滑出删除按钮的操作
  • node.js入门教程
  • nodejs websocket客户端
  • unity用鼠标控制物体移动
  • js日期格式化方法
  • javascript简述
  • jquery轮播图代码
  • django优势在哪里
  • javascript视频教程推荐
  • js 时间轴
  • javascript原理详解
  • 四川税务法人实名采集
  • 成都市水源地及饮用水的水质情况
  • 从哪个国家进口牛肉
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号