位置: IT常识 - 正文

YOLO-V5轻松上手(yolo v5超详细解析)

编辑:rootadmin
YOLO-V5轻松上手

推荐整理分享YOLO-V5轻松上手(yolo v5超详细解析),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolo v5详解,yolo v5,yolo v5详解,yolo v5,yolov5s,yolo v5超详细解析,yolo v5,yolo v5超详细解析,内容如对您有帮助,希望把文章链接给更多的朋友!

之前介绍了YOLO-V1~V4版本各做了哪些事以及相较于之前版本的改进。有的人或许会想“直接学习最近版本的算法不好吗”,在我看来,每一个年代的版本/算法都凝聚着当年学术界的智慧,即便是它被淘汰了也依旧有值得思考的地方,或是可以使我们对后续算法的改进/提出的缺点有更深的理解,进而“凝百家之长”真正开出道花结出道果有自己的感悟。

V4出现后,紧接着V5版本就出现了,相比于之前版本,V5出现时没有论文去介绍它怎么做的。V5像是把V4做了更好的实现,即思想算法上没有太大的变化,更像是一个“实际的偏工程的项目”。直到如今YOLO-V5也十分经典。

本文与前几篇主讲算法不同,本文教大家如何下载和使用YOLO-V5。

有时间的话我会从其源码的角度进行一遍梳理(或许吧不懒的话)。

前面也说过了具体算法和流程与V4无太大区别,主要是更好的实现。

一、YOLO-V5下载

ultralytics/yolov5: YOLOv5 🚀 in PyTorch > ONNX > CoreML > TFLite (github.com)

点击上方链接直接下载即可,下载完成后解压,打开Pycharm新建一个目录,

下载requirements里面的依赖

pip install -r requirements.txt

值得一提的是YOLO-V5要配合python>=3.7,pytorch>=1.7的版本使用,会用到里面的优化算法,所以大家自行选择一个更高的版本吧。

比如我这里直接选择anaconda里之前下载的torch1.10。

二、下载、配置数据集和下载预训练模型2.1 下载数据集

他这里用的是COCO数据集,这玩意比较大我们也没必要下载了,下载个小的玩一玩

可以去这里:Computer Vision Datasets (roboflow.com),下载物体检测相关的数据集,样式比较丰富,如检测汽车的、象棋的、动物的、人脸的等等。

以口罩数据集为例,大家也可以下载自己喜欢的,点击Mask Wearing Dataset,进去下载就行了。

下载时会提示你选择格式:

下载完成后和V5放在同一级目录就行

以train里的文件为例:

images则是训练所需的图片

labels里则是对应名字图片的标签值,如下1表示没戴口罩,戴了就是0,剩下四个则是"框的坐标"。

当然有的有很多行,毕竟一张图片里可能有很多人。找的越全recall越高,越精准accuracy越高,整体mAP越高。

后续第一次去读数据的时候还会自动生成labels.cache缓存文件,方便后续读取。

2.2 配置数据集

点开data.yaml,可以看到train和val的相对路径,到时候YOLO代码会直接读取,自己记得确认一下路径是否正确,路径问题比较基础这里就不讲了。

如果要做test就把test路径写进去就行。

nc指类别的个数,戴口罩和不带口罩,['mask', 'no-mask']

2.3 下载预训练模型

咱们简单下载个5s就行了,https://github.com/ultralytics/yolov5/releases/download/v7.0/yolov5s.pt

下载完成后放到yolov5-master文件夹里。

三、配置demo参数

参考这里:

--data ../MaskDataSet/data.yaml

YOLO-V5轻松上手(yolo v5超详细解析)

--cfg models/yolov5s.yaml

--weigths ./yolov5s.pt

--batch-size 24

我们之前下载了预训练模型yolov5s.pt,用的话就加上,不用就--weights ''

当然还有一些参数可选,源码里有默认值,我们先用这些。

四、训练

做好上面那些后,在yolov5-master的train.py里直接run就行了。

刚开始可能报错,我看是他第一次执行,会去github上下载标记字体,然后没连接进去。

解决办法就是自己点进去那个报错下载的连接自己下载就行了,下载完放到上面那个文件夹里。

之后再进行run,它默认会跑100个epoch,也可以自己设置。

这里就训练完了

上图告诉你 结果在runs\train\exp23那里,即最后最新跑的一次。

可见生成了权重文件和一些图片。

results.csv里面是一些标注和统计数据,至于生成的图片这里简单展示几个:

五、检测

进入detect.py 直接右键run的话,由于下载的yolov5-master的时候它自带测试图片和权重文件,也填写了默认路径,所以不会报错;

直接跑的话你会看到结果里:

这和我们刚刚train那步没有一点关系,都是它自带的一开始不用训练就能玩的。

我们活学活用,刚刚训练的是是否戴口罩,所以我们不妨也自己改一下参数:

其中 -- source 后可以是图片 视频 文件夹 路径url等

我这里让它测试有没有戴口罩,就用上面这两张图片的路径吧即不修改source了;

不过我在里面又加了两张图片

修改参数:

--weights ./runs/train/exp23/weights/best.pt

--conf 0.4

--data ./MaskDataSet/data.yaml

这里我修改了权重文件 毕竟之前用的是自带的yolov5s.pt,而这个best.pt是我们通过自己下载的预训练模型yolov5s.pt的基础上训练出来的用于检测是否带口罩了的权重文件。 conf是置信度,想改就改。

run完后发现实际效果还行,但黑人那里不行

不过毕竟我们训练的数据就100多张,里面我看了也没有黑人,情有可原,它可能在面部颜色差异上占比很大。

我又找了几张试了试 发现就是数据的问题

不过问题不大,我们本次的目的就是先学会简单使用他们的代码。

可以把source那里换成视频玩一玩试一试。

六、题外话

希望本篇文章能够对你有所帮助,如果你是连GPU版本的torch都还没下载过的小白建议一步步来。

大家也可以换点别的数据集、参数来自己跑一跑玩一玩,同时感兴趣的小伙伴也可以开始在了解其算法的情况下简单读读源码了,我下一期或许会写一篇V5的源码引导文章。

本文链接地址:https://www.jiuchutong.com/zhishi/295252.html 转载请保留说明!

上一篇:Yolov7模型训练与部署(yolov3模型训练)

下一篇:圣安德鲁斯湾岸边的三只王企鹅,南乔治亚岛 (© Paul Souders/Getty Images)(圣安德鲁斯市)

  • 战胜拖延症的秘笈(战胜拖延症的好处)

    战胜拖延症的秘笈(战胜拖延症的好处)

  • 三相电不平衡怎么调整(三相电不平衡怎么快速判断)

    三相电不平衡怎么调整(三相电不平衡怎么快速判断)

  • ipadpro有几款(ipad pro有几个系列)

    ipadpro有几款(ipad pro有几个系列)

  • 苹果订阅无法连接(苹果订阅无法连接是啥问题)

    苹果订阅无法连接(苹果订阅无法连接是啥问题)

  • iphone6s黑屏开不了机(iphone6s黑屏开不了机怎么修)

    iphone6s黑屏开不了机(iphone6s黑屏开不了机怎么修)

  • 电脑主机泡水还能用吗(主机泡水了)

    电脑主机泡水还能用吗(主机泡水了)

  • 手机qq屏幕共享怎么播放声音(手机qq屏幕共享怎么用)

    手机qq屏幕共享怎么播放声音(手机qq屏幕共享怎么用)

  • 用电脑登录微信能看到聊天记录吗(用电脑登录微信手机怎样不被发现)

    用电脑登录微信能看到聊天记录吗(用电脑登录微信手机怎样不被发现)

  • 适应边框打印是什么意思(适应边框打印是不是无边框是什么意思)

    适应边框打印是什么意思(适应边框打印是不是无边框是什么意思)

  • 华为jdn2-al50是什么型号(华为jdn2-al50是什么尺寸)

    华为jdn2-al50是什么型号(华为jdn2-al50是什么尺寸)

  • 抖音如何提高播放量(抖音如何提高播放次数)

    抖音如何提高播放量(抖音如何提高播放次数)

  • 回收箱里删除的东西可以恢复吗(回收箱里删除的文件)

    回收箱里删除的东西可以恢复吗(回收箱里删除的文件)

  • 账号异常一般多久恢复(帐号异常)

    账号异常一般多久恢复(帐号异常)

  • 公众号违规记录多少次封号(公众号违规记录id是什么)

    公众号违规记录多少次封号(公众号违规记录id是什么)

  • 华为录屏功能不见了(华为屏幕录制不好使了怎么办)

    华为录屏功能不见了(华为屏幕录制不好使了怎么办)

  • 斗鱼的荧光棒可以放多久(斗鱼的荧光棒可以叠加吗)

    斗鱼的荧光棒可以放多久(斗鱼的荧光棒可以叠加吗)

  • 窗体中的窗体称为什么(窗体中的窗体称什么)

    窗体中的窗体称为什么(窗体中的窗体称什么)

  • ip68防水什么概念(ip68防水价值多少钱)

    ip68防水什么概念(ip68防水价值多少钱)

  • 快手标签是什么意思(快手标签是什么意思图片)

    快手标签是什么意思(快手标签是什么意思图片)

  • 怎么清手机内存垃圾清理(怎么清手机内存垃圾)

    怎么清手机内存垃圾清理(怎么清手机内存垃圾)

  • 苹果xr的来电铃声怎么调大(苹果xr的来电铃声怎么调)

    苹果xr的来电铃声怎么调大(苹果xr的来电铃声怎么调)

  • qq消息免打扰对方会知道吗(QQ消息免打扰对方打视频过来会响吗)

    qq消息免打扰对方会知道吗(QQ消息免打扰对方打视频过来会响吗)

  • 小米m1804e4a是什么型号(小米m1804e4a是什么型号几多钱)

    小米m1804e4a是什么型号(小米m1804e4a是什么型号几多钱)

  • 帝国cms会侵权吗(帝国cms会侵权吗为什么)

    帝国cms会侵权吗(帝国cms会侵权吗为什么)

  • 递延所得税负债账务处理
  • 小规模纳税人的企业所得税税率
  • 药酒消费税计税依据
  • 一般纳税人进项销项抵扣如何做账
  • 个人提供建筑安装劳务如何缴纳个人所得税
  • 政府补贴营业外收入所得税汇算清缴需要调增吗
  • 原材料暂估入库的账务处理有哪些
  • 附加免税额是什么
  • 销售净水器营业执照范围
  • 工资3700扣多少社保钱
  • 自己提供原材料让别人加工
  • 税金及附加包括个人所得税吗
  • 远期汇票分为哪几种
  • 贷款公司收取服务费是诈骗吗
  • 计提公司所得税分录
  • 关联方转移定价注意问题
  • 个人营业执照怎么注销网上申请流程
  • 进项税留抵需要转出吗
  • 专项储备期末有余额吗
  • 电子承兑如何转出换成现金
  • 游乐场门票收入发票品目
  • 鸿蒙系统如何添加信任软件
  • 什么叫市净率?它有何意义?
  • 错账按产生原因来看有两种
  • perl.exe是什么程序?
  • deepin 终端命令
  • PHP:mb_strrpos()的用法_mbstring函数
  • 应收账款怎么做分录
  • 若依框架搭建
  • wamp设置
  • the模板引擎
  • 送货上门需要其他费用吗
  • SSD目标检测算法
  • 资产负债表应收账款怎么计算
  • wordpress jquery
  • 一个月可以勾选多少进项税额
  • 撰写广告
  • 长期股权投资大白话解释
  • 如何查看sqlserver实例名称
  • 发票收款人和复核人在哪儿政
  • 三免三减半如何申报
  • 商家下单
  • 暂估成本跨年后收到票可以直接附在暂估凭证
  • 委托加工物资的成本包括
  • 什么叫印花税税率
  • 企业库存现金的限额是
  • 盈余公积提取多了
  • 收到银行承兑汇票怎么处理
  • 公司收到虚开发票
  • 支付临时工人的报酬属于工资薪金概算吗
  • 企业代扣税费会计分录
  • 行政单位收到的待报解预算收入怎么做账
  • 电子税务局申报流程
  • 讲课费需要提供发票吗
  • 关联交易定价方法包括
  • 财政性银行的资金来源是什么
  • winxp系统如何设置禁用磁盘检测功能
  • xp系统运行怎么打开
  • solaris删除文件命令
  • winpe安装步骤
  • windows7中ie浏览器怎么打开
  • Fatal server error: could not open 无法进图形界面的解决办法
  • cocos2dx 3.0 beta android环境配置
  • shader cull
  • js筛选器
  • 搭建nodejs
  • python根据ip获取主机名
  • unity3d bim
  • ffmpeg webui 0.9.6
  • python求解析解
  • 使用js检测浏览器的网站
  • 检测ip地址命令
  • 转换什么
  • 超级给力的好人有哪些
  • js过滤filter
  • Jquery uploadify上传插件使用详解
  • javascript的含义和作用
  • jQuery中Ajax全局事件引用方式及各个事件(全局/局部)执行顺序
  • 怎么查税务是否实名认证
  • 天津本田天虹90摩托车库存
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设