位置: IT常识 - 正文

(学习笔记一)基于YOLOv5的车辆检测项目(基训包括哪些)

编辑:rootadmin
(学习笔记一)基于YOLOv5的车辆检测项目 1.YOLOv5模型简介

推荐整理分享(学习笔记一)基于YOLOv5的车辆检测项目(基训包括哪些),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:什么叫基训,基训笔记怎么写,什么叫基训,基训技巧是什么,基础知识百度百科,基训笔记,基础知识笔记,基础知识笔记,内容如对您有帮助,希望把文章链接给更多的朋友!

YOLO能实现图像或视频中物体的快速识别,在相同的识别类别范围和识别准确率条件下,YOLO识别速度最快。YOLO有多种模型,其中最新的为V5,V5的特点是速度更快,识别准确率更高,权重文件更小,可以搭载在配置更低的移动设备上。 本次测试采用V5模型,对各种场景下的车辆类型进行批量检测,对检测结果进行分析,重点是道路车辆类别能否得到正确识别,以探讨YOLOv5模型应用于车辆检测的可行性。

2.测试环境搭建2.1下载源码

本次测试采用的是YOLOv5官网提供的最新pytorch框架下的源码,下载完成后将其解压到一个不带中文字符的文件夹下。打开源码文件夹中的requirement.txt文件夹,可以查看YOLOv5运行所需要的环境配置,其中最重要的是Pytorch和torchvision的安装与配置,最新版本的YOLOv5所需要的Pytorch版本要高于1.7.0。

2.2Anaconda与Pycharm的安装与配置

Anaconda是一个管理用于Python开发的包含不同库的虚拟环境的平台,可以高效的管理和创建适用于不同项目的Project interpret。安装完成自带一个根环境,路径在Anaconda的安装目录下,进入后可以在环境管理页面创建新环境,新环境的路径在安装目录下的envs中存储。Pycharm是一种Python IDE,可以方便的帮助用户在使用Python语言开发时提高效率,本项目主要使用Pycharm对源码进行修改。 这两个软件都可以在官网上下载安装,因为本项目使用的Python版本为3.8,对应的Anaconda版本为Anaconda3,安装结束后进入Anaconda Prompt中建立虚拟环境。使用指令

conda create --name pytorch python=3.8

创建一个名称为pytorch,Python版本为3.8的虚拟环境,然后使用指令activate pytorch激活该虚拟环境,当指令行前面括号内由base变为pytorch时,表示该虚拟环境被激活。

2.3CUDA与CUDNN的安装与配置

CUDA是显卡厂商 NVDIA推出的运算平台,CUDA是一种由NVDIA推出的通用并行计算架构,使该架构GPU能够解决复杂的计算问题。CUDNN是用于深度神经网络的GPU加速器。 首先需要将电脑的显卡驱动升级至最新版本,在NVDIA控制面板中查看支持的最高版本的CUDA,打开NVDIA控制面板-帮助-系统信息-组件,可以查看到该版本下支持的最高版本CUDA为10.2.

在官网下载对应版本的CUDA以及CUDNN,安装CUDA结束后更改路径,在电脑的高级系统设置-环境变量-Path中新建环境变量,将

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.1\lib\x64C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.1

两个路径添加进Path中。

将CUDNN解压后,将其中的所有内容复制到以下路径中:

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1

打开cmd输入nvcc -V验证CUDA是否安装成功,出现下面界面即为成功。

2.4Pytorch和torchvision的安装与配置

在官网上下载适合自己电脑的Pytorch和torchvision版本,这两个软件需要与CUDA和python版本对应。我的环境对应的版本如下图所示:

(学习笔记一)基于YOLOv5的车辆检测项目(基训包括哪些)

下载完成后需要进入Anaconda Prompt的虚拟环境中,找到文件对应的路径,安装这两个软件,这里我们使用镜像源来加速安装,采用离线安装的方式,在cmd中输入指令:

pip install 包名 -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com

安装结束后打开python,输入下图所示的指令,没有报错且最后输出为Ture,则安装完成。

2.5其他配置文件的安装

将Pytorch和torchvision安装完成后,最后只需将YOLOv5文件中requirement.txt中剩余的库安装完成就结束了。将requirement.txt文件中的torch和torchvision注释掉,依次安装剩余的库。 安装完成后进入到YOLOV5的官网中下载权重文件,考虑到计算机的性能,本项目使用yolov5s.pt权重文件,下载完成后将权重文件放入./weights文件夹下。

2.6Yolov5运行测试

至此yolov5所需要的环境就全部搭建完成了,然后测试YOLOv5是否能正常运行。我们进入Anaconda Prompt的虚拟环境中,进入YOLOv5的文件路径下,输入指令:

python detect.py

若没有报错则安装成功。

3.测试数据和结果3.1数据集的准备与源码修改

数据集可以使用labelimg进行手工标注,但考虑到手工标注的工作量巨大,这里我们使用网上的公共数据集。我们进入https://public.roboflow.com/object-detection官网寻找合适的公开数据集,这里我们选用车辆数据集,将其下载下来。每个数据集中包含test、train和valid三个文件夹,分别对应测试、训练和验证数据集,每个数据集包含images和labels两个文件夹,分别对应图片集和标签集。其中测试集有63张图片,训练集有878张图片,验证集有125张图片,数据集共标注5中车辆类型,分别对应Ambulance、Bus、Car、Motorcycle和Truck。

我们在yolov5\yolov5-master\data下面新建一个coco文件夹,用于存放图片集和标签集,在coco文件夹下面新建images和labels文件夹,然后在这两个文件夹下面再新建两个文件夹train2017和val2017分别用于存放训练集和验证集的图片和标签。

数据集设置完成后,我们对yolov5的源码进行修改,主要修改的是yolov5\yolov5-master\data\coco128.yaml文件和yolov5\yolov5-master\models\yolov5s.yaml文件。其中coco128.yaml文件修改类别数量nc后面的数值和类别名称name后面对应的标签名称;yolov5s.yaml文件修改类别数量nc后面的数值。

将源码修改结束后就可以开始对数据集进行训练了,在yolov5路径下输入指令

python train.py --img 640 --data data/coco128.yaml --cfg models/yolov5s.yaml --weights weights/yolov5s.pt --batch-size 2 --epochs 100

进行训练,其中由于电脑性能限制,我们设置batch-size为2,num-worker为0,epoch次数设置为100,以便获得更高的识别准确度。 训练结束后会自动生成last.pt和best.pt两个权重文件,之后我们会使用这两个权重文件进行图像推断测试和视频推断测试。

3.2推断测试

我们使用65张图片和1个手机拍摄的视频进行推断测试,这些数据都没有在训练集和验证集中出现过,以此来测试识别的准确性。使用best.pt权重文件进行推断测试,部分测试结果如下图所示:

4.测试分析4.1YOLOv5车辆检测的优势

总体来说识别车辆准确,适应性强。具体表现如下: 1.对于多车不会漏检,面向镜头的车辆无论是车头、车位还是车身都能被检测到; 2.只出现一部分的车身也能被检测到,但是也要看是否能体现车辆特征; 3.光线强弱对检测影响不大,只要车辆特征明显都可以被检测到。

4.2YOLOv5车辆检测存在的问题

测试中发现了很多问题,主要分为以下几类: 1.存在漏检,某些明显车辆未能检测到; 2.对于距离较远的车辆可能会出现检测不到或者检测准确度较低; 3.车辆错误识别为其他种类; 4.数据集太小,最终识别的准确度不是很高。

5.结论

这个项目表明:对于道路车辆的识别,如果速度和准确度达到实用程度,那么计算机视觉可以用于车辆监测、自动驾驶等。该模型在数据集不大的情况下仍能取得不错的性能,即使对于复杂路况条件下的车辆识别,也能获得良好的检测结果。然而现有模型的局限性可以通过增大调整数据集和使用性能更好的计算机得到解决。

本文链接地址:https://www.jiuchutong.com/zhishi/298261.html 转载请保留说明!

上一篇:前端学习笔记(14)-Vue3组件传参(前端 教程)

下一篇:vscode里面使用vue的一些插件,方便开发(vue vscode snippets)

  • 淘宝登录密码忘记了怎么修改密码(淘宝登录密码忘了怎么改新密码)

    淘宝登录密码忘记了怎么修改密码(淘宝登录密码忘了怎么改新密码)

  • 荣耀X30Max跑分

    荣耀X30Max跑分

  • 提供app内购买项目什么意思(提供app内购买项目是什么意思)

    提供app内购买项目什么意思(提供app内购买项目是什么意思)

  • 小天才z1s能打字吗(小天才zis可以打字吗)

    小天才z1s能打字吗(小天才zis可以打字吗)

  • qq分享屏幕是什么意思(qq分享屏幕是什么功能)

    qq分享屏幕是什么意思(qq分享屏幕是什么功能)

  • 水印相机图片保存失败是什么原因(水印相机图片保存失败苹果手机)

    水印相机图片保存失败是什么原因(水印相机图片保存失败苹果手机)

  • 华为耳机freebuds3可以同时连两个手机吗(华为耳机freebuds3怎么连接)

    华为耳机freebuds3可以同时连两个手机吗(华为耳机freebuds3怎么连接)

  • huawei share是什么(华为share是什么技术)

    huawei share是什么(华为share是什么技术)

  • 电池坏了有什么现象(电池坏了对人体有伤害吗)

    电池坏了有什么现象(电池坏了对人体有伤害吗)

  • 苹果关机充电自动开机(苹果关机充电自动重启)

    苹果关机充电自动开机(苹果关机充电自动重启)

  • powerpoin的主要功能是(powerpoinr)

    powerpoin的主要功能是(powerpoinr)

  • p30指纹识别不灵敏怎么办(p30指纹识别不灵怎么回事)

    p30指纹识别不灵敏怎么办(p30指纹识别不灵怎么回事)

  • i7是第几代(12核i7是第几代)

    i7是第几代(12核i7是第几代)

  • 手机闪屏怎么解决(手机闪屏怎么解决vivo)

    手机闪屏怎么解决(手机闪屏怎么解决vivo)

  • kntul10是什么型号(knt-tl10)

    kntul10是什么型号(knt-tl10)

  • 淘宝下单怎么备注留言(淘宝下单怎么备注)

    淘宝下单怎么备注留言(淘宝下单怎么备注)

  • 抖音直播点亮是么意思(抖音直播点亮灯牌怎么点亮)

    抖音直播点亮是么意思(抖音直播点亮灯牌怎么点亮)

  • 微信密码忘了手机号也换了怎么登录(微信密码忘了手机号停机了怎么找回)

    微信密码忘了手机号也换了怎么登录(微信密码忘了手机号停机了怎么找回)

  • 抖音放大镜效果在哪(抖音放大镜效果在哪2020)

    抖音放大镜效果在哪(抖音放大镜效果在哪2020)

  • 机械硬盘吱吱响正常吗(机械硬盘吱吱响读不出)

    机械硬盘吱吱响正常吗(机械硬盘吱吱响读不出)

  • iphone显示不支持此配件(iphone显示不支持此配件怎么办)

    iphone显示不支持此配件(iphone显示不支持此配件怎么办)

  • 西瓜视频怎么关注用户(西瓜视频怎么关闭缓存)

    西瓜视频怎么关注用户(西瓜视频怎么关闭缓存)

  • MAC装Windows时键盘失灵的两种解决方法(mac安装windows不能用键盘)

    MAC装Windows时键盘失灵的两种解决方法(mac安装windows不能用键盘)

  • 微信小程序 四种弹窗方式(微信小程序四人游戏)

    微信小程序 四种弹窗方式(微信小程序四人游戏)

  • 【Node.js+koa--后端管理系统】设计动态发布、修改、查询、删除接口(nodejs hook)

    【Node.js+koa--后端管理系统】设计动态发布、修改、查询、删除接口(nodejs hook)

  • 啥子是增值税
  • 税务行政复议包括必须复议自由复议和选择复议三种类型
  • 利润总额×12%
  • 总公司签合同发票由分公司开可以吗
  • 附加税退回分录
  • 车船税滞纳
  • 机动车销售发票是否需要认证
  • 税控服务费的账务处理
  • 收取员工宿舍租金收入要交增值税吗
  • 拿票报销的交通费要交个人所得税吗
  • 以旧换新要按商品价格吗
  • 税控盘未上传发票查询
  • 职工福利费发票开票范围
  • 购买股权属于什么科目
  • 华为p60pro上市时间是几月
  • 企业支付方式有几种
  • 积分兑换步骤
  • kb5001028补丁
  • macos15关闭sip
  • win10要更新系统
  • 组策略阻止了这个程序0x800704ec
  • 企业向股东发放现金股利会引起
  • 建筑企业总包方都有哪些印花税
  • 盈余积累转增股本什么意思
  • php示例代码大全
  • 森林中的结香花,日本 (© nattya3714/Getty Images)
  • php 上传文件
  • 前端部署发布项目有哪些
  • web前端视频教程全套
  • 机器学习分类算法之XGBoost(集成学习算法)
  • man-s命令
  • 锁定vlookup快捷键
  • python怎么设置字符串宽度
  • 社保和公积金在不同单位交可以吗
  • python根据键输出值
  • 织梦如何使用不侵权
  • sql存储过程几个主要步骤
  • 劳务公司属于什么
  • 餐饮服务需要卫生许可证吗
  • 出售固定资产不能作为企业的收入
  • 已经认证抵扣的发票怎么红冲
  • 解决在sql脚本中怎么写
  • 个人所得税中的速算扣除数是什么意思
  • 国债利息收入计入什么会计科目
  • 小规模减免附加税会计分录怎么做
  • 失业保险金领取多少钱
  • 金融企业里面的债务
  • 现金流量明细表怎么看
  • 会计估计变更和政策变更有哪些
  • 预收账款可以长期挂账吗
  • 给客户买的礼品要交税吗
  • 出售无形资产取得的收入计入什么科目
  • 国税一证通
  • 进口货物只有报关单能入账吗
  • 贷款应提准备的资料包括
  • 非本公司员工能否享受本公司的福利
  • 期末自动结转期间损益
  • 磁盘碎片 win7
  • xp电脑工作组找不到其他电脑
  • xp系统怎么升级版本
  • linux wk
  • 使用组策略可控制什么
  • win7系统怎么关闭放大镜?
  • win8怎么外接屏幕
  • win8如何安装
  • linux一键安装软件
  • win 7怎么设置开机启动
  • jquery deferred对象
  • unity ulua
  • list嵌套list采用什么结构
  • unity unite
  • javascript图表
  • 税务局着装规定文件
  • 发票查验结果怎么保存
  • 广州契税补贴2022政策
  • 浙江省个体工商户税收政策
  • 河南运输客票查询管理条例
  • 马尼拉清关HS几位
  • 雅加达购物必买的东西
  • 城市建设维护税减免政策
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设