位置: IT常识 - 正文

基于yoloV7添加关键点训练记录(yolov5 教程)

编辑:rootadmin
基于yoloV7添加关键点训练记录 一 、前言

推荐整理分享基于yoloV7添加关键点训练记录(yolov5 教程),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolov4如何改进,yolov3怎么改进,yolov3使用教程,yolov3怎么用,yolov4 教程,yolov教程,yolov教程,yolov教程,内容如对您有帮助,希望把文章链接给更多的朋友!

yoloV7已经开源有一段时间了,近期已经基于yoloV7-pose的关键点算法进行了研究和修改。目前已经将该工程修改为,多分类+任意数量关键点:修改详细请看博客:基于yoloV7-pose添加任意关键点 + 多类别分类网络修改,修改代码已经开源:github地址,如果对大家有帮助也希望可以帮忙点点☆☆。 好的,接下来我们就开始训练模型。

二 、 数据准备2.1 数据介绍。

很多小伙伴有点不知道这些关键点怎么设置,我简单说一下逻辑,一般是检测框+关键点的形式,也就是说关键点是伴随框的,首先是希望box框可以收敛,然后再是点的收敛,所以框是必须的,然后点是非必须的,所有有些框可以不需要设置关键点,这里大家可以将关键点的值设置为-1就行, 这种关键点的标记工具可以选择labelme,对目标进行不规则四边形标记。 标记完成后图像可视化应该是这样的: 其中 第一个点是:绿色;第二个点是:蓝色;第三个点是:红色;第四个点是:白色。点的顺序是否需要有标准,我个人觉得是需要的,部分任务可能不需要,但目前我发现都是需要注意点的顺序的。 标记完成的内容,依次转化成txt文档:

# -nfs-阿拉伯车牌字符-沙特阿拉伯卡口车牌-2-沙特阿拉伯卡口车牌-2-image1837.txt# data.txt 含义分别是: cls x y w h point1xpoint1ypoint2x point2y point3x point3y point4x point4y ...# 类别 目标中心点x 目标中心点y 目标宽w 目标高h 目标点1x坐标 目标点1y坐标 目标点2x坐标 目标点2y坐标 目标点3x坐标 目标点3y坐标 目标点4x坐标 目标点4y坐标 依次类推 0 0.5739299610894941 0.1724137931034483 0.3715953307392996 0.29064039408866993 0.38910505836575876 0.08374384236453201 0.7587548638132295 0.029556650246305417 0.7607003891050583 0.2660098522167488 0.39299610894941633 0.32019704433497537 2 0.5739299610894941 0.1724137931034483 0.3715953307392996 0.29064039408866993 0.38910505836575876 0.08374384236453201 0.7587548638132295 0.029556650246305417 0.7607003891050583 0.2660098522167488 0.39299610894941633 0.32019704433497537 0 0.5739299610894941 0.1724137931034483 0.3715953307392996 0.29064039408866993 0.38910505836575876 0.08374384236453201 0.7587548638132295 0.029556650246305417 0.7607003891050583 0.2660098522167488 0.39299610894941633 0.32019704433497537

注意: 第1个值:类别索引,如果是单类别,这里值都为0 第2个值:目标框的中心点坐标x值, 第3个值:目标框的中心点坐标y值, 第4个值:目标框的宽度w, 第5个值:目标框的高度h, 第6个值:第1个关键点的x坐标,如果该关键点省去,设置坐标为-1 第7个值:第1个关键点的y坐标,如果该关键点省去,设置坐标为-1 第8个值:第2个关键点的x坐标,如果该关键点省去,设置坐标为-1 第9个值:第2个关键点的y坐标,如果该关键点省去,设置坐标为-1 第10个值:第3个关键点的x坐标,如果该关键点省去,设置坐标为-1 第11个值:第3个关键点的y坐标,如果该关键点省去,设置坐标为-1 第12个值:第4个关键点的x坐标,如果该关键点省去,设置坐标为-1 第13个值:第4个关键点的y坐标,如果该关键点省去,设置坐标为-1 … 后面依次是关键点的坐标值

2.1 修改数据yaml文件:

这里是读取数据的txt文档,所以传入图片路径txt文件即可,其中txt文档书写如下:

# train.txt./train/images/-nfs-阿拉伯车牌字符-沙特阿拉伯卡口车牌-2-沙特阿拉伯卡口车牌-2-image1837.jpeg./train/images/-nfs-车牌字符-埃及车牌-埃及车牌截图-2021-04-30 11-11-52屏幕截图.png./train/images/-nfs-车牌字符-埃及车牌-埃及车牌截图-2021-04-30 13-57-27屏幕截图.png./train/images/-nfs-车牌字符-埃及车牌-埃及车牌截图-2021-04-30 10-19-54屏幕截图.png./train/images/-nfs-阿拉伯车牌字符-外国车牌现场_20210519_1-外国车牌现场_20210519_1-e0d92b0990a1249388bc77bdfa8e43ed.jpg./train/images/-nfs-车牌字符-埃及车牌-埃及车牌截图-2021-04-30 13-51-28屏幕截图.png./train/images/-nfs-车牌字符-约旦车牌-videoplayback-videoplayback_13_1460.jpg./train/images/-nfs-车牌字符-埃及车牌-埃及车牌截图-2021-04-30 13-56-51屏幕截图.png./train/images/-nfs-车牌字符-埃及车牌-埃及车牌截图-2021-04-30 10-27-50屏幕截图.png

这里读取数据是 : txt前面的作为根目录,加上txt文档里面的路径, 所以图片的完整路径是这样存放的:

# txt前面的作为根目录,加上txt文档里面的路径,# 所以图片的完整路径是这样存放的: /media/wqg/3e165c12-9862-4867-b333-fbf93befd928/home/wqg/data/官网数据/PLATE/train/images/-nfs-阿拉伯车牌字符-沙特阿拉伯卡口车牌-2-沙特阿拉伯卡口车牌-2-image1837.jpeg基于yoloV7添加关键点训练记录(yolov5 教程)

传入txt文档即可开始训练了。记得修改nc的类别数量和对应的名称

三 、开始训练

训练代码使用的是:./yolov7-pose_Npoint_Ncla/train_Ncla_nPoint.py

3.1 修改模型结构yaml文件

设置关键点的数量,默认是以4个关键点进行训练,类别数量默认是读取数据文件中的nc值。

3.2 数据准备好了就可以开始训练了

分别传入预训练权重,模型配置文件,修改好的数据文件,hyp文件,训练批次,训练尺寸等等。

权重链接:百度云链接 : https://pan.baidu.com/s/1izQzp7G5-tncRKtMTEyrUA 提取码: t82o。建议: hyp文件中大家不要开上下翻转和左右翻转,会有可能导致关键点混乱。左右翻转是按照,1和2,3和4,5和6,7和8进行交换,上下翻转没有写翻转逻辑,建议不用,用的话需要自己修改代码。

训练开始,大家可以看到图像的每个关键点都是正确的:

四 、 训练结果

这里我只是训练了100个eopch,数据也只是添加了500多张,

可以使用 tensorboard查看训练日志

训练推理结果:

推理代码:./yolov7-pose_Npoint_Ncla/detect.py

五、常见问题(粉丝问题)数据增强部分索引错误

关键点的数量建议是偶数个,如果是基数个,需要改一下代码,或者去掉左右翻转和上下翻转。
本文链接地址:https://www.jiuchutong.com/zhishi/297604.html 转载请保留说明!

上一篇:梯度下降算法(Gradient descent)(梯度下降算法的正确顺序是)

下一篇:opencv训练自己的模型,实现特定物体的识别(opencv训练模型教程)

  • 关于品牌商的那些心照不宣的广告套路(关于品牌的表述)

    关于品牌商的那些心照不宣的广告套路(关于品牌的表述)

  • iphone怎么设置电话蓝牙接听(iphone怎么设置电话号码优先)

    iphone怎么设置电话蓝牙接听(iphone怎么设置电话号码优先)

  • 如何共享文件(不同网络的电脑如何共享文件)

    如何共享文件(不同网络的电脑如何共享文件)

  • 华为手机为什么一会亮一会暗(华为手机为什么没有5G手机了)

    华为手机为什么一会亮一会暗(华为手机为什么没有5G手机了)

  • 计算机能直接识别和执行的语言(计算机能直接识别和执行用汇编语言)

    计算机能直接识别和执行的语言(计算机能直接识别和执行用汇编语言)

  • 腾讯视频的投屏消失了(腾讯视频的投屏在哪里)

    腾讯视频的投屏消失了(腾讯视频的投屏在哪里)

  • 开飞行模式别人打电话有记录吗(开飞行模式别人打微信电话是什么状态)

    开飞行模式别人打电话有记录吗(开飞行模式别人打微信电话是什么状态)

  • 惠普装系统开机按什么键(惠普系统启动)

    惠普装系统开机按什么键(惠普系统启动)

  • 火山极速版金币兑换比例(火山极速版金币一个)

    火山极速版金币兑换比例(火山极速版金币一个)

  • 华为mate50什么时候出(华为mate50好久出)

    华为mate50什么时候出(华为mate50好久出)

  • dxf是什么意思(dxf和dwg的区别)

    dxf是什么意思(dxf和dwg的区别)

  • 滴滴打车是什么时候有的(滴滴打车是什么时候开始的)

    滴滴打车是什么时候有的(滴滴打车是什么时候开始的)

  • 华为nova5z可以插内存卡吗(华为nova5i可以插优盘吗)

    华为nova5z可以插内存卡吗(华为nova5i可以插优盘吗)

  • word怎么弄成左右两页并排(word怎么弄成左右两半)

    word怎么弄成左右两页并排(word怎么弄成左右两半)

  • flyme的初始密码(flyme的密码忘了怎么办)

    flyme的初始密码(flyme的密码忘了怎么办)

  • word文档里字间距怎么调(word文档里字间距怎么对齐)

    word文档里字间距怎么调(word文档里字间距怎么对齐)

  • vivonex3支持红外遥控吗(vivonex3s红外线在哪)

    vivonex3支持红外遥控吗(vivonex3s红外线在哪)

  • 携程订票怎么取消套餐(携程订票怎么取消订单)

    携程订票怎么取消套餐(携程订票怎么取消订单)

  • x27有防水功能吗(vivox27防水性能怎么样)

    x27有防水功能吗(vivox27防水性能怎么样)

  • 拼多多评价怎么改一下(拼多多评价怎么删除)

    拼多多评价怎么改一下(拼多多评价怎么删除)

  • reno具有osie功能吗(oppo reno有什么功能)

    reno具有osie功能吗(oppo reno有什么功能)

  • 撤销与恢复快捷键介绍(撤销与恢复快捷键分别是什么)

    撤销与恢复快捷键介绍(撤销与恢复快捷键分别是什么)

  • php常量中两种定义方式的比较(php中定义常量的函数是什么)

    php常量中两种定义方式的比较(php中定义常量的函数是什么)

  • 发票没有申报能开票吗
  • 个人在境外取得收入纳税办法
  • 应纳税所得额是利润总额吗
  • 济南非税是什么意思
  • 从租计征房产税怎么申报
  • 商业承兑汇票未到期贴现
  • 企业所得税能不能删除重新报
  • 公对公转账需要交税吗?
  • 定额发票上可以盖章吗
  • 资产负债表项目的编制方法
  • 销售商品的会计分录现金折扣
  • 车量购置税申报流程是什么样的?
  • 用于本企业职工的福利应当征收消费税吗
  • 高新企业季度企业所得税预征税率
  • 公司零星费用报销话术
  • 车间报销费用的会计分录
  • 海关进口关税专用缴款书可以抵扣增值税吗
  • 建筑业的税金计税依据
  • 小微企业季度缴税一百万退税吗
  • 2021年个人开发票税率
  • 私募投资基金投资者风险问卷调查
  • 劳务派遣服务用简易计税方法吗
  • 会议费税前扣除标准2021
  • 建筑业的一般纳税人
  • 增值税专票怎么认证
  • 总公司与分公司的税务关系怎么交税
  • 销售差异计算公式
  • 企业老板机票怎么报销记账
  • 预付的货款的发票在哪里
  • 核定征收印花税计算公式
  • 老生常谈的常是什么意思
  • 【第十一届“泰迪杯”数据挖掘挑战赛】B题产品订单的数据分析与需求预测“解题思路“”以及“代码分享”
  • 出租包装物和出售包装物有什么区别
  • 什么是对账单的回函
  • 长期待摊费用应该怎么摊销
  • 影视行业的会计好做吗
  • 不想预缴所得税能不能提前暂估费用,会计分录
  • nodejs 2020
  • scp命令 基于SSH协议远程复制文件
  • 小企业会计准则会计科目表
  • 培训机构先收费后付费
  • 已开发票作废和空白发票作废有什么不一样?
  • 企业收到税务退税通知书
  • 零申报社保是否可以报销
  • 营业利润是税前利润吗
  • 物业合并利润表怎么填
  • 一次还本付息债券定价公式
  • 小微企业预缴所得税怎么填报
  • 薪酬范围怎么写
  • 工会疗养费用怎么做账
  • 红字冲销表示负数吗
  • 企业代扣的个人所得税款收入属于哪个会计科目
  • 生产经营所得成本费用怎么算
  • 税控盘开发票怎么测试打印机?
  • 新成立的公司购买的家具可以计入主营业务成本吗
  • 企业注销未分配是从注册开始吗
  • 低值易耗品怎么做账务处理
  • 如何实现多条件查询
  • win8.1关机没反应
  • 微软6月24号
  • 电脑开机显示xp后无反应
  • win2000系统禁止ping
  • 华硕p8h61主板升级cpu
  • ntdll.dll no matching
  • javascript中的数组可以存放任何类型的数据
  • cocos2dx-3.1.1 labelttf与label
  • 不错的mod_perl编程的简单应用实例介绍
  • js实现计数
  • 怎样屏蔽锁屏广告
  • jquery-validation
  • javascript的简介
  • android 快速开发工具
  • jquery动态添加html代码
  • js手势放大缩小
  • 重大税务违法案件一案双查标准
  • 音箱海关税
  • 贵州国家税务局陈开平
  • 100万元的人民币
  • 武汉车船使用税收费标准
  • 年终奖怎么报个税
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设