位置: IT常识 - 正文

目标检测--边框回归损失函数SIoU原理详解及代码实现(目标检测标注框的规则)

编辑:rootadmin
目标检测--边框回归损失函数SIoU原理详解及代码实现 边框回归损失函数1. SIoU1.1 原理1.2 代码实现1. SIoU1.1 原理

推荐整理分享目标检测--边框回归损失函数SIoU原理详解及代码实现(目标检测标注框的规则),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:目标检测边框回归,目标检测边界框,目标检测用什么框架,目标检测斜框,目标检测斜框,目标检测画框,目标检测边框回归,目标检测的框是怎么出来的,内容如对您有帮助,希望把文章链接给更多的朋友!

有关IoU损失函数,如(GIoU, DIoU, CIoU)没有考虑到真实框与预测框框之间的方向,导致收敛速度较慢,对此SIoU引入真实框和预测框之间的向量角度,重新定义相关损失函数,具体包含四个部分: (1)角度损失(Angle cost),定义如下 Λ=1−2∗sin⁡2(arcsin⁡(chσ)−π4)=cos⁡(2∗(arcsin⁡(chσ)−π4))\Lambda = 1-2*\sin^2(\arcsin(\frac{c_h}{\sigma}) - \frac{\pi}{4})=\cos(2*(\arcsin(\frac{c_h}{\sigma}) - \frac{\pi}{4}))Λ=1−2∗sin2(arcsin(σch​​)−4π​)=cos(2∗(arcsin(σch​​)−4π​)) 其中chc_hch​为真实框和预测框中心点的高度差,σ\sigmaσ为真实框和预测框中心点的距离,事实上arcsin⁡(chσ)\arcsin (\frac{c_h}{\sigma})arcsin(σch​​)等于角度α\alphaα chσ=sin⁡(α)\frac{c_h}{\sigma}=\sin(\alpha)σch​​=sin(α) σ=(bcxgt−bcx)2+(bcygt−bcy)2\sigma = \sqrt{(b_{c_x}^{gt}-b_{c_x})^2+(b_{c_y}^{gt}-b_{c_y})^2}σ=(bcx​gt​−bcx​​)2+(bcy​gt​−bcy​​)2​ ch=max⁡(bcygt,bcy)−min⁡(bcygt,bcy)c_h = \max(b_{c_y}^{gt}, b_{c_y}) - \min(b_{c_y}^{gt}, b_{c_y})ch​=max(bcy​gt​,bcy​​)−min(bcy​gt​,bcy​​)

目标检测--边框回归损失函数SIoU原理详解及代码实现(目标检测标注框的规则)

(bcxgt,bcygt)(b_{c_x}^{gt}, b_{c_y}^{gt})(bcx​gt​,bcy​gt​)为真实框中心坐标(bcx,bcy)(b_{c_x}, b_{c_y})(bcx​​,bcy​​)为预测框中心坐标,可以注意到当α\alphaα为π2\frac{\pi}{2}2π​或0时,角度损失为0,在训练过程中若α<π4\alpha < \frac{\pi}{4}α<4π​,则最小化α\alphaα,否则最小化β\betaβ

(2)距离损失(Distance cost),定义如下: Δ=∑t=x,y(1−e−γρt)=2−e−γρx−e−γρy\Delta = \sum_{t=x,y}(1-e^{-\gamma\rho_t})=2-e^{-\gamma\rho_x}-e^{-\gamma\rho_y}Δ=t=x,y∑​(1−e−γρt​)=2−e−γρx​−e−γρy​ 其中: ρx=(bcxgt−bcxcw)2,ρy=(bcygt−bcych)2γ=2−Λ\rho_x = (\frac{b_{c_x}^{gt} - b_{c_x}}{c_w})^2, \quad \rho_y= (\frac{b_{c_y}^{gt} - b_{c_y}}{c_h})^2 \quad \gamma = 2 - \Lambdaρx​=(cw​bcx​gt​−bcx​​​)2,ρy​=(ch​bcy​gt​−bcy​​​)2γ=2−Λ 注意:这里的(cw,ch)(c_w, c_h)(cw​,ch​)为真实框和预测框最小外接矩形的宽和高

(3)形状损失(Shape cost),定义如下: Ω=∑t=w,h(1−e−wt)θ=(1−e−ww)θ+(1−e−wh)θ\Omega = \sum_{t=w, h}(1-e^{-w_t})^\theta=(1-e^{-w_w})^\theta+(1-e^{-w_h})^\thetaΩ=t=w,h∑​(1−e−wt​)θ=(1−e−ww​)θ+(1−e−wh​)θ 其中: ww=∣w−wgt∣max⁡(w,wgt),wh=∣h−hgt∣max⁡(h,hgt)w_w=\frac{|w-w^{gt}|}{\max(w, w^{gt})}, \quad w_h=\frac{|h-h^{gt}|}{\max(h, h^{gt})}ww​=max(w,wgt)∣w−wgt∣​,wh​=max(h,hgt)∣h−hgt∣​ (w,h)(w, h)(w,h)和(wgt,hgt)(w^{gt}, h^{gt})(wgt,hgt)分别为预测框和真实框的宽和高,θ\thetaθ控制对形状损失的关注程度,为了避免过于关注形状损失而降低对预测框的移动,作者使用遗传算法计算出θ\thetaθ接近4,因此作者定于θ\thetaθ参数范围为[2, 6]

(4)IoU损失(IoU cost) IoU=交集A并集BIoU=\frac{交集A}{并集B}IoU=并集B交集A​

综上所诉,最终SIoU损失函数定义如下: LossSIoU=1−IoU+Δ+Ω2Loss_{SIoU}=1-IoU+\frac{\Delta + \Omega}{2}LossSIoU​=1−IoU+2Δ+Ω​

1.2 代码实现

有关SIoU得代码实现如下(来源美团yolov6):

elif self.iou_type == 'siou':# SIoU Loss https://arxiv.org/pdf/2205.12740.pdf'''预测框和真实框坐标形式为xyxy,即左下右上角坐标或左上右下角坐标'''s_cw = (b2_x1 + b2_x2 - b1_x1 - b1_x2) * 0.5 #真实框和预测框中心点的宽度差s_ch = (b2_y1 + b2_y2 - b1_y1 - b1_y2) * 0.5 #真实框和预测框中心点的高度差sigma = torch.pow(s_cw ** 2 + s_ch ** 2, 0.5) #真实框和预测框中心点的距离sin_alpha_1 = torch.abs(s_cw) / sigma #真实框和预测框中心点的夹角βsin_alpha_2 = torch.abs(s_ch) / sigma #真实框和预测框中心点的夹角αthreshold = pow(2, 0.5) / 2 #夹角阈值sin_alpha = torch.where(sin_alpha_1 > threshold, sin_alpha_2, sin_alpha_1) #α大于45°则考虑优化β,否则优化αangle_cost = torch.cos(torch.arcsin(sin_alpha) * 2 - math.pi / 2) #角度损失rho_x = (s_cw / cw) ** 2 rho_y = (s_ch / ch) ** 2gamma = angle_cost - 2distance_cost = 2 - torch.exp(gamma * rho_x) - torch.exp(gamma * rho_y) #距离损失omiga_w = torch.abs(w1 - w2) / torch.max(w1, w2)omiga_h = torch.abs(h1 - h2) / torch.max(h1, h2)shape_cost = torch.pow(1 - torch.exp(-1 * omiga_w), 4) + torch.pow(1 - torch.exp(-1 * omiga_h), 4) #形状损失iou = iou - 0.5 * (distance_cost + shape_cost) #siouloss = 1.0 - iou
本文链接地址:https://www.jiuchutong.com/zhishi/298787.html 转载请保留说明!

上一篇:js去掉两个数组相同的元素、js删除数组中某一个对象、js快速查找数组中重复项下标(js去掉数组中的空字符串)

下一篇:无需本地部署 在线使用Stable Diffusion Webui 使用共享模型(无需本地部署的软件)

  • 小艺小艺怎么换声音(小艺小艺怎么换人声)

    小艺小艺怎么换声音(小艺小艺怎么换人声)

  • 钉钉清除聊天记录还可以找回吗(钉钉清除聊天记录云端还有吗)

    钉钉清除聊天记录还可以找回吗(钉钉清除聊天记录云端还有吗)

  • 为什么携程上订的火车票在订单里看不到(为什么携程上订酒店日期不一样价格也不一样)

    为什么携程上订的火车票在订单里看不到(为什么携程上订酒店日期不一样价格也不一样)

  • apple store未完成付款(app store未完成付款怎么办)

    apple store未完成付款(app store未完成付款怎么办)

  • 天猫积分能干什么(天猫积分可以干什么用的)

    天猫积分能干什么(天猫积分可以干什么用的)

  • pump fan是什么接口(pump_fan1是什么接口)

    pump fan是什么接口(pump_fan1是什么接口)

  • XP系统不支持ev录屏系统声

    XP系统不支持ev录屏系统声

  • 三星note10有红外线功能吗(三星note10红外遥控器)

    三星note10有红外线功能吗(三星note10红外遥控器)

  • qq上面解除关系是什么(qq解除关系有提示吗)

    qq上面解除关系是什么(qq解除关系有提示吗)

  • 微信登录频率过快多久恢复(微信登录频率过快请稍后重试)

    微信登录频率过快多久恢复(微信登录频率过快请稍后重试)

  • 爱奇艺电视会员和手机会员通用吗(爱奇艺电视会员什么时候最便宜)

    爱奇艺电视会员和手机会员通用吗(爱奇艺电视会员什么时候最便宜)

  • 苹果11充满电要多久(苹果11充满电要多少毫安)

    苹果11充满电要多久(苹果11充满电要多少毫安)

  • iphone xr有快充吗(xr手机有快充吗)

    iphone xr有快充吗(xr手机有快充吗)

  • 路灯定时开关机怎么调(路灯自动定时开关)

    路灯定时开关机怎么调(路灯自动定时开关)

  • 苹果11是无线耳机吗(苹果11无线耳机怎么连接)

    苹果11是无线耳机吗(苹果11无线耳机怎么连接)

  • 华为p30和p30pro的区别(华为p30和p30pro的充电器是一样的吗)

    华为p30和p30pro的区别(华为p30和p30pro的充电器是一样的吗)

  • 手机流量怎么送人(手机流量怎么送给别人手机上怎么操作)

    手机流量怎么送人(手机流量怎么送给别人手机上怎么操作)

  • 微信单个表情怎么删除(微信单个表情怎么制作)

    微信单个表情怎么删除(微信单个表情怎么制作)

  • 瓦普斯克国家公园内向洞穴外张望的北极熊幼崽,加拿大马尼托巴 (© Robert Harding/Alamy)(瓦普拉克)

    瓦普斯克国家公园内向洞穴外张望的北极熊幼崽,加拿大马尼托巴 (© Robert Harding/Alamy)(瓦普拉克)

  • win11系统华硕电脑的指纹没办法使用了怎么添加? 华硕电脑指纹识别添加技巧(华硕11代笔记本装win10)

    win11系统华硕电脑的指纹没办法使用了怎么添加? 华硕电脑指纹识别添加技巧(华硕11代笔记本装win10)

  • 帝国CMS如何更改绑定域名(帝国cms配置数据库)

    帝国CMS如何更改绑定域名(帝国cms配置数据库)

  • 政府工会经费收入如何做凭证
  • 交强险怎么报销流程
  • 受雇于两家公司个税怎么汇算清缴
  • 企业所得税营业收入是含税还是不含税
  • 企业租赁个人房屋怎么交税
  • 企业一直亏损但是汇算清缴调增
  • 外购的商誉如何做账
  • 职工退休金计入个人账户
  • 二手房如何缴纳契税
  • 手续费及佣金收入
  • 购买国税金税卡年费应该怎么做账务处理?
  • 个人借公司款利率多少合法
  • 如何才能成为一个好老师
  • 劳务分包有执照没资质能开票吗?
  • 监控安装属于什么税目
  • 小规模纳税人需要每月清卡吗
  • 贸易公司收到货款会计分录
  • 建筑业预缴税款怎么退税
  • 去年的发票今年能用吗
  • 文件夹如何更改图标
  • 工商年报财务数据怎么填
  • 外贸公司进出口权办理流程
  • win10我无法更改某些设置
  • 应交增值税缴纳后入什么费用
  • 如何让电脑安全
  • 公司交会费有什么用
  • os线程是什么
  • win10系统宽带连接错误720
  • Win10 21H1 Build 19043.1200(KB5005101)预览版更新了哪些内容(附更新日志)
  • php日历如何实现
  • initpki.dll有什么用
  • echarts地图不同地区设置不同的颜色
  • php常见面试题
  • 补缴当年增值税和滞纳金如何入账
  • PHP:JDToGregorian()的用法_日历函数
  • 日落后的托莱多全景,西班牙 (© Frank Fischbach/Alamy)
  • 施工方可以向建设单位借款么
  • npm ERR! code ERESOLVEnpm ERR! ERESOLVE could not resolve dependency
  • php导出带样式的数据库
  • python的多线程 吃cpu太厉害
  • java操作mongodb数据库
  • mongodb从入门到商业实战
  • 二级栏目怎么做
  • 法人转钱入公户要交税吗
  • 可供分配的利润包括
  • 冲帐发票
  • 房地产行业扣税标准
  • 减免税做营业外收入的会计分录
  • 分公司办事处需要什么手续
  • 预付账款的账务处理过程
  • 以前年度的固定资产入成原材料了怎么办
  • 工会发放节日慰问品种类
  • 公司销售二手车怎么开票
  • 怎么看发票的凭证号
  • sql查询生成器
  • sql语句递归
  • sql2000数据库怎么使用
  • 怎么测试windows摄像头
  • window配置在哪
  • windows7 excel
  • win7系统多久不动自动关机
  • mac光盘无法退出怎么解决
  • 电脑cf截图保存在哪里
  • win8系统怎么设置开机密码
  • android采用什么软件架构?
  • 去掉字符串中的某个值
  • 本地 node js 启动vue
  • Python高手之路第3版PDF下载
  • c#委托的理解
  • 半透明图层怎么制作
  • js jquery区别
  • Python cx_freeze打包工具处理问题思路及解决办法
  • jquery 使用
  • jquery操作表单
  • js间隔执行的代码
  • 携程怎么订
  • 河南省地方税务局房产税管理办法
  • 如何撤销工商注册登记
  • 阿勒泰捡石头的地方在哪里
  • 开票风险预警机制黄色预警严重吗?
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设