位置: IT常识 - 正文

目标检测--边框回归损失函数SIoU原理详解及代码实现(目标检测标注框的规则)

编辑:rootadmin
目标检测--边框回归损失函数SIoU原理详解及代码实现 边框回归损失函数1. SIoU1.1 原理1.2 代码实现1. SIoU1.1 原理

推荐整理分享目标检测--边框回归损失函数SIoU原理详解及代码实现(目标检测标注框的规则),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:目标检测边框回归,目标检测边界框,目标检测用什么框架,目标检测斜框,目标检测斜框,目标检测画框,目标检测边框回归,目标检测的框是怎么出来的,内容如对您有帮助,希望把文章链接给更多的朋友!

有关IoU损失函数,如(GIoU, DIoU, CIoU)没有考虑到真实框与预测框框之间的方向,导致收敛速度较慢,对此SIoU引入真实框和预测框之间的向量角度,重新定义相关损失函数,具体包含四个部分: (1)角度损失(Angle cost),定义如下 Λ=1−2∗sin⁡2(arcsin⁡(chσ)−π4)=cos⁡(2∗(arcsin⁡(chσ)−π4))\Lambda = 1-2*\sin^2(\arcsin(\frac{c_h}{\sigma}) - \frac{\pi}{4})=\cos(2*(\arcsin(\frac{c_h}{\sigma}) - \frac{\pi}{4}))Λ=1−2∗sin2(arcsin(σch​​)−4π​)=cos(2∗(arcsin(σch​​)−4π​)) 其中chc_hch​为真实框和预测框中心点的高度差,σ\sigmaσ为真实框和预测框中心点的距离,事实上arcsin⁡(chσ)\arcsin (\frac{c_h}{\sigma})arcsin(σch​​)等于角度α\alphaα chσ=sin⁡(α)\frac{c_h}{\sigma}=\sin(\alpha)σch​​=sin(α) σ=(bcxgt−bcx)2+(bcygt−bcy)2\sigma = \sqrt{(b_{c_x}^{gt}-b_{c_x})^2+(b_{c_y}^{gt}-b_{c_y})^2}σ=(bcx​gt​−bcx​​)2+(bcy​gt​−bcy​​)2​ ch=max⁡(bcygt,bcy)−min⁡(bcygt,bcy)c_h = \max(b_{c_y}^{gt}, b_{c_y}) - \min(b_{c_y}^{gt}, b_{c_y})ch​=max(bcy​gt​,bcy​​)−min(bcy​gt​,bcy​​)

目标检测--边框回归损失函数SIoU原理详解及代码实现(目标检测标注框的规则)

(bcxgt,bcygt)(b_{c_x}^{gt}, b_{c_y}^{gt})(bcx​gt​,bcy​gt​)为真实框中心坐标(bcx,bcy)(b_{c_x}, b_{c_y})(bcx​​,bcy​​)为预测框中心坐标,可以注意到当α\alphaα为π2\frac{\pi}{2}2π​或0时,角度损失为0,在训练过程中若α<π4\alpha < \frac{\pi}{4}α<4π​,则最小化α\alphaα,否则最小化β\betaβ

(2)距离损失(Distance cost),定义如下: Δ=∑t=x,y(1−e−γρt)=2−e−γρx−e−γρy\Delta = \sum_{t=x,y}(1-e^{-\gamma\rho_t})=2-e^{-\gamma\rho_x}-e^{-\gamma\rho_y}Δ=t=x,y∑​(1−e−γρt​)=2−e−γρx​−e−γρy​ 其中: ρx=(bcxgt−bcxcw)2,ρy=(bcygt−bcych)2γ=2−Λ\rho_x = (\frac{b_{c_x}^{gt} - b_{c_x}}{c_w})^2, \quad \rho_y= (\frac{b_{c_y}^{gt} - b_{c_y}}{c_h})^2 \quad \gamma = 2 - \Lambdaρx​=(cw​bcx​gt​−bcx​​​)2,ρy​=(ch​bcy​gt​−bcy​​​)2γ=2−Λ 注意:这里的(cw,ch)(c_w, c_h)(cw​,ch​)为真实框和预测框最小外接矩形的宽和高

(3)形状损失(Shape cost),定义如下: Ω=∑t=w,h(1−e−wt)θ=(1−e−ww)θ+(1−e−wh)θ\Omega = \sum_{t=w, h}(1-e^{-w_t})^\theta=(1-e^{-w_w})^\theta+(1-e^{-w_h})^\thetaΩ=t=w,h∑​(1−e−wt​)θ=(1−e−ww​)θ+(1−e−wh​)θ 其中: ww=∣w−wgt∣max⁡(w,wgt),wh=∣h−hgt∣max⁡(h,hgt)w_w=\frac{|w-w^{gt}|}{\max(w, w^{gt})}, \quad w_h=\frac{|h-h^{gt}|}{\max(h, h^{gt})}ww​=max(w,wgt)∣w−wgt∣​,wh​=max(h,hgt)∣h−hgt∣​ (w,h)(w, h)(w,h)和(wgt,hgt)(w^{gt}, h^{gt})(wgt,hgt)分别为预测框和真实框的宽和高,θ\thetaθ控制对形状损失的关注程度,为了避免过于关注形状损失而降低对预测框的移动,作者使用遗传算法计算出θ\thetaθ接近4,因此作者定于θ\thetaθ参数范围为[2, 6]

(4)IoU损失(IoU cost) IoU=交集A并集BIoU=\frac{交集A}{并集B}IoU=并集B交集A​

综上所诉,最终SIoU损失函数定义如下: LossSIoU=1−IoU+Δ+Ω2Loss_{SIoU}=1-IoU+\frac{\Delta + \Omega}{2}LossSIoU​=1−IoU+2Δ+Ω​

1.2 代码实现

有关SIoU得代码实现如下(来源美团yolov6):

elif self.iou_type == 'siou':# SIoU Loss https://arxiv.org/pdf/2205.12740.pdf'''预测框和真实框坐标形式为xyxy,即左下右上角坐标或左上右下角坐标'''s_cw = (b2_x1 + b2_x2 - b1_x1 - b1_x2) * 0.5 #真实框和预测框中心点的宽度差s_ch = (b2_y1 + b2_y2 - b1_y1 - b1_y2) * 0.5 #真实框和预测框中心点的高度差sigma = torch.pow(s_cw ** 2 + s_ch ** 2, 0.5) #真实框和预测框中心点的距离sin_alpha_1 = torch.abs(s_cw) / sigma #真实框和预测框中心点的夹角βsin_alpha_2 = torch.abs(s_ch) / sigma #真实框和预测框中心点的夹角αthreshold = pow(2, 0.5) / 2 #夹角阈值sin_alpha = torch.where(sin_alpha_1 > threshold, sin_alpha_2, sin_alpha_1) #α大于45°则考虑优化β,否则优化αangle_cost = torch.cos(torch.arcsin(sin_alpha) * 2 - math.pi / 2) #角度损失rho_x = (s_cw / cw) ** 2 rho_y = (s_ch / ch) ** 2gamma = angle_cost - 2distance_cost = 2 - torch.exp(gamma * rho_x) - torch.exp(gamma * rho_y) #距离损失omiga_w = torch.abs(w1 - w2) / torch.max(w1, w2)omiga_h = torch.abs(h1 - h2) / torch.max(h1, h2)shape_cost = torch.pow(1 - torch.exp(-1 * omiga_w), 4) + torch.pow(1 - torch.exp(-1 * omiga_h), 4) #形状损失iou = iou - 0.5 * (distance_cost + shape_cost) #siouloss = 1.0 - iou
本文链接地址:https://www.jiuchutong.com/zhishi/298787.html 转载请保留说明!

上一篇:js去掉两个数组相同的元素、js删除数组中某一个对象、js快速查找数组中重复项下标(js去掉数组中的空字符串)

下一篇:无需本地部署 在线使用Stable Diffusion Webui 使用共享模型(无需本地部署的软件)

  • 苹果13有pro版吗(苹果13pro有5g吗)

    苹果13有pro版吗(苹果13pro有5g吗)

  • 华为mate30pro闪光灯下的白点是什么(华为mate30pro闪光灯怎么开)

    华为mate30pro闪光灯下的白点是什么(华为mate30pro闪光灯怎么开)

  • 对方qq一直显示2g在线(对方qq一直显示2G)

    对方qq一直显示2g在线(对方qq一直显示2G)

  • 学生模式的时间是怎么计算的(学生模式的时间用完了怎么办)

    学生模式的时间是怎么计算的(学生模式的时间用完了怎么办)

  • 联想拯救者r和y区别(联想拯救者r和y什么意思)

    联想拯救者r和y区别(联想拯救者r和y什么意思)

  • vivo手机连不上苹果11热点(vivo手机连不上自家wifi)

    vivo手机连不上苹果11热点(vivo手机连不上自家wifi)

  • 华为手机备用电池怎么开启(华为手机备用电池)

    华为手机备用电池怎么开启(华为手机备用电池)

  • 电脑和手机微信同步的时候手机上会显示吗(电脑和手机微信同步手机删除了电脑还有吗)

    电脑和手机微信同步的时候手机上会显示吗(电脑和手机微信同步手机删除了电脑还有吗)

  • 摄像头自带wifi热点什么意思(摄像头自带wifi热点密码是多少)

    摄像头自带wifi热点什么意思(摄像头自带wifi热点密码是多少)

  • 抖音直播可以用别人的身份证实名吗(抖音直播可以用obs吗)

    抖音直播可以用别人的身份证实名吗(抖音直播可以用obs吗)

  • ios怎么用微信支付(ios怎么用微信支付王者荣耀)

    ios怎么用微信支付(ios怎么用微信支付王者荣耀)

  • 荣耀v30pro防水吗(荣耀v30 pro有防水功能吗)

    荣耀v30pro防水吗(荣耀v30 pro有防水功能吗)

  • 怎样把苹果手机照片传到电脑上(怎样把苹果手机所有内容导入安卓手机)

    怎样把苹果手机照片传到电脑上(怎样把苹果手机所有内容导入安卓手机)

  • 淘宝怎么提醒卖家补货(淘宝怎么设置提醒预售)

    淘宝怎么提醒卖家补货(淘宝怎么设置提醒预售)

  • 手机怎么修改wifi密码(手机怎么修改wifi频率)

    手机怎么修改wifi密码(手机怎么修改wifi频率)

  • 华为mate30pro支持北斗导航吗(华为mate30pro支持广电网络吗)

    华为mate30pro支持北斗导航吗(华为mate30pro支持广电网络吗)

  • web安全从哪几个方面考虑(web安全主要分为几个方面)

    web安全从哪几个方面考虑(web安全主要分为几个方面)

  • 无线蓝牙耳机怎么切歌(无线蓝牙耳机怎么充电)

    无线蓝牙耳机怎么切歌(无线蓝牙耳机怎么充电)

  • 手机flv用什么打开(手机flv格式用什么播放器)

    手机flv用什么打开(手机flv格式用什么播放器)

  • word如何删除脚注(word如何删除脚注上方的横线)

    word如何删除脚注(word如何删除脚注上方的横线)

  • 爱奇艺token无效是什么意思(爱奇艺 sdk)

    爱奇艺token无效是什么意思(爱奇艺 sdk)

  • 苹果xs怎么关闭后台(苹果xs怎么关闭屏幕旋转)

    苹果xs怎么关闭后台(苹果xs怎么关闭屏幕旋转)

  • 如何安装cpu(如何安装cpu到主板视频)

    如何安装cpu(如何安装cpu到主板视频)

  • vue3中使用swiper完整版教程(vue3中使用gis地图)

    vue3中使用swiper完整版教程(vue3中使用gis地图)

  • 税收管辖权是什么的重要组成部分
  • 个人所得税六项专项附加扣除是什么
  • 企业缴纳季度所得税
  • 小规模季报利润表本月金额和本年累计金额
  • 资产负债表本期盈余为什么是负数
  • 金融企业往来收入科目属于什么科
  • 外购货物用于捐赠的会计分录
  • 资本金可以出借吗
  • 现金股利和股票股利的区别
  • 垫资后转出的会计分录怎么写?
  • 小规模个人所得税怎么申报
  • 网上平台服务年费应该计入什么费用?
  • 医疗器械行业进销存软件
  • 劳务税能不能抵扣
  • 计提所得税费用会计分录
  • 其他应付款报表填列
  • 贷款利息收到发票怎么办
  • 计提理财利息分录
  • linux中的
  • linux小技巧
  • 春天里的____作文
  • 结转消费成本的会计分录
  • win10点击网络属性没反应
  • 销售已使用过的小汽车增值税
  • thinkphp import
  • 零息债券利息
  • 简述税款征收的基本原则
  • php浮点数
  • 员工旅游费的税率是多少
  • php读取php文件内容
  • 持有至到期投资账务处理
  • ai作画
  • 一般纳税人公司注册需要几个人
  • 公司开的餐费专票可以抵扣吗
  • 公司向银行贷款利息是多少
  • 包装物为什么是无菌的
  • 房地产企业买地
  • 电子发票自己打印黑白有效吗
  • ibm db2认证
  • 小规模纳税人开专票需要交税吗
  • 汽修修理厂
  • 速动比率和流动比率怎么分析
  • 个人取得全年一次性奖金征税规定
  • 企业所得税审计调整分录
  • 调整其他应付款作为收入
  • 合同没签定金可以退的吗
  • 合理损耗怎么算
  • 软件企业确认收入
  • 股票交易费用计算器小程序
  • 承兑汇票被背书人
  • mysql5.7.21安装教程
  • 提高sql执行效率的方法
  • mysql索引的使用和原理
  • 简单介绍linux系统有哪些主要特点?
  • window如何还原系统
  • win10补丁导致无法开机
  • Windows Server 2008之数据安全保护
  • unix系统命令大全
  • winxp安卓
  • 如何在mac中安装windows
  • 在Linux操作系统中哪些命令可以正确关闭系统防火墙
  • mac10.95升级
  • 东芝笔记本配件
  • win10一年更新几次
  • omaws32.exe - omaws32是什么进程 有什么用
  • windows8 defender
  • win7系统计算机管理打不开
  • 隐藏网络怎么连接电脑连不上
  • 新闻客户端app
  • Android 使用mp4做礼物特效
  • linux shell截取字符串
  • css怎么控制图片位置
  • c调用nodejs
  • 用python画roc曲线
  • 安卓手机管家删除的照片怎么恢复
  • js操作dom节点的方法
  • 电信业务发票
  • 浦东税务15所
  • 广告发布合同属于什么合同
  • 工商变更与税务变更为什么不能同步
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设