位置: IT常识 - 正文

目标检测--边框回归损失函数SIoU原理详解及代码实现(目标检测标注框的规则)

编辑:rootadmin
目标检测--边框回归损失函数SIoU原理详解及代码实现 边框回归损失函数1. SIoU1.1 原理1.2 代码实现1. SIoU1.1 原理

推荐整理分享目标检测--边框回归损失函数SIoU原理详解及代码实现(目标检测标注框的规则),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:目标检测边框回归,目标检测边界框,目标检测用什么框架,目标检测斜框,目标检测斜框,目标检测画框,目标检测边框回归,目标检测的框是怎么出来的,内容如对您有帮助,希望把文章链接给更多的朋友!

有关IoU损失函数,如(GIoU, DIoU, CIoU)没有考虑到真实框与预测框框之间的方向,导致收敛速度较慢,对此SIoU引入真实框和预测框之间的向量角度,重新定义相关损失函数,具体包含四个部分: (1)角度损失(Angle cost),定义如下 Λ=1−2∗sin⁡2(arcsin⁡(chσ)−π4)=cos⁡(2∗(arcsin⁡(chσ)−π4))\Lambda = 1-2*\sin^2(\arcsin(\frac{c_h}{\sigma}) - \frac{\pi}{4})=\cos(2*(\arcsin(\frac{c_h}{\sigma}) - \frac{\pi}{4}))Λ=1−2∗sin2(arcsin(σch​​)−4π​)=cos(2∗(arcsin(σch​​)−4π​)) 其中chc_hch​为真实框和预测框中心点的高度差,σ\sigmaσ为真实框和预测框中心点的距离,事实上arcsin⁡(chσ)\arcsin (\frac{c_h}{\sigma})arcsin(σch​​)等于角度α\alphaα chσ=sin⁡(α)\frac{c_h}{\sigma}=\sin(\alpha)σch​​=sin(α) σ=(bcxgt−bcx)2+(bcygt−bcy)2\sigma = \sqrt{(b_{c_x}^{gt}-b_{c_x})^2+(b_{c_y}^{gt}-b_{c_y})^2}σ=(bcx​gt​−bcx​​)2+(bcy​gt​−bcy​​)2​ ch=max⁡(bcygt,bcy)−min⁡(bcygt,bcy)c_h = \max(b_{c_y}^{gt}, b_{c_y}) - \min(b_{c_y}^{gt}, b_{c_y})ch​=max(bcy​gt​,bcy​​)−min(bcy​gt​,bcy​​)

目标检测--边框回归损失函数SIoU原理详解及代码实现(目标检测标注框的规则)

(bcxgt,bcygt)(b_{c_x}^{gt}, b_{c_y}^{gt})(bcx​gt​,bcy​gt​)为真实框中心坐标(bcx,bcy)(b_{c_x}, b_{c_y})(bcx​​,bcy​​)为预测框中心坐标,可以注意到当α\alphaα为π2\frac{\pi}{2}2π​或0时,角度损失为0,在训练过程中若α<π4\alpha < \frac{\pi}{4}α<4π​,则最小化α\alphaα,否则最小化β\betaβ

(2)距离损失(Distance cost),定义如下: Δ=∑t=x,y(1−e−γρt)=2−e−γρx−e−γρy\Delta = \sum_{t=x,y}(1-e^{-\gamma\rho_t})=2-e^{-\gamma\rho_x}-e^{-\gamma\rho_y}Δ=t=x,y∑​(1−e−γρt​)=2−e−γρx​−e−γρy​ 其中: ρx=(bcxgt−bcxcw)2,ρy=(bcygt−bcych)2γ=2−Λ\rho_x = (\frac{b_{c_x}^{gt} - b_{c_x}}{c_w})^2, \quad \rho_y= (\frac{b_{c_y}^{gt} - b_{c_y}}{c_h})^2 \quad \gamma = 2 - \Lambdaρx​=(cw​bcx​gt​−bcx​​​)2,ρy​=(ch​bcy​gt​−bcy​​​)2γ=2−Λ 注意:这里的(cw,ch)(c_w, c_h)(cw​,ch​)为真实框和预测框最小外接矩形的宽和高

(3)形状损失(Shape cost),定义如下: Ω=∑t=w,h(1−e−wt)θ=(1−e−ww)θ+(1−e−wh)θ\Omega = \sum_{t=w, h}(1-e^{-w_t})^\theta=(1-e^{-w_w})^\theta+(1-e^{-w_h})^\thetaΩ=t=w,h∑​(1−e−wt​)θ=(1−e−ww​)θ+(1−e−wh​)θ 其中: ww=∣w−wgt∣max⁡(w,wgt),wh=∣h−hgt∣max⁡(h,hgt)w_w=\frac{|w-w^{gt}|}{\max(w, w^{gt})}, \quad w_h=\frac{|h-h^{gt}|}{\max(h, h^{gt})}ww​=max(w,wgt)∣w−wgt∣​,wh​=max(h,hgt)∣h−hgt∣​ (w,h)(w, h)(w,h)和(wgt,hgt)(w^{gt}, h^{gt})(wgt,hgt)分别为预测框和真实框的宽和高,θ\thetaθ控制对形状损失的关注程度,为了避免过于关注形状损失而降低对预测框的移动,作者使用遗传算法计算出θ\thetaθ接近4,因此作者定于θ\thetaθ参数范围为[2, 6]

(4)IoU损失(IoU cost) IoU=交集A并集BIoU=\frac{交集A}{并集B}IoU=并集B交集A​

综上所诉,最终SIoU损失函数定义如下: LossSIoU=1−IoU+Δ+Ω2Loss_{SIoU}=1-IoU+\frac{\Delta + \Omega}{2}LossSIoU​=1−IoU+2Δ+Ω​

1.2 代码实现

有关SIoU得代码实现如下(来源美团yolov6):

elif self.iou_type == 'siou':# SIoU Loss https://arxiv.org/pdf/2205.12740.pdf'''预测框和真实框坐标形式为xyxy,即左下右上角坐标或左上右下角坐标'''s_cw = (b2_x1 + b2_x2 - b1_x1 - b1_x2) * 0.5 #真实框和预测框中心点的宽度差s_ch = (b2_y1 + b2_y2 - b1_y1 - b1_y2) * 0.5 #真实框和预测框中心点的高度差sigma = torch.pow(s_cw ** 2 + s_ch ** 2, 0.5) #真实框和预测框中心点的距离sin_alpha_1 = torch.abs(s_cw) / sigma #真实框和预测框中心点的夹角βsin_alpha_2 = torch.abs(s_ch) / sigma #真实框和预测框中心点的夹角αthreshold = pow(2, 0.5) / 2 #夹角阈值sin_alpha = torch.where(sin_alpha_1 > threshold, sin_alpha_2, sin_alpha_1) #α大于45°则考虑优化β,否则优化αangle_cost = torch.cos(torch.arcsin(sin_alpha) * 2 - math.pi / 2) #角度损失rho_x = (s_cw / cw) ** 2 rho_y = (s_ch / ch) ** 2gamma = angle_cost - 2distance_cost = 2 - torch.exp(gamma * rho_x) - torch.exp(gamma * rho_y) #距离损失omiga_w = torch.abs(w1 - w2) / torch.max(w1, w2)omiga_h = torch.abs(h1 - h2) / torch.max(h1, h2)shape_cost = torch.pow(1 - torch.exp(-1 * omiga_w), 4) + torch.pow(1 - torch.exp(-1 * omiga_h), 4) #形状损失iou = iou - 0.5 * (distance_cost + shape_cost) #siouloss = 1.0 - iou
本文链接地址:https://www.jiuchutong.com/zhishi/298787.html 转载请保留说明!

上一篇:js去掉两个数组相同的元素、js删除数组中某一个对象、js快速查找数组中重复项下标(js去掉数组中的空字符串)

下一篇:无需本地部署 在线使用Stable Diffusion Webui 使用共享模型(无需本地部署的软件)

  • oppo怎么解除签名安装(oppo怎么解除签名冲突)

    oppo怎么解除签名安装(oppo怎么解除签名冲突)

  • 怎么拉黑微信好友(怎么拉黑微信好友永远加不上)

    怎么拉黑微信好友(怎么拉黑微信好友永远加不上)

  • 抖音评论页面如何变白(抖音评论在底下怎么调)

    抖音评论页面如何变白(抖音评论在底下怎么调)

  • 手机分贝测试仪准不准(华为手机分贝测试仪在哪里)

    手机分贝测试仪准不准(华为手机分贝测试仪在哪里)

  • qq来消息亮屏怎么设置(qq消息来时怎样亮屏)

    qq来消息亮屏怎么设置(qq消息来时怎样亮屏)

  • 淘宝快递丢失怎么处理(淘宝快递丢失怎么处理 理赔)

    淘宝快递丢失怎么处理(淘宝快递丢失怎么处理 理赔)

  • 鼠标电池能用多长时间(鼠标电池用多久没电)

    鼠标电池能用多长时间(鼠标电池用多久没电)

  • 华为手机的云空间在哪里(华为手机的云空间怎么关闭)

    华为手机的云空间在哪里(华为手机的云空间怎么关闭)

  • 苹果手机听筒模式怎么切换扬声器(苹果手机听筒无声)

    苹果手机听筒模式怎么切换扬声器(苹果手机听筒无声)

  • 苹果xsmax要不要更新13系统

    苹果xsmax要不要更新13系统

  • excel表格内文字怎么换行(excel表格内文字行间距怎么设置)

    excel表格内文字怎么换行(excel表格内文字行间距怎么设置)

  • ipad3怎样拆机(ipad三代拆机视频)

    ipad3怎样拆机(ipad三代拆机视频)

  • 怎样存别人手机号码(怎样存别人手机号码,能成为电子版,一查名字就出来了)

    怎样存别人手机号码(怎样存别人手机号码,能成为电子版,一查名字就出来了)

  • 乐视手机闪退怎么回事(乐视app闪退)

    乐视手机闪退怎么回事(乐视app闪退)

  • 夏普打印机怎么缩印(夏普打印机怎么复印身份证)

    夏普打印机怎么缩印(夏普打印机怎么复印身份证)

  • qq空间可见说说设置(qq空间可见说说怎么发)

    qq空间可见说说设置(qq空间可见说说怎么发)

  • wps表格怎么批量查找(wps表格怎么批量替换文字)

    wps表格怎么批量查找(wps表格怎么批量替换文字)

  • 华为手机分屏键盘怎么缩小(华为手机分屏键在哪)

    华为手机分屏键盘怎么缩小(华为手机分屏键在哪)

  • 域里怎么做目录(目录的域怎么弄)

    域里怎么做目录(目录的域怎么弄)

  • 抖音多少赞可以发长视频(抖音多少赞可以带货)

    抖音多少赞可以发长视频(抖音多少赞可以带货)

  • excel公式双引号怎么打(excel公式双引号中内容也自动变化)

    excel公式双引号怎么打(excel公式双引号中内容也自动变化)

  • 麦克米伦省级公园里的神殿林,加拿大不列颠哥伦比亚省 (© Robert Postma/Shutterstock)(麦克米伦anki)

    麦克米伦省级公园里的神殿林,加拿大不列颠哥伦比亚省 (© Robert Postma/Shutterstock)(麦克米伦anki)

  • phpcms如何修改pages模板样式(phpcms怎么样)

    phpcms如何修改pages模板样式(phpcms怎么样)

  • 出口货物备案单证目录在哪里
  • 发票未到怎么暂估入账
  • 政府回购土地免税政策
  • 小规模季度不超过30万元免税会计分录
  • 民营企业月末要报哪些税
  • 红冲发票跨年怎么操作
  • 高新企业季度企业所得税预征税率
  • 公益性捐赠全额扣除2020年第9号文件
  • 财产转让所得税计算方法
  • 个人销售货物缴纳增值税吗
  • 银行转贴现业务违法吗
  • 补记去年收入分录
  • 个人房源出租
  • 电子税务局如何开票操作
  • 已知不含税金额和增值税如何计算税率
  • 城市垃圾处理项目
  • 补领以前月份的工资如何计算个人所得税?
  • ghost读不出硬盘
  • 电脑怎么更新系统日期
  • 如何结转销售收入
  • 留存利润和利润的关系
  • windows11关机键怎么设置经典菜单
  • PHP:pg_num_fields()的用法_PostgreSQL函数
  • ESP32-CAM AI THINKER 引脚排列:GPIO 用法说明
  • 货运代理开票
  • 喉咙有异物怎么咳出来
  • 一次还本分次付息的国债会计分录
  • 编译原理第三版课后答案
  • 金税盘如何使用流程
  • php处理xml数据
  • Yii2——使用数据库操作汇总(增删查改、事务)
  • 学长学姐面试要注意哪些细节
  • 汽车维修费发票怎么开
  • 生产企业出口退税账务处理会计分录
  • 开票资料电话写错了有关系吗
  • 借款利息收入发票
  • 公司购买led屏幕做到什么费用
  • 多收了钱怎么记账
  • 缴纳税款滞纳金怎么算
  • php上传大视频
  • 电子承兑逾期超过30天怎么办
  • 门诊收费票据能重新打印吗
  • 增值税调整怎么结算
  • 发放工资代扣个人所得税的记账凭证怎么填
  • 发票备注栏必须写吗
  • 普通征税差额征税和减按征税
  • 弃置费用的摊余成本
  • 企业的哪些支出不得列入成本费用原因
  • 出口退税率为0的账务处理
  • 无形资产摊销账面价值
  • 视同销售和不视同销售的区别?
  • 金融工具减值准则
  • 首先我们先了解一下作者英语怎么说呢
  • 从农民手里租用土地用于科研要开发票吗
  • 固定资产多少钱入账
  • centos编译器
  • sedsvc.exe是什么
  • Win10 64位系统下鼠标右键刷新没反应的解决方案
  • win8 net framework
  • windows累积更新
  • xp系统怎么添加ip地址
  • 如何延迟windows更新
  • xp桌面浏览器图标不见了
  • win10 rs3
  • cocos2d游戏源码
  • jquery基础知识
  • jquery 滑块
  • win10下载杀毒软件
  • android设置背景颜色代码
  • android xui
  • js复制对象的值
  • jquery table
  • 安卓使用icloud
  • 福建省个人所得税税率表查询
  • 四川纳税互动平台app
  • 石家庄有线电视客服电话9688
  • 国家税务总局绵阳市税务局网站
  • 重庆电子税务局怎么开电子发票
  • 综治中心能取代公务员吗
  • 会计报表错误
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设