位置: IT常识 - 正文

YOLOV7改进-添加EIoU,SIoU,AlphaIoU,FocalEIoU,Wise-IoU(yolov5增加检测层)

编辑:rootadmin
YOLOV7改进-添加EIoU,SIoU,AlphaIoU,FocalEIoU,Wise-IoU 在YoloV7中添加EIoU,SIoU,AlphaIoU,FocalEIoU,Wise-IoU.

推荐整理分享YOLOV7改进-添加EIoU,SIoU,AlphaIoU,FocalEIoU,Wise-IoU(yolov5增加检测层),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:yolov3改进算法,yolov3改进算法,yolov4增加检测层,yolov5改进bifpn,yolov5改进bifpn,yolov2改进,yolov4如何改进,yolov4如何改进,内容如对您有帮助,希望把文章链接给更多的朋友!

YOLOV7改进-添加EIoU,SIoU,AlphaIoU,FocalEIoU,Wise-IoU(yolov5增加检测层)

yolov7中box_iou其默认用的是CIoU,其中代码还带有GIoU,DIoU, AlphaIoU,文件路径:utils/general.py,函数名为:bbox_iou

重磅!!!!! YOLO模型改进集合指南-CSDNdef bbox_iou(box1, box2, x1y1x2y2=True, GIoU=False, DIoU=False, CIoU=False, eps=1e-7): # Returns the IoU of box1 to box2. box1 is 4, box2 is nx4 box2 = box2.T # Get the coordinates of bounding boxes if x1y1x2y2: # x1, y1, x2, y2 = box1 b1_x1, b1_y1, b1_x2, b1_y2 = box1[0], box1[1], box1[2], box1[3] b2_x1, b2_y1, b2_x2, b2_y2 = box2[0], box2[1], box2[2], box2[3] else: # transform from xywh to xyxy b1_x1, b1_x2 = box1[0] - box1[2] / 2, box1[0] + box1[2] / 2 b1_y1, b1_y2 = box1[1] - box1[3] / 2, box1[1] + box1[3] / 2 b2_x1, b2_x2 = box2[0] - box2[2] / 2, box2[0] + box2[2] / 2 b2_y1, b2_y2 = box2[1] - box2[3] / 2, box2[1] + box2[3] / 2 # Intersection area inter = (torch.min(b1_x2, b2_x2) - torch.max(b1_x1, b2_x1)).clamp(0) * \ (torch.min(b1_y2, b2_y2) - torch.max(b1_y1, b2_y1)).clamp(0) # Union Area w1, h1 = b1_x2 - b1_x1, b1_y2 - b1_y1 + eps w2, h2 = b2_x2 - b2_x1, b2_y2 - b2_y1 + eps union = w1 * h1 + w2 * h2 - inter + eps iou = inter / union if GIoU or DIoU or CIoU: cw = torch.max(b1_x2, b2_x2) - torch.min(b1_x1, b2_x1) # convex (smallest enclosing box) width ch = torch.max(b1_y2, b2_y2) - torch.min(b1_y1, b2_y1) # convex height if CIoU or DIoU: # Distance or Complete IoU https://arxiv.org/abs/1911.08287v1 c2 = cw ** 2 + ch ** 2 + eps # convex diagonal squared rho2 = ((b2_x1 + b2_x2 - b1_x1 - b1_x2) ** 2 + (b2_y1 + b2_y2 - b1_y1 - b1_y2) ** 2) / 4 # center distance squared if DIoU: return iou - rho2 / c2 # DIoU elif CIoU: # https://github.com/Zzh-tju/DIoU-SSD-pytorch/blob/master/utils/box/box_utils.py#L47 v = (4 / math.pi ** 2) * torch.pow(torch.atan(w2 / (h2 + eps)) - torch.atan(w1 / (h1 + eps)), 2) with torch.no_grad(): alpha = v / (v - iou + (1 + eps)) return iou - (rho2 / c2 + v * alpha) # CIoU else: # GIoU https://arxiv.org/pdf/1902.09630.pdf c_area = cw * ch + eps # convex area return iou - (c_area - union) / c_area # GIoU else: return iou # IoU

我们可以看到函数顶部,有GIoU,DIoU,CIoU的bool参数可以选择,如果全部为False的时候,其会返回最普通的Iou,如果其中一个为True的时候,即返回设定为True的那个Iou。

那么重点来了,我们怎么在这个函数里面添加EIoU,SIoU,AlphaIoU,FocalEIoU呢?

我们只需要把上面提及到的这个函数替换成以下,代码出自:github链接,这个github上还有一些yolov5的改进源码和一些常用的脚本,有兴趣可以去看看,请各位也帮忙点个star支持下,谢谢!

def bbox_iou(box1, box2, x1y1x2y2=True, GIoU=False, DIoU=False, CIoU=False, SIoU=False, EIoU=False, Focal=False, alpha=1, gamma=0.5, eps=1e-7): # Returns the IoU of box1 to box2. box1 is 4, box2 is nx4 box2 = box2.T # Get the coordinates of bounding boxes if x1y1x2y2: # x1, y1, x2, y2 = box1 b1_x1, b1_y1, b1_x2, b1_y2 = box1[0], box1[1], box1[2], box1[3] b2_x1, b2_y1, b2_x2, b2_y2 = box2[0], box2[1], box2[2], box2[3] else: # transform from xywh to xyxy b1_x1, b1_x2 = box1[0] - box1[2] / 2, box1[0] + box1[2] / 2 b1_y1, b1_y2 = box1[1] - box1[3] / 2, box1[1] + box1[3] / 2 b2_x1, b2_x2 = box2[0] - box2[2] / 2, box2[0] + box2[2] / 2 b2_y1, b2_y2 = box2[1] - box2[3] / 2, box2[1] + box2[3] / 2 # Intersection area inter = (torch.min(b1_x2, b2_x2) - torch.max(b1_x1, b2_x1)).clamp(0) * \ (torch.min(b1_y2, b2_y2) - torch.max(b1_y1, b2_y1)).clamp(0) # Union Area w1, h1 = b1_x2 - b1_x1, b1_y2 - b1_y1 + eps w2, h2 = b2_x2 - b2_x1, b2_y2 - b2_y1 + eps union = w1 * h1 + w2 * h2 - inter + eps # IoU # iou = inter / union # ori iou iou = torch.pow(inter/(union + eps), alpha) # alpha iou if CIoU or DIoU or GIoU or EIoU or SIoU: cw = b1_x2.maximum(b2_x2) - b1_x1.minimum(b2_x1) # convex (smallest enclosing box) width ch = b1_y2.maximum(b2_y2) - b1_y1.minimum(b2_y1) # convex height if CIoU or DIoU or EIoU or SIoU: # Distance or Complete IoU https://arxiv.org/abs/1911.08287v1 c2 = (cw ** 2 + ch ** 2) ** alpha + eps # convex diagonal squared rho2 = (((b2_x1 + b2_x2 - b1_x1 - b1_x2) ** 2 + (b2_y1 + b2_y2 - b1_y1 - b1_y2) ** 2) / 4) ** alpha # center dist ** 2 if CIoU: # https://github.com/Zzh-tju/DIoU-SSD-pytorch/blob/master/utils/box/box_utils.py#L47 v = (4 / math.pi ** 2) * (torch.atan(w2 / h2) - torch.atan(w1 / h1)).pow(2) with torch.no_grad(): alpha_ciou = v / (v - iou + (1 + eps)) if Focal: return iou - (rho2 / c2 + torch.pow(v * alpha_ciou + eps, alpha)), torch.pow(inter/(union + eps), gamma) # Focal_CIoU else: return iou - (rho2 / c2 + torch.pow(v * alpha_ciou + eps, alpha)) # CIoU elif EIoU: rho_w2 = ((b2_x2 - b2_x1) - (b1_x2 - b1_x1)) ** 2 rho_h2 = ((b2_y2 - b2_y1) - (b1_y2 - b1_y1)) ** 2 cw2 = torch.pow(cw ** 2 + eps, alpha) ch2 = torch.pow(ch ** 2 + eps, alpha) if Focal: return iou - (rho2 / c2 + rho_w2 / cw2 + rho_h2 / ch2), torch.pow(inter/(union + eps), gamma) # Focal_EIou else: return iou - (rho2 / c2 + rho_w2 / cw2 + rho_h2 / ch2) # EIou elif SIoU: # SIoU Loss https://arxiv.org/pdf/2205.12740.pdf s_cw = (b2_x1 + b2_x2 - b1_x1 - b1_x2) * 0.5 + eps s_ch = (b2_y1 + b2_y2 - b1_y1 - b1_y2) * 0.5 + eps sigma = torch.pow(s_cw ** 2 + s_ch ** 2, 0.5) sin_alpha_1 = torch.abs(s_cw) / sigma sin_alpha_2 = torch.abs(s_ch) / sigma threshold = pow(2, 0.5) / 2 sin_alpha = torch.where(sin_alpha_1 > threshold, sin_alpha_2, sin_alpha_1) angle_cost = torch.cos(torch.arcsin(sin_alpha) * 2 - math.pi / 2) rho_x = (s_cw / cw) ** 2 rho_y = (s_ch / ch) ** 2 gamma = angle_cost - 2 distance_cost = 2 - torch.exp(gamma * rho_x) - torch.exp(gamma * rho_y) omiga_w = torch.abs(w1 - w2) / torch.max(w1, w2) omiga_h = torch.abs(h1 - h2) / torch.max(h1, h2) shape_cost = torch.pow(1 - torch.exp(-1 * omiga_w), 4) + torch.pow(1 - torch.exp(-1 * omiga_h), 4) if Focal: return iou - torch.pow(0.5 * (distance_cost + shape_cost) + eps, alpha), torch.pow(inter/(union + eps), gamma) # Focal_SIou else: return iou - torch.pow(0.5 * (distance_cost + shape_cost) + eps, alpha) # SIou if Focal: return iou - rho2 / c2, torch.pow(inter/(union + eps), gamma) # Focal_DIoU else: return iou - rho2 / c2 # DIoU c_area = cw * ch + eps # convex area if Focal: return iou - torch.pow((c_area - union) / c_area + eps, alpha), torch.pow(inter/(union + eps), gamma) # Focal_GIoU https://arxiv.org/pdf/1902.09630.pdf else: return iou - torch.pow((c_area - union) / c_area + eps, alpha) # GIoU https://arxiv.org/pdf/1902.09630.pdf if Focal: return iou, torch.pow(inter/(union + eps), gamma) # Focal_IoU else: return iou # IoU注意事项我认为Focal_EIoU的思想是可以用作与其他IoU的变种,因此我对里面所有的IoU都支持Focal_EIoU的思想,只需要设定Focal参数为True即可,我自己测试的过程中,除了Focal_SIoU出现loss为inf之外,其他的都正常,不过这个不同的数据集可能出现不一样,具体可以自行测试下。gamma参数是Focal_EIoU中的gamma参数,一般就是为0.5,有需要可以自行更改。alpha参数为AlphaIoU中的alpha参数,默认为1,1的意思就是跟正常的IoU一样,如果想采用AlphaIoU的话,论文alpha默认值为3。(比如我不想使用AlphaIoU的特性,我就把alpha设置为1就可以,如果我想使用AlphaIoU的特性,我可以设置alpha为3)。跟Focal_EIoU一样,我认为AlphaIoU的思想同样可以用在其他的IoU变种上,简单来说就是如果你设置了alpha为3,其他IoU设定的参数(GIoU,DIoU,CIoU,EIoU,SIoU)为False的时候,那就是AlphaIoU,如果你设置了alpha为3,CIoU为True的时候,那就是AlphaCIoU,效果的话就因数据集和模型而已,具体可以自行测试下。想用那个IoU变种,就直接设置参数为True即可。AlphaIoU理论上与Focal_EIoU没有直接的冲突,但是作者这边没有详细测试过,这两者一起用会是什么效果,有兴趣可以自行测试下。除了以上这个函数替换,还需要在utils/loss.py中ComputeLoss Class中的__call__和ComputeLossOTA Class中的__call__函数中修改一下:

原本的__call__函数如下: 主要对上述两个红框部分替换为以下代码:

if type(iou) is tuple: lbox += (iou[1].detach() * (1 - iou[0])).mean() iou = iou[0]else: lbox += (1.0 - iou).mean() # iou loss原因是因为yolov7中的yaml配置文件有一个loss_ota的参数会选择采用哪一个Loss(ComputeLoss,ComputeLossOTA),为了避免有一个不记得修改,就两个都一起修改即可。

最后修改参数就在调用bbox_iou中进行修改即可,比如上面的代码就是使用了CIoU,如果你想使用Focal_EIoU那么你可以修改为下:iou = bbox_iou(pbox.T, selected_tbox, x1y1x2y2=False, EIoU=True, Focal=True)最后希望这篇文章可以帮助到大家。博文求点赞,github求star,谢谢啦!
本文链接地址:https://www.jiuchutong.com/zhishi/299754.html 转载请保留说明!

上一篇:Web自动化测试怎么做?Web自动化测试的详细流程和步骤(web 自动化测试)

下一篇:反射填充详解ReflectionPad2d(padding)(反射dll)

  • 十五个推广引流的方法(2020推广引流技巧)

    十五个推广引流的方法(2020推广引流技巧)

  • vivox70怎么打开开发者模式(vivox70怎么打开nfc功能)

    vivox70怎么打开开发者模式(vivox70怎么打开nfc功能)

  • 小米手环4nfc版有声音吗(小米手环4nfc版怎么连接手机)

    小米手环4nfc版有声音吗(小米手环4nfc版怎么连接手机)

  • 手机为什么没有声音了(手机为什么没有信号了重启也没有用)

    手机为什么没有声音了(手机为什么没有信号了重启也没有用)

  • 支付宝如何注销账号(支付宝如何注销etc设备)

    支付宝如何注销账号(支付宝如何注销etc设备)

  • 一个人可以注册几个淘宝(一个人可以注册多个个体户吗)

    一个人可以注册几个淘宝(一个人可以注册多个个体户吗)

  • 华为手机老是闪退是怎么回事(华为手机老是闪屏是什么原因造成的)

    华为手机老是闪退是怎么回事(华为手机老是闪屏是什么原因造成的)

  • 遥控器灯一直亮不能用(遥控器灯一直亮着按着没反应)

    遥控器灯一直亮不能用(遥控器灯一直亮着按着没反应)

  • 计算机主要功能是什么(计算机主要功能是进行什么运算)

    计算机主要功能是什么(计算机主要功能是进行什么运算)

  • qq视频压缩失败无法发送怎么办(qq视频压缩失败无法播放)

    qq视频压缩失败无法发送怎么办(qq视频压缩失败无法播放)

  • 拉黑的电话打过来有显示吗(拉黑的电话打过去是关机吗)

    拉黑的电话打过来有显示吗(拉黑的电话打过去是关机吗)

  • 小米手机需要贴膜吗(小米手机需要贴镜头膜吗)

    小米手机需要贴膜吗(小米手机需要贴镜头膜吗)

  • 手机微信支付不了怎么回事(手机微信支付不绑定银行卡可以吗)

    手机微信支付不了怎么回事(手机微信支付不绑定银行卡可以吗)

  • 快手里面的关注页是啥意思(快手里面的关注怎么全部删除)

    快手里面的关注页是啥意思(快手里面的关注怎么全部删除)

  • 怎样在恋爱记里解除关系(怎样在恋爱记里找到对象)

    怎样在恋爱记里解除关系(怎样在恋爱记里找到对象)

  • 视频vue如何修改@字幕(vue保存的视频怎么改封面)

    视频vue如何修改@字幕(vue保存的视频怎么改封面)

  • 怎么打开苹果闪付(怎么打开苹果闪光灯功能)

    怎么打开苹果闪付(怎么打开苹果闪光灯功能)

  • 苹果11有屏幕指纹吗(苹果11有屏幕指纹功能吗)

    苹果11有屏幕指纹吗(苹果11有屏幕指纹功能吗)

  • 华为手机p30pro一键锁屏在哪里设置(华为手机p30Pro一直喊红包来了怎么关闭)

    华为手机p30pro一键锁屏在哪里设置(华为手机p30Pro一直喊红包来了怎么关闭)

  • 怎样设置艺术字位置的水平位置(怎样设置艺术字位置)

    怎样设置艺术字位置的水平位置(怎样设置艺术字位置)

  • 如何运营公众号(如何运营公众号月入3万)

    如何运营公众号(如何运营公众号月入3万)

  • iqoo怎么坐地铁(iqooneo3怎么刷公交卡)

    iqoo怎么坐地铁(iqooneo3怎么刷公交卡)

  • 一加7pro防水吗(一加7t pro防水吗)

    一加7pro防水吗(一加7t pro防水吗)

  • 黑鲨手机如何备份数据(黑鲨手机怎么备份数据)

    黑鲨手机如何备份数据(黑鲨手机怎么备份数据)

  • 手机充电口插不到底(手机充电口插不进去是什么原因)

    手机充电口插不到底(手机充电口插不进去是什么原因)

  • python类方法的注意点(python中类方法有什么用)

    python类方法的注意点(python中类方法有什么用)

  • 住宿业的小规模纳税标准
  • 资源税的纳税期限包括
  • 公司注销,账务怎么处理
  • 劳务费专票需要备注吗
  • 民办幼儿园的税收是多少
  • 外贸企业当月没交税
  • 销售自己使用过的物品
  • 养老基金利率多少
  • 外经证缴纳个税流程
  • 未认证的进项税账务处理
  • 报销购物卡发票公司如何交税?
  • 公司向员工个人借款
  • 收到发票怎么记账
  • 工资薪金支出怎么调整
  • 个人转让住房要交哪些税费?
  • 一年过去了,特朗普减税效果如何?
  • 商铺租金收入税是多少税率
  • 定额发票2019年规定
  • 企业预算报表如何做
  • 专票的六位开票代码指的是什么
  • 个人将租来的房子转租如何交税
  • 出口退税免退税办法
  • 购买活动赠品会计分录
  • 利息收入会计如何做账
  • 个人缴纳公积金有什么好处
  • win10设置系统启动
  • 幼儿园会计做账实操
  • 财务预提
  • 合伙企业取得红利怎么交税
  • 纳税确有困难标准
  • 职工薪酬可能计入什么科目
  • 房产证和不动产权证都要办理吗
  • 逾期未收回包装物押金增值税怎么算
  • 股权投资的收益回收方式
  • cvpr2020结果
  • 企业支付给员工的一次性伤残就业补助金计入哪项费用
  • 黄石国家公园的建立意义
  • vue 使用js
  • framework for
  • php面向对象是什么意思
  • thinkphp框架介绍
  • 元素鼠标失灵了怎么办
  • 基于springboot的oa
  • pytorch1.9.0
  • 装修费用当月摊还是次月摊销
  • php jsonp
  • 印花税申报时间填错了怎么处理?
  • 企业公章的使用和管理规定
  • php sql 教程
  • 辅助生产车间照明费用计入什么科目
  • 或有对价的确认条件
  • 增值税普通发票查询
  • 多用途卡的监管机构是
  • 库存商品冲回
  • 补提当年折旧会计分录
  • 财政补贴的政策
  • 贷款减值准备是什么意思
  • 企业实收资本的用途
  • 待处理财产损溢借贷反向
  • 应付职工薪酬包括福利费吗
  • MySQL中的max()函数使用教程
  • sql语句百度百科
  • windows内核版本9600
  • linux系统中对新磁盘分区的命令
  • dx12不支持dx11解决办法
  • 系统更新win10
  • win8引导盘
  • Win7系统怎么打开文件后缀名
  • Linux+Apache+PHP+MySQL+Zend Optimizer+PHPMyAdmin
  • linux怎么把网卡down
  • Java中string类型比较大小
  • nodejs获取客户端ip地址
  • unity shader cull off
  • 点击android
  • 基于jquery的框架有哪些
  • python str()怎么用
  • 如何判断python列表长度
  • 补农行卡怎么补几天能补完
  • 征收两道消费税怎么算
  • 成都租房备案凭证怎么办理
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设