位置: IT常识 - 正文

分割网络损失函数总结!交叉熵,Focal loss,Dice,iou,TverskyLoss!(网络分割算法)

编辑:rootadmin
分割网络损失函数总结!交叉熵,Focal loss,Dice,iou,TverskyLoss! 文章目录前言一、交叉熵loss二、Focal loss一、Dice损失函数一、IOU损失一、TverskyLoss总结前言

推荐整理分享分割网络损失函数总结!交叉熵,Focal loss,Dice,iou,TverskyLoss!(网络分割算法),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:gan网络损失函数,网络分割算法,分割网络有哪些,分类网络损失函数,分割网络有哪些,网络分割算法,分类网络损失函数,分割网络损失函怎么写,内容如对您有帮助,希望把文章链接给更多的朋友!

在实际训练分割网络任务过程中,损失函数的选择尤为重要。对于语义分割而言,极有可能存在着正负样本不均衡,或者说类别不平衡的问题,因此选择一个合适的损失函数对于模型收敛以及准确预测有着至关重要的作用。

一、交叉熵loss

M为类别数; yic为示性函数,指出该元素属于哪个类别; pic为预测概率,观测样本属于类别c的预测概率,预测概率需要事先估计计算;

缺点: 交叉熵Loss可以用在大多数语义分割场景中,但它有一个明显的缺点,那就是对于只用分割前景和背景的时候,当前景像素的数量远远小于背景像素的数量时,即背景元素的数量远大于前景元素的数量,背景元素损失函数中的成分就会占据主导,使得模型严重偏向背景,导致模型训练预测效果不好。

分割网络损失函数总结!交叉熵,Focal loss,Dice,iou,TverskyLoss!(网络分割算法)

同理BCEloss同样面临着这个问题,BCEloss如下。 对所有N个类别都做一次二分类损失计算。

#二值交叉熵,这里输入要经过sigmoid处理import torchimport torch.nn as nnimport torch.nn.functional as Fnn.BCELoss(F.sigmoid(input), target)#多分类交叉熵, 用这个 loss 前面不需要加 Softmax 层nn.CrossEntropyLoss(input, target)二、Focal loss

何凯明团队在RetinaNet论文中引入了Focal Loss来解决难易样本数量不平衡,我们来回顾一下。 对样本数和置信度做惩罚,认为大样本的损失权重和高置信度样本损失权重较低。

class FocalLoss(nn.Module): """ copy from: https://github.com/Hsuxu/Loss_ToolBox-PyTorch/blob/master/FocalLoss/FocalLoss.py This is a implementation of Focal Loss with smooth label cross entropy supported which is proposed in 'Focal Loss for Dense Object Detection. (https://arxiv.org/abs/1708.02002)' Focal_Loss= -1*alpha*(1-pt)*log(pt) :param num_class: :param alpha: (tensor) 3D or 4D the scalar factor for this criterion :param gamma: (float,double) gamma > 0 reduces the relative loss for well-classified examples (p>0.5) putting more focus on hard misclassified example :param smooth: (float,double) smooth value when cross entropy :param balance_index: (int) balance class index, should be specific when alpha is float :param size_average: (bool, optional) By default, the losses are averaged over each loss element in the batch. """ def __init__(self, apply_nonlin=None, alpha=None, gamma=2, balance_index=0, smooth=1e-5, size_average=True): super(FocalLoss, self).__init__() self.apply_nonlin = apply_nonlin self.alpha = alpha self.gamma = gamma self.balance_index = balance_index self.smooth = smooth self.size_average = size_average if self.smooth is not None: if self.smooth < 0 or self.smooth > 1.0: raise ValueError('smooth value should be in [0,1]') def forward(self, logit, target): if self.apply_nonlin is not None: logit = self.apply_nonlin(logit) num_class = logit.shape[1] if logit.dim() > 2: # N,C,d1,d2 -> N,C,m (m=d1*d2*...) logit = logit.view(logit.size(0), logit.size(1), -1) logit = logit.permute(0, 2, 1).contiguous() logit = logit.view(-1, logit.size(-1)) target = torch.squeeze(target, 1) target = target.view(-1, 1) # print(logit.shape, target.shape) # alpha = self.alpha if alpha is None: alpha = torch.ones(num_class, 1) elif isinstance(alpha, (list, np.ndarray)): assert len(alpha) == num_class alpha = torch.FloatTensor(alpha).view(num_class, 1) alpha = alpha / alpha.sum() elif isinstance(alpha, float): alpha = torch.ones(num_class, 1) alpha = alpha * (1 - self.alpha) alpha[self.balance_index] = self.alpha else: raise TypeError('Not support alpha type') if alpha.device != logit.device: alpha = alpha.to(logit.device) idx = target.cpu().long() one_hot_key = torch.FloatTensor(target.size(0), num_class).zero_() one_hot_key = one_hot_key.scatter_(1, idx, 1) if one_hot_key.device != logit.device: one_hot_key = one_hot_key.to(logit.device) if self.smooth: one_hot_key = torch.clamp( one_hot_key, self.smooth/(num_class-1), 1.0 - self.smooth) pt = (one_hot_key * logit).sum(1) + self.smooth logpt = pt.log() gamma = self.gamma alpha = alpha[idx] alpha = torch.squeeze(alpha) loss = -1 * alpha * torch.pow((1 - pt), gamma) * logpt if self.size_average: loss = loss.mean() else: loss = loss.sum() return loss一、Dice损失函数

集合相似度度量函数。通常用于计算两个样本的相似度,属于metric learning。X为真实目标mask,Y为预测目标mask,我们总是希望X和Y交集尽可能大,占比尽可能大,但是loss需要逐渐变小,所以在比值前面添加负号。 可以缓解样本中前景背景(面积)不平衡带来的消极影响,前景背景不平衡也就是说图像中大部分区域是不包含目标的,只有一小部分区域包含目标。Dice Loss训练更关注对前景区域的挖掘,即保证有较低的FN,但会存在损失饱和问题,而CE Loss是平等地计算每个像素点的损失。因此单独使用Dice Loss往往并不能取得较好的结果,需要进行组合使用,比如Dice Loss+CE Loss或者Dice Loss+Focal Loss等。

该处说明原文链接:https://blog.csdn.net/Mike_honor/article/details/125871091

def dice_loss(prediction, target): """Calculating the dice loss Args: prediction = predicted image target = Targeted image Output: dice_loss""" smooth = 1.0 i_flat = prediction.view(-1) t_flat = target.view(-1) intersection = (i_flat * t_flat).sum() return 1 - ((2. * intersection + smooth) / (i_flat.sum() + t_flat.sum() + smooth))def calc_loss(prediction, target, bce_weight=0.5): """Calculating the loss and metrics Args: prediction = predicted image target = Targeted image metrics = Metrics printed bce_weight = 0.5 (default) Output: loss : dice loss of the epoch """ bce = F.binary_cross_entropy_with_logits(prediction, target) prediction = F.sigmoid(prediction) dice = dice_loss(prediction, target) loss = bce * bce_weight + dice * (1 - bce_weight) return loss一、IOU损失

该损失函数与Dice损失函数类似,都是metric learning衡量,在实验中都可以尝试,在小目标分割收敛中有奇效!

def SoftIoULoss( pred, target): # Old One pred = torch.sigmoid(pred) smooth = 1 # print("pred.shape: ", pred.shape) # print("target.shape: ", target.shape) intersection = pred * target loss = (intersection.sum() + smooth) / (pred.sum() + target.sum() -intersection.sum() + smooth) # loss = (intersection.sum(axis=(1, 2, 3)) + smooth) / \ # (pred.sum(axis=(1, 2, 3)) + target.sum(axis=(1, 2, 3)) # - intersection.sum(axis=(1, 2, 3)) + smooth) loss = 1 - loss.mean() # loss = (1 - loss).mean() return loss一、TverskyLoss

分割任务也有不同侧重点,如医学分割更加关注召回率(高灵敏度),即真实mask尽可能都被预测出来,不太关注预测mask有没有多预测。B为真实mask,A为预测mask。|A-B|为假阳,|B-A|为假阴,alpha和beta可以控制假阳和假阴之间的权衡。若我们更加关注召回,则放大|B-A|的影响。 其中alpha和beta可以影响找回率和准确率,若想目标有较高的召回率,那么我们可以选择较高的beta。

class TverskyLoss(nn.Module): def __init__(self, apply_nonlin=None, batch_dice=False, do_bg=True, smooth=1., square=False): """ paper: https://arxiv.org/pdf/1706.05721.pdf """ super(TverskyLoss, self).__init__() self.square = square self.do_bg = do_bg self.batch_dice = batch_dice self.apply_nonlin = apply_nonlin self.smooth = smooth self.alpha = 0.3 self.beta = 0.7 def forward(self, x, y, loss_mask=None): shp_x = x.shape if self.batch_dice: axes = [0] + list(range(2, len(shp_x))) else: axes = list(range(2, len(shp_x))) if self.apply_nonlin is not None: x = self.apply_nonlin(x) tp, fp, fn = get_tp_fp_fn(x, y, axes, loss_mask, self.square) tversky = (tp + self.smooth) / (tp + self.alpha*fp + self.beta*fn + self.smooth) if not self.do_bg: if self.batch_dice: tversky = tversky[1:] else: tversky = tversky[:, 1:] tversky = tversky.mean() return -tversky总结

在经过一系列实验后,发现后四种损失函数更加适合小目标分割网络训练。但是每个任务都有差异,如果时间很充裕的话,可以挨个尝试一下。

本文链接地址:https://www.jiuchutong.com/zhishi/298409.html 转载请保留说明!

上一篇:vue3生命周期及setup介绍(vue3生命周期及使用)

下一篇:Cifar-10图像分类/Pytorch/LeNet/AlexNet(cifar10图像分类实验报告)

  • miui12如何关闭广告(miui12.5怎么关闭广告)

    miui12如何关闭广告(miui12.5怎么关闭广告)

  • 手机双摄像头有什么用(手机上双摄像头为什么就一个能用)

    手机双摄像头有什么用(手机上双摄像头为什么就一个能用)

  • honor7x怎么隐藏软件(honor7怎么隐藏软件)

    honor7x怎么隐藏软件(honor7怎么隐藏软件)

  • 抖音被拉黑还能@对方吗(抖音被拉黑还能搜到对方账号吗)

    抖音被拉黑还能@对方吗(抖音被拉黑还能搜到对方账号吗)

  • 微信能发压缩文件吗(微信能发压缩文件夹吗)

    微信能发压缩文件吗(微信能发压缩文件夹吗)

  • 人人视频会员可以多人同时用吗(人人视频会员可以看芒果吗)

    人人视频会员可以多人同时用吗(人人视频会员可以看芒果吗)

  • 腾讯课堂怎么分屏观看(腾讯课堂怎么分屏)

    腾讯课堂怎么分屏观看(腾讯课堂怎么分屏)

  • 苹果手机充电一直响怎么回事(苹果手机充电一闪一闪的充不进去电)

    苹果手机充电一直响怎么回事(苹果手机充电一闪一闪的充不进去电)

  • 希沃时间胶囊的视频能导出吗(希沃时间胶囊的好处)

    希沃时间胶囊的视频能导出吗(希沃时间胶囊的好处)

  • 手机翘屏是什么原因引起的(手机翘屏会越来越严重吗)

    手机翘屏是什么原因引起的(手机翘屏会越来越严重吗)

  • 小米8音量键失灵(小米8音量键失灵一直减,设置也不能控制)

    小米8音量键失灵(小米8音量键失灵一直减,设置也不能控制)

  • 艺术字的环绕位置在哪(艺术字环绕方式)

    艺术字的环绕位置在哪(艺术字环绕方式)

  • q9650相当于i几(q9650是真正的四核吗)

    q9650相当于i几(q9650是真正的四核吗)

  • 浏览器的兼容模式在哪(浏览器的兼容模式和极速模式有什么区别)

    浏览器的兼容模式在哪(浏览器的兼容模式和极速模式有什么区别)

  • sim卡已关闭什么意思(sim卡已关闭了打不开怎么办)

    sim卡已关闭什么意思(sim卡已关闭了打不开怎么办)

  • outlook中smtp协议是指(outlook的smtp服务器)

    outlook中smtp协议是指(outlook的smtp服务器)

  • 华为的快充头苹果能用吗(华为快充头苹果13可以使用吗)

    华为的快充头苹果能用吗(华为快充头苹果13可以使用吗)

  • 苹果x可以改成双卡吗(苹果x可以改成苹果12吗)

    苹果x可以改成双卡吗(苹果x可以改成苹果12吗)

  • 企业qq怎么群发消息(企业qq怎么发送文件)

    企业qq怎么群发消息(企业qq怎么发送文件)

  • air3是ipad几代(苹果平板air3是第几代)

    air3是ipad几代(苹果平板air3是第几代)

  • 花呗固定额度提升是什么意思(花呗固定额度提额方法)

    花呗固定额度提升是什么意思(花呗固定额度提额方法)

  • 华为cltal00是什么型号(华为cl00是什么型号手机)

    华为cltal00是什么型号(华为cl00是什么型号手机)

  • aiepk.exe是什么进程 aiepk是什么文件的进程(exe是什么进程)

    aiepk.exe是什么进程 aiepk是什么文件的进程(exe是什么进程)

  • 电脑刷新率调节教程(电脑刷新率怎么调低)

    电脑刷新率调节教程(电脑刷新率怎么调低)

  • 不是党员证明哪些情况需要开
  • 税控盘减免税款年末如何结转
  • 经营罚没物品增值税计算
  • 个体工商户核定应税所得率
  • 运输费可以和货款合并开票吗
  • 投标公司资质借用计入什么会计科目?
  • 公司支付收益权转让怎么做账?
  • 股权的溢价是什么意思
  • 合伙企业的投资者李某以企业资金
  • 淘宝企业店铺是工厂直销吗
  • 什么发票可以抵税
  • 机械租赁费发票图片
  • 关于一般纳税人提供非学历教育服务适用简易计税
  • 开票资料填写
  • 上月开的发票本月作废怎么处理
  • 质保金算合同资产
  • 利润表中的减是什么意思
  • 经营费用包括哪些科目明细
  • 路由器间歇性断网怎么解决
  • 收不回的心
  • 月末库存商品怎么记账
  • 合伙企业生产经营所得
  • 铁杆茉莉的养殖方法
  • 开办费的账务处理实例
  • 新公司成立的前期准备工作计划
  • antd 级联多选
  • nkvmon.exe - nkvmon是什么进程 有什么用
  • 问题解决能力
  • 事业单位包含哪些
  • linux系统设置屏幕常亮
  • php实现文件的下载
  • php模板引擎类
  • 增值税和所得税区别
  • python yolo
  • vuexy
  • php使用mysql
  • PHP编写简易计算器
  • at命令每天任务
  • java泛型方法的使用
  • 多收钱少开票
  • 小规模纳税人代收水电费税率
  • mongodb常用语句
  • dedecms建站操作
  • 运输发票怎么做账
  • 费用报销单里的类别怎么填
  • sqlserver实现离散组合算法
  • 公积金发票掉了怎么办
  • 什么情况下需要异地预缴增值税
  • 印花税申报成功未扣款还能更正吗
  • 收到返还工会经费大于管理费用
  • 会计凭证的做账原则
  • 贴现帐务处理
  • 不良品怎么入账
  • 买药费用应计入什么科目
  • 工程进度开票如何入账
  • 租赁费计提印花税税率
  • 建筑行业总产值占我国GDP的比重
  • 企业新增的残疾税
  • 银行结算卡年费多少
  • 哪些固定资产不计提折旧
  • 启用账簿时应在账簿上签名或盖章的是
  • mysql两个表连接
  • xtrabackup备份原理
  • 获取客户端所有cookie对象的方法
  • win7鼠标右键一闪就没了
  • openmpi编译
  • 苹果Mac系统怎么安装
  • mac文件权限
  • linux mount命令详解
  • xp如何禁用445
  • win8.1无法安装vmware tools
  • 搜狗浏览器2019版本
  • jquery中什么方法用于模拟光标悬停事件
  • 增强现实的三个特征
  • Python中random模块
  • js模拟点击alert()确定
  • android 打包
  • 北京地税咨询热线
  • 厦门地税电话客服电话
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设