位置: IT常识 - 正文

鲁棒性的含义以及如何提高模型的鲁棒性(鲁棒性分析方法)

编辑:rootadmin
鲁棒性的含义以及如何提高模型的鲁棒性 1、含义

推荐整理分享鲁棒性的含义以及如何提高模型的鲁棒性(鲁棒性分析方法),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:鲁棒性原理,鲁棒性原则的含义,鲁棒性原则的含义,鲁棒性原理,鲁棒性算法,鲁棒性原理,鲁棒性主成分分析,鲁棒性主成分分析,内容如对您有帮助,希望把文章链接给更多的朋友!

鲁棒是Robust的音译,也就是健壮和强壮的意思。它也是在异常和危险情况下系统生存的能力。比如说,计算机软件在输入错误、磁盘故障、网络过载或有意攻击情况下,能否不死机、不崩溃,就是该软件的鲁棒性。所谓“鲁棒性”,也是指控制系统在一定(结构,大小)的参数摄动下,维持其它某些性能的特性。根据对性能的不同定义,可分为稳定鲁棒性和性能鲁棒性。以闭环系统的鲁棒性作为目标设计得到的固定控制器称为鲁棒控制器。

鲁棒性包括稳定鲁棒性和品质鲁棒性。一个控制系统是否具有鲁棒性,是它能否真正实际应用的关键。因此,现代控制系统的设计已将鲁棒性作为一种最重要的设计指标。

AI模型的鲁棒可以理解为模型对数据变化的容忍度。假设数据出现较小偏差,只对模型输出产生较小的影响,则称模型是鲁棒的。 Huber从稳健统计的角度给出了鲁棒性的3个要求:

模型具有较高的精度或有效性。对于模型假设出现的较小偏差(noise),只能对算法性能产生较小的影响。对于模型假设出现的较大偏差(outlier),不能对算法性能产生“灾难性”的影响。

2、鲁棒性和稳定性的区别

鲁棒性即稳健性,外延和内涵不一样;稳定性只做本身特性的描述。鲁棒性指一个具体的控制器,如果对一个模型族中的每个对象都能保证反馈系统内稳定,那么就称其为鲁棒稳定的。稳定性指的是系统在某个稳定状态下受到较小的扰动后仍能回到原状态或另一个稳定状态。

3、鲁棒性和泛化性的区别

鲁棒性是控制论中的词语,主要指在某些参数略微改变或控制量稍微偏离最优值时系统仍然保持稳定性和有效性。泛化能力指根据有限样本得到的网络模型对其他变量域也有良好的预测能力。根据泛化能力好的网络设计的神经网络控制器的鲁棒性也会有所改善。鲁棒性指自己主动去改变网络中的相关参数,细微地修改(破坏)模型,也能得到理想的效果;而泛化能力是指,在不主动修改(破坏)模型的前提下,被动接受不同的外界输入,都能得到相应的理想的效果。

4、如何提升模型鲁棒性研究方向

为了提升模型的鲁棒性, 现在主流的研究大致分为三个方向: 1、修改模型输入数据, 包括在训练阶段修改训练数据以及在测试阶段修改输入的样本数据。 2、修改网络结构, 比如添加更多的网络层数,改变损失函数或激活函数等方法。 3、添加外部模块作为原有网络模型的附加插件, 提升网络模型的鲁棒性。

常用的方法1、Dropout

解决的问题:co-adaptation(在神经网络中,隐藏层单元之间有很高的相关性)。Dropout可以看作一个噪声 [公式] 和全连接矩阵 [公式] 作乘积,随机导致一部分连接权重为0。Dropout能够有效缓解神经元之间的co-adaptation(之前一起发挥作用的神经元现在可能单独出现了)。训练时,每次dropout都会得到一个新的子网络。预测时,所有的神经元都会发生作用,可以看作多个子网络的平均。因此dropout类似于bagging和 [公式] 正则,不同之处在于dropout的多个子网络之间共享参数,同时神经元是被随机丢弃的。

2、Batch/Layer Normalization鲁棒性的含义以及如何提高模型的鲁棒性(鲁棒性分析方法)

Normalization将激活层的输入标准化,使得标准化后的输入能够落在激活函数的非饱和区。

3、Label Smoothing

label smoothing就是把原来的one-hot表示,在每一维上都添加了一个随机噪音。这是一种简单粗暴,但又十分有效的方法,目前已经使用在很多的图像分类模型中了。 Label Smoothing 优势:

1、一定程度上,可以缓解模型过于武断的问题,也有一定的抗噪能力 弥补了简单分类中监督信号不足(信息熵比较少)的问题,增加了信息量; 2、提供了训练数据中类别之间的关系(数据增强); 3、可能增强了模型泛化能力 4、降低feature norm (feature normalization)从而让每个类别的样本聚拢的效果(文章[10]提及) 5、产生更好的校准网络,从而更好地泛化,最终对不可见的生产数据产生更准确的预测。(文章[11]提及)

Label Smoothing 劣势:

1、单纯地添加随机噪音,也无法反映标签之间的关系,因此对模型的提升有限,甚至有欠拟合的风险。 2、它对构建将来作为教师的网络没有用处,hard 目标训练将产生一个更好的教师神经网络。(文章[11]提及)

4、Mixup

mixup是一种非常规的数据增强方法,一个和数据无关的简单数据增强原则,其以线性插值的方式来构建新的训练样本和标签。最终对标签的处理如下公式所示,这很简单但对于增强策略来说又很不一般。

(xi,yi)\left ( x_{i},y_{i} \right )(xi​,yi​),(xj,yj)\left ( x_{j},y_{j} \right )(xj​,yj​)两个数据对是原始数据集中的训练样本对(训练样本和其对应的标签)。其中λ\lambdaλ是一个服从B分布的参数,λ∼Beta(α,α)\lambda\sim Beta\left ( \alpha ,\alpha \right )λ∼Beta(α,α) 。Beta分布的概率密度函数如下图所示,其中α∈[,+∞]\alpha \in \left [ 0,+\infty \right ]α∈[0,+∞]

因此α\alphaα是一个超参数,随着α\alphaα的增大,网络的训练误差就会增加,而其泛化能力会随之增强。而当α→∞\alpha \rightarrow \inftyα→∞时,模型就会退化成最原始的训练策略。参考:https://www.jianshu.com/p/d22fcd86f36d

5、半监督学习,利用伪标签增加模型的泛化性6、Focal Loss

Focal loss 主要是为了解决目标检测中正负样本比例严重失衡的问题,并不是通常的正则化化方法。该损失函数降低了大量简单样本在训练中所占的权重,让模型更加关注困难、错分的样本。

上面的几种方式,是我常用的几种方法,更多的可以参考: https://zhuanlan.zhihu.com/p/434106564

本文链接地址:https://www.jiuchutong.com/zhishi/298899.html 转载请保留说明!

上一篇:视觉SLAM总结——SuperPoint / SuperGlue(视觉slam ba)

下一篇:基于MATLAB的随机森林分类(基于matlab的随机森林回归和交叉验证)

  • 小米buds4pro支持AAC吗(小米buds4pro支持骁龙畅听吗)

    小米buds4pro支持AAC吗(小米buds4pro支持骁龙畅听吗)

  • df -h命令(df -h命令参数详解linux)

    df -h命令(df -h命令参数详解linux)

  • 宏基4752g固态硬盘安装教程(宏基4752怎么样)(宏基4752g固态硬盘教程)

    宏基4752g固态硬盘安装教程(宏基4752怎么样)(宏基4752g固态硬盘教程)

  • 荣耀X30Max支持nfc吗(荣耀x30max支持nfc吗)

    荣耀X30Max支持nfc吗(荣耀x30max支持nfc吗)

  • win10卓越性能模式和高性能有什么区别(win10卓越性能模式有用吗)

    win10卓越性能模式和高性能有什么区别(win10卓越性能模式有用吗)

  • 苹果耳机为啥一直闪白灯(苹果耳机为啥一个有电一个没电)

    苹果耳机为啥一直闪白灯(苹果耳机为啥一个有电一个没电)

  • iphone相机镜面怎么关(iphone 相机 镜面)

    iphone相机镜面怎么关(iphone 相机 镜面)

  • 苹果ld账号是什么意思(苹果id账号是)

    苹果ld账号是什么意思(苹果id账号是)

  • 苹果6怎么隐藏软件图标(苹果6怎么隐藏照片后设置密码)

    苹果6怎么隐藏软件图标(苹果6怎么隐藏照片后设置密码)

  • 电池健康度怎么看(电池健康度怎么恢复)

    电池健康度怎么看(电池健康度怎么恢复)

  • 微信语音通话中断是谁挂的(微信语音通话中无法听语音)

    微信语音通话中断是谁挂的(微信语音通话中无法听语音)

  • 苹果11pro max和11pro有什么区别(苹果11pro max和11pro屏幕大小)

    苹果11pro max和11pro有什么区别(苹果11pro max和11pro屏幕大小)

  • 微信社交资料怎么改(微信社交资料怎么看)

    微信社交资料怎么改(微信社交资料怎么看)

  • 三星9550是什么型号(三星9550是什么国行吗)

    三星9550是什么型号(三星9550是什么国行吗)

  • qualcomm snapdragon632是什么处理器(qualcomm snapdragon632g)

    qualcomm snapdragon632是什么处理器(qualcomm snapdragon632g)

  • 支付宝新人专区找不到(支付宝新人专享活动界面怎么找)

    支付宝新人专区找不到(支付宝新人专享活动界面怎么找)

  • 快手怎么艾特自己名字(快手怎么艾特自己关注的人)

    快手怎么艾特自己名字(快手怎么艾特自己关注的人)

  • commander是什么软件(commandline是什么软件)

    commander是什么软件(commandline是什么软件)

  • word文字加底纹(word文字加底纹图案样式怎么设置)

    word文字加底纹(word文字加底纹图案样式怎么设置)

  • 怎么把微博定位改到别的城市(怎么把微博位置定位到想定位的地方)

    怎么把微博定位改到别的城市(怎么把微博位置定位到想定位的地方)

  • 什么手机支持华为一碰传(什么手机支持华为hicar)

    什么手机支持华为一碰传(什么手机支持华为hicar)

  • oppo剪切板如何清除(oppo手机剪切板在哪儿)

    oppo剪切板如何清除(oppo手机剪切板在哪儿)

  • ios13 怎么图标变小(苹果13怎么改变图标)

    ios13 怎么图标变小(苹果13怎么改变图标)

  • 饿了么订单怎么删除(饿了么订单怎么查看送达时间)

    饿了么订单怎么删除(饿了么订单怎么查看送达时间)

  • 自己发的抖音怎么看不到(自己发的抖音怎么去水印)

    自己发的抖音怎么看不到(自己发的抖音怎么去水印)

  • 启用或关闭Windows功能列表空白(启用或关闭windows功能怎么勾选)

    启用或关闭Windows功能列表空白(启用或关闭windows功能怎么勾选)

  • 企业增值税退税是算企业利润的吗
  • 主营业务成本借方表示什么意思
  • 个税申报可以去税务局吗
  • 任意盈余公积使用范围
  • 劳务公司收到劳务费怎么做账
  • 总公司汇总缴纳所得税升为一般纳税人分公司受影响吗
  • 自然人税收系统怎么添加人员
  • 土地使用税延期还延续吗
  • 收益性支出应计入产品成本对吗
  • 所得税汇算清缴时间期限
  • 企业计提福利费时,贷记应付职工薪酬
  • 企业留存收益包括盈余公积和未分配利润
  • 外单位的人能否作为本单位的费用报销人?
  • 企业出现经营异常
  • 已认证未抵扣进项税如何做账
  • 增值税专用发票使用规定 最新
  • 公司缴纳的社保离职后自己可以缴纳社保
  • 代缴社保工资怎么做账
  • 退休返聘人员的劳动权益保护
  • 油漆的消费税
  • 税务罚款计入哪个会计科目
  • 工程什么情况下可以索赔
  • 开电脑店几年搞活动好吗
  • 企业计提的坏帐会计分录
  • linux系统中安装软件的批处理文件
  • babel-plugin-import
  • 国家占耕地补偿款给谁?
  • ValueError: all the input arrays must have same number of dimensions, but the array at index 0 has 1
  • 直接将word转化为ppt
  • python程序怎么看
  • 个体工商户如何给员工交社保
  • 季度利润表中的营业收入怎么算
  • php mysql pdo
  • densenet网络结构详解
  • 买税盘的会计分录
  • reorg table 命令
  • 库存现金盘亏盘盈
  • 销售不动产预征率是多少
  • 税控机清单
  • Python psd-tools如何转换文件
  • 工业企业辅助生产设备
  • 银行结算方式有哪几种方式?其具体内容是什么?
  • sql server功能介绍
  • sql 附加数据库
  • 什么是营业净利率计算公式
  • 生日卡和过节卡一样吗
  • 代收资金清算过程
  • 长期待摊费用摊销会计分录
  • 费用少计提了怎么办
  • 销售边角料税率是多少
  • 公司开业前期费用谁出
  • 销售货物物流运输丢失取得赔偿款需要缴纳企业所得税吗
  • 房租退回进项税额转出会计分录
  • 代驾服务费属于哪个税收编码
  • 子公司实现利润怎么会计处理
  • 电子发票如何申请电子签章
  • 要交多少税收跟什么有关
  • 租赁费计提部分算入印花税吗
  • 退回的企业所得税计入什么科目
  • 单位车辆保险费
  • 数据库句柄是什么意思
  • sql server本地服务器地址如何查看
  • sqlserver创建链接服务器连接实例
  • freebsd11.3安装教程
  • wordpress怎么安装插件
  • win10玩cf几分钟无响应
  • linux使用vi编辑文件
  • win7软件界面显示不全怎么办
  • cocos2dx官方教程
  • bash脚本语法
  • java跟python哪个好
  • cocos2dx 2.2.2
  • 安卓listview控件map的用法前面每行加图片
  • [置顶]游戏名 TentacleLocker
  • vr project
  • jqueryui draggable
  • python爬虫抓取数据的步骤
  • 建筑企业要交哪几项环保税
  • 发票代码如何查询公司
  • 重庆轨道第五轮19号线路
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设