位置: IT常识 - 正文

【深度学习】模型过拟合的原因以及解决办法

编辑:rootadmin
【深度学习】模型过拟合的原因以及解决办法 【深度学习】模型过拟合的原因以及解决办法1、背景2、模型拟合3、简述原因4、欠拟合解决办法5、过拟合解决办法1、背景

推荐整理分享【深度学习】模型过拟合的原因以及解决办法,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

所谓模型过拟合现象: 在训练网络模型的时候,会发现模型在训练集上表现很好,但是在测试集上表现一般或者很差。 总结一句话:已知数据预测的很好,但对未知数据预测得很差的现象。

模型过拟合将图片数据的噪声当成特征点学习进去,导致模型的泛化能力很差, 只能在训练集上表现不错,对未知的其它样本预测表现不佳!

我们通过深度学习或者机器学习的根本问题是解决优化和泛化的问题平衡。 优化问题:训练模型以在训练数据上得到最佳性能。 泛化问题:模型在测试集上的取得很好的性能。

简单分析在模型训练过程的初期和后期:

2、模型拟合

模型拟合分为过拟合和欠拟合以及适度拟合。 下面以表格的形式表示拟合程度的简要判断标准。

训练集准确率测试集准确率得出结论不好不好欠拟合好不好过拟合好好适度拟合

以下是欠拟合、适度拟合、过拟合的抽象数学表达以及形象展示拟合的程度。 第1组模型欠拟合:模型复杂度过低,抽象出的数学公式过于简单,有很多错分的数据,不能很好的你和我们的训练集。 第2组模型拟合适度:虽然有个别错误数据点,但是预测新数据效果很好。 第3组模型过拟合:模型复杂度过高,抽象出的数学公式非常复杂,很完美的拟合训练集的每个数据,但过度强调拟合原始数据。预测新数据时它的表现性很差。

3、简述原因

欠拟合: 训练的特征量过少。 模型复杂度过低,网络模型过于简单。 训练数据集非常不健康,存在大量的错误标注。

【深度学习】模型过拟合的原因以及解决办法

过拟合: 样本数量太少,样本数据不足以代表预定的分类规则。 样本噪音干扰过大,将大部分噪音认为是特征从而扰乱了预设的分类规则。

4、欠拟合解决办法

对于欠拟合:总结一句话是模型简单的,样本数据量不够。

扩充样本数据,则增加更多的样本数据特征,使输入数据具有更强的表达能力。增加模型复杂度:更换更复杂的网络模型,或者网络模型取消掉原有的正则化参数,正则化的目的是用来防止过拟合的,但是模型出现了欠拟合,则需要减少正则化参数,不过这种方法一般不用,通常是更换更复杂的网络。增加模型训练的迭代次数,模型训练迭代次数太少,训练的数据特征未充分学习。手动调整参数和超参数。5、过拟合解决办法

对于过拟合:发生过拟合最常见的现象就是数据量太少而模型太复杂。 训练集的数量级和模型的复杂度不匹配,大致思路是训练集的数量级要小于模型的复杂度。

首先增加训练数据数的样本数据量,并检查样本标签的准确性,训练集越多,过拟合的概率越小。 最好的是人工标注高质量的数据,可以采用一定的数据增强策略,来实现数据集的扩充。 注意扩充后的图像要手动确认,因为可能会有脏数据,从而会引入一定的噪声,噪声也会影响模型的性能的。

样本噪音干扰过大,需要手动清理掉脏数据,否则模型过分学习了噪音特征,反而忽略了真实的输入输出间的关系

参数太多,模型复杂度过高,将模型更换为更简单的网络模型,或者正则化L1和L2。 L1是模型各个参数的绝对值之和。L2是模型各个参数的平方和的开方值。 使用正则化约束:损失函数后面添加正则化项,可以避免训练出来的参数过大从而使模型过拟合。使用正则化缓解过拟合的手段广泛应用,不论是在线性回归还是在神经网络的梯度下降计算过程中,都应用到了正则化的方法。常用的正则化有l1正则和l2正则。

使用Dropout,即按一定的比例去除隐藏层的神经单元,使神经网络的结构简单化。torch.nn.Dropout(0.6),这里的0.6是神经元不保留的概率。

使用BN:Batch Normalization批归一化处理层,作用非常大。使得每一层的数据分布不变,做归一化处理,加快了模型的收敛速度,避免梯度消失、提高准确率。

保证训练数据的分布和测试数据的分布要保持一致,否则模型学习识鸟,你用它识别鸡蛋。

不要过度训练,提前结束训练early-stopping:训练时间足够长,模型就会把一些噪声隐含的规律学习到,这个时候降低模型的性能是显而易见的。所以建议在模型迭代训练时候记录训练精度(或损失)和验证精度(或损失),如果模型训练的效果不再提高,比如训练误差一直在降低但是验证误差却不再降低甚至上升,这时候便可以结束模型训练了。

手动调整参数和超参数。

本文链接地址:https://www.jiuchutong.com/zhishi/298875.html 转载请保留说明!

上一篇:车道线检测数据集介绍(车道线检测视频素材)

下一篇:Vue基础--webpack介绍以及基础配置(vue中webpack用来干啥)

  • 小米9机身是多少厘米(小米9机身多厚)

    小米9机身是多少厘米(小米9机身多厚)

  • 小米手环跑步公里程严重不准(小米手环跑步公里程用手机准还是用手环准)

    小米手环跑步公里程严重不准(小米手环跑步公里程用手机准还是用手环准)

  • 华为手机删除的照片在哪里可以找到(华为手机删除的短信怎么恢复)

    华为手机删除的照片在哪里可以找到(华为手机删除的短信怎么恢复)

  • 蓝屏警告淘宝可以买吗?(蓝屏警告还会不会返场)

    蓝屏警告淘宝可以买吗?(蓝屏警告还会不会返场)

  • QQ离线请留言是关机了吗(qq离线请留言是手机关机了吗)

    QQ离线请留言是关机了吗(qq离线请留言是手机关机了吗)

  • 苹果时区自动设置不了(苹果时区自动设置)

    苹果时区自动设置不了(苹果时区自动设置)

  • 第一个分组计算机网络出现于(第一个分组计算机出现于哪一年)

    第一个分组计算机网络出现于(第一个分组计算机出现于哪一年)

  • 微信密码和qq密码一样吗(微信密码和qq密码不一样能登陆微信吗)

    微信密码和qq密码一样吗(微信密码和qq密码不一样能登陆微信吗)

  • qq那么多人扩列干什么吗(qq扩列每个人都有吗)

    qq那么多人扩列干什么吗(qq扩列每个人都有吗)

  • 华为nova6都有什么功能(华为nova6都有什么颜色)

    华为nova6都有什么功能(华为nova6都有什么颜色)

  • 苹果11无法关机充电(苹果11无法关机一直转圈)

    苹果11无法关机充电(苹果11无法关机一直转圈)

  • 苹果支持30w快充吗(苹果支持30w快充不)

    苹果支持30w快充吗(苹果支持30w快充不)

  • 手机hw性能是什么(手机hw是什么意思的缩写)

    手机hw性能是什么(手机hw是什么意思的缩写)

  • 苹果手机的表情在安卓的手机里能看到吗(苹果手机的表情包在哪里)

    苹果手机的表情在安卓的手机里能看到吗(苹果手机的表情包在哪里)

  • oppor15x怎么设置录屏(oppor15x怎么设置屏幕常亮)

    oppor15x怎么设置录屏(oppor15x怎么设置屏幕常亮)

  • 华为mate30是不是曲屏(华为mate30什么型号)

    华为mate30是不是曲屏(华为mate30什么型号)

  • 淘宝删掉的订单怎么找(淘宝删掉的订单记录怎么找回)

    淘宝删掉的订单怎么找(淘宝删掉的订单记录怎么找回)

  • 怎样设置手机爱心电量(手机里面怎么设置)

    怎样设置手机爱心电量(手机里面怎么设置)

  • 手机充电模式在哪里(手机充电选项在哪设置)

    手机充电模式在哪里(手机充电选项在哪设置)

  • 微信读书怎么取消连续包月(微信读书怎么取消私密阅读)

    微信读书怎么取消连续包月(微信读书怎么取消私密阅读)

  • qq打字出表情怎么关闭(qq输字出表情)

    qq打字出表情怎么关闭(qq输字出表情)

  • 魅族16spro什么时候上市(魅族16spro什么时候更新flyme9稳定版)

    魅族16spro什么时候上市(魅族16spro什么时候更新flyme9稳定版)

  • word跨页表格怎么衔接(word跨页表格怎么加续表)

    word跨页表格怎么衔接(word跨页表格怎么加续表)

  • 苹果mac浏览器全屏快捷键是Shift+Command+F吗(苹果电脑 浏览器)

    苹果mac浏览器全屏快捷键是Shift+Command+F吗(苹果电脑 浏览器)

  • 关闭动态磁贴(怎么关闭磁贴模式)

    关闭动态磁贴(怎么关闭磁贴模式)

  • 塞巴斯蒂安电影节举办地:圣塞巴斯蒂安和库尔萨尔文化中心 (© Aljndr/iStock/Getty Images Plus)(塞巴斯蒂安电影 豆瓣)

    塞巴斯蒂安电影节举办地:圣塞巴斯蒂安和库尔萨尔文化中心 (© Aljndr/iStock/Getty Images Plus)(塞巴斯蒂安电影 豆瓣)

  • sshpass命令  非交互式验证SSH密码(ssh非交互式登录)

    sshpass命令 非交互式验证SSH密码(ssh非交互式登录)

  • 建筑企业有哪些
  • 什么情况下视同销售
  • 增值税退税比例怎么算
  • 劳务派遣小规模纳税人税率是多少
  • 税控设备抵减增值税必须当月抵减吗
  • 先结转损益还是先结转本年利润
  • 公司股份无偿转让怎么办理流程
  • 对方把发票丢了可以重开吗
  • 固定资产未到期报废进项税额需要转出吗
  • 小规模纳税人购置税控设备
  • 国有独资企业董事会应当在每年
  • 床位周转率计算公式
  • 不达起征点收到销售额如何作分录?
  • 库存商品进行非货币资产交换收入怎么确定
  • 物业 免物业费
  • 各部门发生的医保费用
  • 显示发票离线,应当如何处理
  • 商砼税率是多少?
  • 累计折旧余额怎样结转
  • 花卉租赁属于哪个税目
  • 错误代码11-1114
  • 仓库折旧费
  • 应收票据与应付票据的使用与哪种银行结算方式有关
  • 一叶兰的养殖方法和注意事项有哪些
  • php文字转语音源码
  • arthas常用命令
  • php exit绕过
  • 收到业绩补偿会扣税吗
  • php函数写法
  • php 常用算法
  • node安装配置环境变量
  • opencv讲解
  • 人工智能业务架构图
  • laravel运行
  • 插件不支持是什么意思
  • 如何修改php网页内容
  • 企业年报网上申报入口贵州
  • 房租发票需要写备注吗
  • 上期未申报怎么办
  • 数字黑洞有哪些
  • PostgreSQL安装、配置及简单使用方法
  • 工业企业辅助生产设备
  • 税控盘每年的服务费可以全额抵扣吗
  • mysql 优化技巧
  • 公司网站设计怎么做
  • 车间装修预算表
  • 进项抵扣和销项抵扣
  • 什么是调表不调账
  • 外贸退税是算利润吗
  • 餐饮业可以开具免税发票吗
  • 印花税退还
  • 百旺金赋开票系统图标
  • 香港公司账户收美元要交税吗
  • 买入返售证券什么意思
  • sql排序分组
  • sql server索引怎么用
  • 让Windows Server 2008系统安全更上一层楼
  • linux远程登录命令ssh
  • linux中磁盘分区
  • vmware虚拟机Linux扩展硬盘
  • 苹果电脑怎么关掉已经打开的页面
  • 查看linux的命令
  • win7系统开机后桌面黑屏
  • unityfs 加密反编译
  • node.js原生支持的编码格式
  • bat脚本自动点击按钮
  • pycharm安装教程2020.2
  • web jquery
  • 自动清除数据
  • javascript nextSibling 与 getNextElement(node) 使用介绍
  • canvas基础
  • JQuery解析XML的方法小结
  • 浅谈如何加强基层党组织建设
  • python魔法方法有啥用
  • 使用jQuery Rotare实现微信大转盘抽奖功能
  • 湖北税务发票真伪查询网
  • 怎么看上期留抵税额
  • 税务稽查人员占税务人员比例
  • 小微企业印花税减半政策
  • 国家土地征收管理办法
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设