位置: IT常识 - 正文

【深度学习】模型过拟合的原因以及解决办法

编辑:rootadmin
【深度学习】模型过拟合的原因以及解决办法 【深度学习】模型过拟合的原因以及解决办法1、背景2、模型拟合3、简述原因4、欠拟合解决办法5、过拟合解决办法1、背景

推荐整理分享【深度学习】模型过拟合的原因以及解决办法,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

所谓模型过拟合现象: 在训练网络模型的时候,会发现模型在训练集上表现很好,但是在测试集上表现一般或者很差。 总结一句话:已知数据预测的很好,但对未知数据预测得很差的现象。

模型过拟合将图片数据的噪声当成特征点学习进去,导致模型的泛化能力很差, 只能在训练集上表现不错,对未知的其它样本预测表现不佳!

我们通过深度学习或者机器学习的根本问题是解决优化和泛化的问题平衡。 优化问题:训练模型以在训练数据上得到最佳性能。 泛化问题:模型在测试集上的取得很好的性能。

简单分析在模型训练过程的初期和后期:

2、模型拟合

模型拟合分为过拟合和欠拟合以及适度拟合。 下面以表格的形式表示拟合程度的简要判断标准。

训练集准确率测试集准确率得出结论不好不好欠拟合好不好过拟合好好适度拟合

以下是欠拟合、适度拟合、过拟合的抽象数学表达以及形象展示拟合的程度。 第1组模型欠拟合:模型复杂度过低,抽象出的数学公式过于简单,有很多错分的数据,不能很好的你和我们的训练集。 第2组模型拟合适度:虽然有个别错误数据点,但是预测新数据效果很好。 第3组模型过拟合:模型复杂度过高,抽象出的数学公式非常复杂,很完美的拟合训练集的每个数据,但过度强调拟合原始数据。预测新数据时它的表现性很差。

3、简述原因

欠拟合: 训练的特征量过少。 模型复杂度过低,网络模型过于简单。 训练数据集非常不健康,存在大量的错误标注。

【深度学习】模型过拟合的原因以及解决办法

过拟合: 样本数量太少,样本数据不足以代表预定的分类规则。 样本噪音干扰过大,将大部分噪音认为是特征从而扰乱了预设的分类规则。

4、欠拟合解决办法

对于欠拟合:总结一句话是模型简单的,样本数据量不够。

扩充样本数据,则增加更多的样本数据特征,使输入数据具有更强的表达能力。增加模型复杂度:更换更复杂的网络模型,或者网络模型取消掉原有的正则化参数,正则化的目的是用来防止过拟合的,但是模型出现了欠拟合,则需要减少正则化参数,不过这种方法一般不用,通常是更换更复杂的网络。增加模型训练的迭代次数,模型训练迭代次数太少,训练的数据特征未充分学习。手动调整参数和超参数。5、过拟合解决办法

对于过拟合:发生过拟合最常见的现象就是数据量太少而模型太复杂。 训练集的数量级和模型的复杂度不匹配,大致思路是训练集的数量级要小于模型的复杂度。

首先增加训练数据数的样本数据量,并检查样本标签的准确性,训练集越多,过拟合的概率越小。 最好的是人工标注高质量的数据,可以采用一定的数据增强策略,来实现数据集的扩充。 注意扩充后的图像要手动确认,因为可能会有脏数据,从而会引入一定的噪声,噪声也会影响模型的性能的。

样本噪音干扰过大,需要手动清理掉脏数据,否则模型过分学习了噪音特征,反而忽略了真实的输入输出间的关系

参数太多,模型复杂度过高,将模型更换为更简单的网络模型,或者正则化L1和L2。 L1是模型各个参数的绝对值之和。L2是模型各个参数的平方和的开方值。 使用正则化约束:损失函数后面添加正则化项,可以避免训练出来的参数过大从而使模型过拟合。使用正则化缓解过拟合的手段广泛应用,不论是在线性回归还是在神经网络的梯度下降计算过程中,都应用到了正则化的方法。常用的正则化有l1正则和l2正则。

使用Dropout,即按一定的比例去除隐藏层的神经单元,使神经网络的结构简单化。torch.nn.Dropout(0.6),这里的0.6是神经元不保留的概率。

使用BN:Batch Normalization批归一化处理层,作用非常大。使得每一层的数据分布不变,做归一化处理,加快了模型的收敛速度,避免梯度消失、提高准确率。

保证训练数据的分布和测试数据的分布要保持一致,否则模型学习识鸟,你用它识别鸡蛋。

不要过度训练,提前结束训练early-stopping:训练时间足够长,模型就会把一些噪声隐含的规律学习到,这个时候降低模型的性能是显而易见的。所以建议在模型迭代训练时候记录训练精度(或损失)和验证精度(或损失),如果模型训练的效果不再提高,比如训练误差一直在降低但是验证误差却不再降低甚至上升,这时候便可以结束模型训练了。

手动调整参数和超参数。

本文链接地址:https://www.jiuchutong.com/zhishi/298875.html 转载请保留说明!

上一篇:车道线检测数据集介绍(车道线检测视频素材)

下一篇:Vue基础--webpack介绍以及基础配置(vue中webpack用来干啥)

  • 网页链接打不开有哪些解决方法(网页链接打不开)(网页链接打不开英文怎么说)

    网页链接打不开有哪些解决方法(网页链接打不开)(网页链接打不开英文怎么说)

  • 超级影视vip怎么取消自动续费(超级影视VIP怎么买便宜)

    超级影视vip怎么取消自动续费(超级影视VIP怎么买便宜)

  • qq音乐音乐人怎么认证(qq音乐人怎么)

    qq音乐音乐人怎么认证(qq音乐人怎么)

  • qq发红包要上传身份证(qq发红包要上传身份证怎么解决)

    qq发红包要上传身份证(qq发红包要上传身份证怎么解决)

  • 惠普打印机托架被卡住(惠普打印机托架卡住怎么办)

    惠普打印机托架被卡住(惠普打印机托架卡住怎么办)

  • 台式电脑没网络是怎么回事(台式电脑没网络怎么连接)

    台式电脑没网络是怎么回事(台式电脑没网络怎么连接)

  • 苹果接电话可以录音吗(苹果接电话可以解锁吗)

    苹果接电话可以录音吗(苹果接电话可以解锁吗)

  • 苹果8p是多大的屏幕尺寸(苹果8p是多大的屏)

    苹果8p是多大的屏幕尺寸(苹果8p是多大的屏)

  • 手机充电尾插松了怎么办(手机尾插充电松动最简单修复方法)

    手机充电尾插松了怎么办(手机尾插充电松动最简单修复方法)

  • 微信找回密码需要2个人里面没好友怎么办(微信找回密码需要多久)

    微信找回密码需要2个人里面没好友怎么办(微信找回密码需要多久)

  • 华为总部地址在哪里(华为 总部地址)

    华为总部地址在哪里(华为 总部地址)

  • 机顶盒锁定灯亮是什么意思(机顶盒锁定灯亮怎么回事)

    机顶盒锁定灯亮是什么意思(机顶盒锁定灯亮怎么回事)

  • 怎么改软件图标和名字(安卓怎么改软件图标)

    怎么改软件图标和名字(安卓怎么改软件图标)

  • 快手超级管理能设置几个(快手超级管理能取消普通管理吗)

    快手超级管理能设置几个(快手超级管理能取消普通管理吗)

  • oppo快充和闪充的区别(oppo手机快充和闪充哪个安全)

    oppo快充和闪充的区别(oppo手机快充和闪充哪个安全)

  • 华为路由器掉线的原因(华为路由器掉线后需要在添加设备)

    华为路由器掉线的原因(华为路由器掉线后需要在添加设备)

  • 苹果x能改双卡吗(怎么看苹果手机是不是双卡)

    苹果x能改双卡吗(怎么看苹果手机是不是双卡)

  • ps怎么弄(ps怎么弄阴影效果)

    ps怎么弄(ps怎么弄阴影效果)

  • word如何强调文字颜色(word如何强调文字颜色2)

    word如何强调文字颜色(word如何强调文字颜色2)

  • 手机yy怎么调麦克风(手机yy怎么调麦克风增强)

    手机yy怎么调麦克风(手机yy怎么调麦克风增强)

  • 手机怎么拍黑白照(手机怎么拍黑白证件照)

    手机怎么拍黑白照(手机怎么拍黑白证件照)

  • 长虹老年机sos怎么关闭(长虹老人机手机密码是多少)

    长虹老年机sos怎么关闭(长虹老人机手机密码是多少)

  • 为远程群辉NAS配置固定二级子域名【内网穿透】(远程访问群晖nas)

    为远程群辉NAS配置固定二级子域名【内网穿透】(远程访问群晖nas)

  • 【强化学习探索01】Win10 下gym安装

    【强化学习探索01】Win10 下gym安装

  • vue配置代理服务器proxy(vuecli配置代理)

    vue配置代理服务器proxy(vuecli配置代理)

  • Dedecms 生成RSS地图地址出错修改方法(dedecms手册)

    Dedecms 生成RSS地图地址出错修改方法(dedecms手册)

  • react context优化四重奏教程示例

    react context优化四重奏教程示例

  • phpcms后台上传不了图片怎么办(php无法上传文件)

    phpcms后台上传不了图片怎么办(php无法上传文件)

  • 资产减值准备的计提方法
  • 返点的保险费应计入哪里
  • 乙方向甲方开具增值税专用发票
  • 购入原材料结转采购成本的会计分录
  • 普通发票作废要交税吗
  • 新车交车辆购置税需要什么材料
  • 折扣销售的增值税处理方式
  • 收到失控发票写情况说明
  • 挂靠管理费如何入账?
  • 月末哪些科目需要手动结转为成本
  • 企业销售商品的业务有什么特点
  • 改建的固定资产
  • 企业销售现金折扣
  • 现金折扣税前扣除
  • 过路过桥费电子票验证
  • 所得税预缴资产怎么算
  • 销售库存商品会引起收入增加吗
  • 供应商退回货款有时间限制吗
  • 红字发票如果开多了下个月能进行抵扣么?
  • 预缴所得税多交了汇算时可以抵扣下一年的所得税吗
  • 1500元左右打游戏最好的手机
  • 所得税预缴资产怎么计算
  • 企业向个人赠送礼品
  • 企业收到外部水电费如何做账?
  • 收到专票有误,已跨月未认证,销售方不红冲咋办
  • windows7iis安装
  • 以公允价值计量的投资性房地产
  • 发放工资的时候,如何在excel里快速查询未发放成功的
  • php的类
  • 住房公积金一次性补缴
  • 本月销售未开票怎么做分录
  • mac osx10.11
  • 股票发行费用怎么算
  • 跨市设立分公司
  • 利润表的营业收入是开票金额吗
  • 基于Python实现五大常用分类算法(原理+代码)
  • 应纳税为什么是0
  • pytorch基础
  • 代扣代缴境外增值税税率是多少
  • 建设单位和施工单位的责任和义务
  • 企业盈利不交所得税的办法
  • 暂估库存商品计算怎么算
  • mongodb mongoose
  • react 16新特性
  • 收到员工交来现金怎么入账
  • 发票上的金额是含税还是不含税
  • 个别计价法下,把每一种存货的实际成本
  • 企业投资股权收益如何征税
  • 水泥贸易利润
  • 红冲去年的成本怎么做账
  • 多计提的费用可以记收入吗会计分录
  • 办公设备维修费会计分录
  • 哪些收入属于免增值税
  • 怎样从sql数据库取数据
  • cmd 执行sql
  • macos mysql
  • windows10内置应用是哪些
  • win10飞行模式怎么关掉没有图标
  • centos安装详细
  • win8怎么设置自动开机
  • mac如何安装dmg软件
  • pptp和l2tp哪个比较安全
  • win10周年纪念版
  • 虚拟机里面如何设置网络
  • 订书针的原理
  • win10的uwp在哪
  • cocos2dx lua android glsurfaceview 截图
  • 角色格斗类游戏
  • js中eval函数是干嘛的
  • Nodejs+Socket.io实现通讯实例代码
  • jQuery Ajax传值到Servlet出现乱码问题的解决方法
  • javascript学习指南
  • jquery easyui datagrid实现增加,修改,删除方法总结
  • 审计会计税务的区别及联系
  • 企业自产自销农产品免税政策有哪些
  • 西安国家税务局丁雁现任命职务
  • 中国银行手机银行app官方下载
  • 纳税是什么税
  • 北京地税局报税时间
  • 城市维护建设税税率
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设