位置: IT常识 - 正文

【深度学习】模型过拟合的原因以及解决办法

编辑:rootadmin
【深度学习】模型过拟合的原因以及解决办法 【深度学习】模型过拟合的原因以及解决办法1、背景2、模型拟合3、简述原因4、欠拟合解决办法5、过拟合解决办法1、背景

推荐整理分享【深度学习】模型过拟合的原因以及解决办法,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

所谓模型过拟合现象: 在训练网络模型的时候,会发现模型在训练集上表现很好,但是在测试集上表现一般或者很差。 总结一句话:已知数据预测的很好,但对未知数据预测得很差的现象。

模型过拟合将图片数据的噪声当成特征点学习进去,导致模型的泛化能力很差, 只能在训练集上表现不错,对未知的其它样本预测表现不佳!

我们通过深度学习或者机器学习的根本问题是解决优化和泛化的问题平衡。 优化问题:训练模型以在训练数据上得到最佳性能。 泛化问题:模型在测试集上的取得很好的性能。

简单分析在模型训练过程的初期和后期:

2、模型拟合

模型拟合分为过拟合和欠拟合以及适度拟合。 下面以表格的形式表示拟合程度的简要判断标准。

训练集准确率测试集准确率得出结论不好不好欠拟合好不好过拟合好好适度拟合

以下是欠拟合、适度拟合、过拟合的抽象数学表达以及形象展示拟合的程度。 第1组模型欠拟合:模型复杂度过低,抽象出的数学公式过于简单,有很多错分的数据,不能很好的你和我们的训练集。 第2组模型拟合适度:虽然有个别错误数据点,但是预测新数据效果很好。 第3组模型过拟合:模型复杂度过高,抽象出的数学公式非常复杂,很完美的拟合训练集的每个数据,但过度强调拟合原始数据。预测新数据时它的表现性很差。

3、简述原因

欠拟合: 训练的特征量过少。 模型复杂度过低,网络模型过于简单。 训练数据集非常不健康,存在大量的错误标注。

【深度学习】模型过拟合的原因以及解决办法

过拟合: 样本数量太少,样本数据不足以代表预定的分类规则。 样本噪音干扰过大,将大部分噪音认为是特征从而扰乱了预设的分类规则。

4、欠拟合解决办法

对于欠拟合:总结一句话是模型简单的,样本数据量不够。

扩充样本数据,则增加更多的样本数据特征,使输入数据具有更强的表达能力。增加模型复杂度:更换更复杂的网络模型,或者网络模型取消掉原有的正则化参数,正则化的目的是用来防止过拟合的,但是模型出现了欠拟合,则需要减少正则化参数,不过这种方法一般不用,通常是更换更复杂的网络。增加模型训练的迭代次数,模型训练迭代次数太少,训练的数据特征未充分学习。手动调整参数和超参数。5、过拟合解决办法

对于过拟合:发生过拟合最常见的现象就是数据量太少而模型太复杂。 训练集的数量级和模型的复杂度不匹配,大致思路是训练集的数量级要小于模型的复杂度。

首先增加训练数据数的样本数据量,并检查样本标签的准确性,训练集越多,过拟合的概率越小。 最好的是人工标注高质量的数据,可以采用一定的数据增强策略,来实现数据集的扩充。 注意扩充后的图像要手动确认,因为可能会有脏数据,从而会引入一定的噪声,噪声也会影响模型的性能的。

样本噪音干扰过大,需要手动清理掉脏数据,否则模型过分学习了噪音特征,反而忽略了真实的输入输出间的关系

参数太多,模型复杂度过高,将模型更换为更简单的网络模型,或者正则化L1和L2。 L1是模型各个参数的绝对值之和。L2是模型各个参数的平方和的开方值。 使用正则化约束:损失函数后面添加正则化项,可以避免训练出来的参数过大从而使模型过拟合。使用正则化缓解过拟合的手段广泛应用,不论是在线性回归还是在神经网络的梯度下降计算过程中,都应用到了正则化的方法。常用的正则化有l1正则和l2正则。

使用Dropout,即按一定的比例去除隐藏层的神经单元,使神经网络的结构简单化。torch.nn.Dropout(0.6),这里的0.6是神经元不保留的概率。

使用BN:Batch Normalization批归一化处理层,作用非常大。使得每一层的数据分布不变,做归一化处理,加快了模型的收敛速度,避免梯度消失、提高准确率。

保证训练数据的分布和测试数据的分布要保持一致,否则模型学习识鸟,你用它识别鸡蛋。

不要过度训练,提前结束训练early-stopping:训练时间足够长,模型就会把一些噪声隐含的规律学习到,这个时候降低模型的性能是显而易见的。所以建议在模型迭代训练时候记录训练精度(或损失)和验证精度(或损失),如果模型训练的效果不再提高,比如训练误差一直在降低但是验证误差却不再降低甚至上升,这时候便可以结束模型训练了。

手动调整参数和超参数。

本文链接地址:https://www.jiuchutong.com/zhishi/298875.html 转载请保留说明!

上一篇:车道线检测数据集介绍(车道线检测视频素材)

下一篇:Vue基础--webpack介绍以及基础配置(vue中webpack用来干啥)

  • 抖音里面怎么充抖币(抖音里面怎么充值逗比)

    抖音里面怎么充抖币(抖音里面怎么充值逗比)

  • 如何升级win10(电脑win7如何升级win10)

    如何升级win10(电脑win7如何升级win10)

  • 腾讯课堂签到是否有记录(腾讯课堂签到是免费的吗)

    腾讯课堂签到是否有记录(腾讯课堂签到是免费的吗)

  • 滴滴手机号怎么改(滴滴手机号怎么打过去)

    滴滴手机号怎么改(滴滴手机号怎么打过去)

  • 手机氧化怎么去除(手机氧化对手机有影响吗)

    手机氧化怎么去除(手机氧化对手机有影响吗)

  • 苹果手机qq邮箱下载的文件在哪里(苹果手机qq邮箱下载的文件在哪)

    苹果手机qq邮箱下载的文件在哪里(苹果手机qq邮箱下载的文件在哪)

  • 联想电脑管家怎么添加到桌面(联想电脑管家怎么下载)

    联想电脑管家怎么添加到桌面(联想电脑管家怎么下载)

  • 什么是蓝v(什么是蓝V号怎么认出蓝v)

    什么是蓝v(什么是蓝V号怎么认出蓝v)

  • p40带不带无线充电(p40带不带无线充电功能)

    p40带不带无线充电(p40带不带无线充电功能)

  • 冻干技术的原理(冻干技术的原理 时间)

    冻干技术的原理(冻干技术的原理 时间)

  • 天猫精灵怎么只听一个人的(天猫精灵怎么只放一首歌)

    天猫精灵怎么只听一个人的(天猫精灵怎么只放一首歌)

  • win10网络图标消失无法联网(win10网络图标消失设置打不开)

    win10网络图标消失无法联网(win10网络图标消失设置打不开)

  • win10新电脑怎么分盘(win10新电脑怎么分区)

    win10新电脑怎么分盘(win10新电脑怎么分区)

  • oppor17手机怎么关机(oppor17手机怎么恢复出厂设置方法)

    oppor17手机怎么关机(oppor17手机怎么恢复出厂设置方法)

  • 猫耳下载的音频在哪里(猫耳下载的音频怎么删除)

    猫耳下载的音频在哪里(猫耳下载的音频怎么删除)

  • wps表格如何批量减数字(wps表格如何批量删除部分内容)

    wps表格如何批量减数字(wps表格如何批量删除部分内容)

  • 小米手环4nfc什么时候上市(小米智能手环4nfc)

    小米手环4nfc什么时候上市(小米智能手环4nfc)

  • cso是什么意思(医药行业cso是什么意思)

    cso是什么意思(医药行业cso是什么意思)

  • 泰迪熊移动怎么关闭(泰迪熊移动怎么取消)

    泰迪熊移动怎么关闭(泰迪熊移动怎么取消)

  • jdk1.7和1.8的区别(jdk1.7和1.8的区别 jvm)

    jdk1.7和1.8的区别(jdk1.7和1.8的区别 jvm)

  • 充电到80充不进去(充电到80充不进电怎么办)

    充电到80充不进去(充电到80充不进电怎么办)

  • 苹果系统Mac OS X 10.10 Yosemite 使用技巧汇总(苹果系统最新版本)

    苹果系统Mac OS X 10.10 Yosemite 使用技巧汇总(苹果系统最新版本)

  • Vue Element UI 中 el-table 树形数据 tree-props 多层级使用避坑

    Vue Element UI 中 el-table 树形数据 tree-props 多层级使用避坑

  • 使用stable diffusion webui在本地搭建中文的AI绘图模型(使用灭火器人要站在上风口还是下风口)

    使用stable diffusion webui在本地搭建中文的AI绘图模型(使用灭火器人要站在上风口还是下风口)

  • 手机个人所得税app下载官网
  • 个人出售满两年和不满两年的住
  • 所得税季报填错了已经申报了
  • 哪个税种不需要认定就能在电子税务局申报
  • 湖北工会工作网
  • 当月开票当月付款分录
  • 营业成本增加会导致
  • 税控盘专票认证登录密码正确还是登录不上去
  • 怎么算应纳税收多少
  • 制造企业发出材料成本的计价方法
  • 员工福利费进项转出
  • 当月未收到进项票怎么处理
  • 会计增长知识方面
  • 融资租赁收到租金不确认收入
  • 网上申报时纳税人怎么填
  • 财务费用中的利息收入指什么
  • 电子发票怎么作废操作流程视频
  • 购进货物运费会退吗
  • 期初数据科目期初余额怎么录入?
  • 要求做前两年的核酸检测
  • 土地使用权摊销账务处理
  • 员工出差时法律规定
  • 重置ie浏览器会有什么影响
  • 电脑系统权限管理在哪里
  • 主营业务收入明细账图片
  • 代收代付款项入账需要什么资料
  • 对公账户存款利息要交增值税吗
  • 增值税发票月末怎么账务处理
  • macOS Big Sur 11.2 公测版 beta 1怎么更新?
  • 彻底清理缓存
  • 短期投资计入什么科目
  • 销货退回与折让属于什么科目
  • pytorch example
  • tftp传输命令
  • 员工内部罚款能不能抵扣个税
  • 应付职工薪酬总账和明细账
  • 厂房和设备折旧年限
  • php 时间
  • python中排序
  • 织梦系统
  • 或有对价的确认条件
  • 库存不多
  • 增值税专用发票几个点
  • 企业自产自用产品要确认收入吗
  • 教育培训学校是什么意思
  • 养猪死亡
  • 税务局不予受理的依据
  • 进口海关是国内还是国外
  • 营改增后转让土地使用权怎么交增值税
  • 退休人员的返聘协议模板
  • 一般纳税人可以开1%的发票吗
  • 周转材料怎么做分录
  • 涉外收入申报单怎么填
  • 红字发票抵扣时增值税纳税申报表如何处理
  • 服装店的财务会计怎么做
  • 收回投标保证金 建立台账
  • 息税前利润变动百分比计算公式
  • 一个企业建账需要注意些什么
  • centos7.9命令
  • solaris 创建文件
  • win8系统本地连接在哪
  • Mac系统修复怎么进入
  • Win10 TH2首个重要更新后应用商店依然存在问题
  • win7升级到win10专业版教程
  • win8.1 ie浏览器
  • linux实用技巧
  • win10周年版
  • linux怎么查看挂载点
  • 两个js文件互相取变量
  • 批处理截取字符串
  • python3.9爬取网页教程
  • nodejs实战教程
  • android4.4.2升级包
  • python多线程例子
  • javascript 进阶篇3 Ajax 、JSON、 Prototype介绍
  • python访问地址
  • js判断密码是否符合标准
  • 郑州契税怎么收
  • 开红酒增值税票怎么开
  • 微信 税务
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设