位置: IT常识 - 正文

一文看懂预训练和自训练模型(预训练的目的)

编辑:rootadmin
一文看懂预训练和自训练模型

推荐整理分享一文看懂预训练和自训练模型(预训练的目的),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:预训练过程,预训练和训练,如何进行预训练,预训练方法,预训练是什么,预训练和训练,预训练和训练,预训练方法,内容如对您有帮助,希望把文章链接给更多的朋友!

        说到预训练模型,不得不提迁移学习了,由于很多数据不是标签数据,人工标注非常耗时,神经网络在很多场景下受到了限制。但是迁移学习和自学习的出现,在一定程度上缓解甚至解决了这个问题。我们可以在标签丰富的场景下进行有监督的训练,或者在无标签的场景下,进行神经网络无监督的自学习,然后把训练出来的模型进行迁移学习,到标签很少的场景下,利用这种方式来解决领域标签数据少的问题。

        视觉任务往往具有一定的通用性,例如在某个分类任务数据集上训练的模型,在迁移到别的分类任务上时,只需要重新训练分类层以及对其他层权重进行微调便能获得不错的结果。所以在面对当前任务时,采用经过别的任务训练后的模型叫做预训练技术。预训练方法通常分为监督、半监督、无监督法。

一文看懂预训练和自训练模型(预训练的目的)

        最常用的监督预训练技术是:首先在带有标注的大型数据集上训练模型,之后将该模型当作预训练模型执行当前任务。例如在目标检测任务上通常会采用在Imagenet数据集上经过训练的模型当作特征提取网络。

        半监督方法的代表是自训练,其使用少量的标记数据和大量的未标记数据对模型进行联合训练。自训练可以分为5个步骤:

使用少量带有标签的数据训练模型使用步骤1中得到的模型对未标记数据进行预测,预测结果作为伪标签将标记数据和未标记数据结合标签和伪标签一起训练模型在测试集上评估模型重复1-4步,对模型迭代

        无监督方法在无标签的数据集上训练,通过对比损失、互信息最大化等方法获得对数据的通用表示。

        在当前任务中,绝大多数采用经过预训练方法的骨干网络通常会使结果得到提升。例如在目标检测任务中,通过监督法得到的预训练模型因为其稳定、简单、容易获取而成为多数目标检测的骨干网络模型。但谷歌最新的研究表明,在数据量足够的情况下,至少在目标检测任务上,采用自训练得到的预训练模型对检测结果的提升要显著优于监督预训练与无监督预训练模型。

        说白了,预训练模型就是提前训练好模型参数。有了预训练模型,我们就不需要再从0开始训练所有参数了,但是针对我们当前的这个任务,有些参数可能不合适,我们只需要在当前参数的基础上稍加修改(微调)就可以得到比较好的效果,这样学习时间必然会大大减小。

参考文章安全验证 - 知乎

本文链接地址:https://www.jiuchutong.com/zhishi/295852.html 转载请保留说明!

上一篇:vue多环境配置之 .env配置文件(vue环境搭建及配置简书)

下一篇:尚硅谷vue笔记 详细讲解版(尚硅谷 天禹老师)(尚硅谷docker笔记)

  • 增值税开票软件口令锁定怎么办
  • 个人所得税个体户减半
  • 老板自己出钱买股票
  • 发票可不可以盖财务专用章
  • 居民和企业
  • 财务要做哪些表
  • 电脑填制记账凭证实训心得
  • 家庭保洁服务价格表
  • 已申报个税减免什么意思
  • 股东费用如何入账
  • 中小企业怎么避税
  • 上期计提的费用是什么
  • 代管商品物资登记制度
  • 参加会议需要用身份证吗
  • 固定资产清理属于
  • 国有企业出租房屋管理规定
  • 货物已到发票未到怎么做账
  • 保洁劳务税点
  • 印花税减免性质代码和项目名称小规模
  • 一次性工伤补偿金公司不给怎么办
  • 小规模付增值税怎么做账
  • 银行对公账户网上注销流程需要多久
  • 公司用无形资产投资需要交税吗
  • 公司代扣代缴的保险费有哪些
  • 什么是comsol
  • 鸿蒙系统智慧场所在哪
  • 股东投入的资金可以退回吗
  • macbook panic cpu caller
  • win10任务栏搜索如何关闭
  • win10版本1909和22h2
  • php和ajax用哪个调用数据
  • 向灾区捐赠货物需要交增值税吗
  • win11 build 22000.65
  • qq2440启动linux后插入u盘出现usb 1-1: device descriptor read/64, error -110,usb 1
  • aliwssv.exe是什么进程
  • 生产成本的主要分析方法
  • PHP:imagecreatefromwbmp()的用法_GD库图像处理函数
  • 长期股权投资会影响利润吗
  • 企业借给个人钱合法吗
  • php get_headers
  • 分公司?
  • Smarty实现页面静态化(生成HTML)的方法
  • 新会计准则里的机械作业是什么
  • 计提消费税的会计分录讲解
  • 工资是什么?包括哪些
  • 库存商品过期了还能用吗
  • 汇算清缴期间费用社保填哪里
  • 进项税额转出如何申报
  • 股东撤资如何退还资金,用途写什么
  • 政府补助冲减成本
  • 持有至到期投资是债权投资吗
  • 税控盘服务费减免政策
  • 完全成本法损益表
  • 生产成本增加记哪边
  • 总帐设置在哪
  • 数据库表的查询学会了什么
  • win19截屏快捷键
  • win8 分屏
  • linux修改ssh端口号启动失败
  • 怎么修复windows update
  • win10无线网络不见了只显示飞行模式
  • linux编译安装怎么卸载
  • win10右键菜单不显示
  • 简单射击原理
  • perl脚本教程视频
  • 使用多进程web
  • shell中的括号
  • python编程中的函数
  • jquery移动端ui框架
  • node.js开发微信小程序
  • jquery遍历对象使用的方法
  • 四川省税务局官方网站申报窗口
  • 商标注册图形查询
  • 欠税务局税款的后果
  • 广东省行业税负率表
  • 国家税务网上办税服务厅官网
  • 开电子发票流程步骤
  • 山东省国家税务局官网
  • 长期挂账的其他应付款的规定
  • 国家税务总局发票下载
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设