位置: IT常识 - 正文

MAE详解

编辑:rootadmin
MAE详解

目录

一、介绍

二、网络结构

1. encoder

2. decoder

3. LOSS

三、实验


推荐整理分享MAE详解,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

全文参考:论文阅读笔记:Masked Autoencoders Are Scalable Vision Learners_塔_Tass的博客-CSDN博客

masked autoencoders(MAE)是hekaiming大佬又一新作,其做法很简单,就是随机mask掉一部分patches并重建这部分丢失的像素,可看作是一个可扩展的(scalable)自监督学习器,能极大加速模型的训练速度并提升准确率。下游迁移性能优于有监督预训练,并有良好的的scaling(可扩展性)。

一、介绍

mask autoencoders是一种更一般的去噪方式。

语言的信息密度更高,mask掉部分文字可能使得语义完全不同,这个任务会导致更复杂的语言理解;而图像的冗余度就很高,因此mask掉部分patch,大大减少冗余信息。并创建一个很有挑战性的自监督创建任务,提升对图像的整体理解。

AE的decoder将潜在表示映射回输出,相比于语言的重建,图像像素的重建,语义级别更低。decoder往往仅需要轻量级即可,比编码器更浅更窄。但我们发现,对于图像,decoder的设计很大程度上影响着潜在表示的语义表达水平。

二、网络结构MAE详解

我们设计的是非对称的encoder decoder,encoder仅在未被mask的patch上进行编码,生成潜在表示,decoder再基于潜在表示和被mask的patch一起重建。

1. encoder

这里,encoder对于被mask的patch,并不是用0填充,而是直接忽略,因此patch数量的减少,能直接降低计算量,加快训练速度(75%的mask率就相当于加速3倍),且降低了内存消耗使得可以用更大模型。

2. decoder

而decoder仅在预训练阶段进行重构任务(即在下游任务finetune的时候是不需要decoder的),因此decoder的设计可以灵活。

encoder的加深有利于潜在表示能表达更抽象的语义信息,而decoder可以设计的更浅更窄,我们使用单个的transfomer这种小型解码器也可以表现出色,且速度快。

3. LOSS

我们使用原始图像与重构图像在mask patch部分的MSE损失(均方误差)。一个变体是,用每个patch的mean std进行归一化后,计算每一个patch的归一化像素的MSE,这个可以明显提高表示质量。

三、实验

(与有监督/无监督的预训练方法进行比较)

1)比MOCOv3的预训练finetune效果更好

2)在目标检测任务中,ViT与FPN搭配更好,与有监督的预训练相比,MAE要更优。

自己的总结:MAE是一种很好的自监督训练器,其训练的预训练模型,比有监督的、MOCO自监督的,在下游任务finetune上都取得更好的效果

本文链接地址:https://www.jiuchutong.com/zhishi/299587.html 转载请保留说明!

上一篇:less变量

下一篇:路由vue-route的使用(vue router 路由参数)

  • 印花税纳税义务人有哪些
  • 消费型增值税的含义
  • 个人所得税累计扣除标准
  • 企业所得税视同销售的会计处理
  • 增值税专票开户行
  • 当前企业不存在是怎么回事
  • 转出未交增值税是借方还是贷方
  • 出口退税发票未稽核可以申报退税吗
  • 甲方代付材料费合法吗
  • 资金成本加价收入能作为收入开票吗
  • 贷款利息未取得发票所得税税前扣除哪年开始
  • 小规模纳税人发票图片
  • 广告公司对外捐赠的会计处理怎么做?
  • 代理结算费用应该如何处理
  • 营改增后混合销售的规定
  • 公司理财收益账务处理
  • 供热企业免税收入标准
  • 贸易公司购进原材料会计分录
  • 建筑业预收账款如何缴税
  • 公允价值变动损益是什么意思
  • 金税是干什么的
  • 防伪税控减免税款的会计分录
  • 没有把发票开给客户公司注销了怎么办
  • 单位买酒报销如何做账
  • 应付职工薪酬计入现金流量表哪里
  • 债务重组过程
  • 小规模纳税人不开票收入填在哪里
  • 应用程序出现异常怎么办
  • 代缴社保怎么做账
  • 有限合伙企业如何退出合伙人股份
  • 发票差额怎样做分录
  • 360devm.sys是什么文件
  • Win11 Build 22000.65更新体验:汉化更完善,右下角返回桌面回归
  • 土地增值税怎么计算举例说明
  • 增值税进项税抵扣销项税
  • 企业备用金预借多久到账
  • 临时工的工资需要缴纳工会经费吗
  • 交易性金融资产属于什么科目
  • elementui rule
  • 即征即退进项税额分摊方法
  • 前端 input
  • 出售生产设备的会计分录
  • redirect_uri参数错误的解决方法(必看)
  • .net tpl
  • yolo训练参数
  • php curl 封装
  • php 下载上传文件
  • 公司采购一直没走对公付款怎么处理
  • 商铺转让费的会计分录
  • 给离职员工买社保的风险
  • 工程结算如何做会计分录
  • 大学生创新创业平台
  • 借款人和还款人不一致,收据打给谁
  • 销售分哪几类
  • 加盟代理需要什么手续
  • 固定资产多少钱算固定资产
  • 充话费送手机业务
  • 一般纳税人应交增值税怎么算
  • 土地使用权出资是什么意思
  • 应付账款和应付票据的区别与联系
  • 去银行提备用金需要什么
  • sqlserver1053怎么解决
  • 数据结构 简书
  • ubuntu系统如何解压文件
  • win8怎么让我的电脑显示在桌面上
  • windows7怎么禁用网络
  • Win10 Mobile 10586.63截图曝光:或为正式推送版本
  • javascript中的数字型可以用来保存整数或浮点数(小数)
  • js兼容ie
  • javascript的原型,原型链,有什么特点?
  • shell数组遍历
  • python函数经典例程
  • angularjs4
  • u3d unity3d
  • typeof的缺点
  • jquery倒计时代码
  • 传智播客在线课程
  • 交错了税可以退吗
  • 建筑行业增值税税收优惠政策
  • 西乡国税局电话
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设