位置: IT常识 - 正文

MAE详解

编辑:rootadmin
MAE详解

目录

一、介绍

二、网络结构

1. encoder

2. decoder

3. LOSS

三、实验


推荐整理分享MAE详解,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

全文参考:论文阅读笔记:Masked Autoencoders Are Scalable Vision Learners_塔_Tass的博客-CSDN博客

masked autoencoders(MAE)是hekaiming大佬又一新作,其做法很简单,就是随机mask掉一部分patches并重建这部分丢失的像素,可看作是一个可扩展的(scalable)自监督学习器,能极大加速模型的训练速度并提升准确率。下游迁移性能优于有监督预训练,并有良好的的scaling(可扩展性)。

一、介绍

mask autoencoders是一种更一般的去噪方式。

语言的信息密度更高,mask掉部分文字可能使得语义完全不同,这个任务会导致更复杂的语言理解;而图像的冗余度就很高,因此mask掉部分patch,大大减少冗余信息。并创建一个很有挑战性的自监督创建任务,提升对图像的整体理解。

AE的decoder将潜在表示映射回输出,相比于语言的重建,图像像素的重建,语义级别更低。decoder往往仅需要轻量级即可,比编码器更浅更窄。但我们发现,对于图像,decoder的设计很大程度上影响着潜在表示的语义表达水平。

二、网络结构MAE详解

我们设计的是非对称的encoder decoder,encoder仅在未被mask的patch上进行编码,生成潜在表示,decoder再基于潜在表示和被mask的patch一起重建。

1. encoder

这里,encoder对于被mask的patch,并不是用0填充,而是直接忽略,因此patch数量的减少,能直接降低计算量,加快训练速度(75%的mask率就相当于加速3倍),且降低了内存消耗使得可以用更大模型。

2. decoder

而decoder仅在预训练阶段进行重构任务(即在下游任务finetune的时候是不需要decoder的),因此decoder的设计可以灵活。

encoder的加深有利于潜在表示能表达更抽象的语义信息,而decoder可以设计的更浅更窄,我们使用单个的transfomer这种小型解码器也可以表现出色,且速度快。

3. LOSS

我们使用原始图像与重构图像在mask patch部分的MSE损失(均方误差)。一个变体是,用每个patch的mean std进行归一化后,计算每一个patch的归一化像素的MSE,这个可以明显提高表示质量。

三、实验

(与有监督/无监督的预训练方法进行比较)

1)比MOCOv3的预训练finetune效果更好

2)在目标检测任务中,ViT与FPN搭配更好,与有监督的预训练相比,MAE要更优。

自己的总结:MAE是一种很好的自监督训练器,其训练的预训练模型,比有监督的、MOCO自监督的,在下游任务finetune上都取得更好的效果

本文链接地址:https://www.jiuchutong.com/zhishi/299587.html 转载请保留说明!

上一篇:less变量

下一篇:路由vue-route的使用(vue router 路由参数)

  • 劳务派遣公司企业所得税税率
  • 小规模纳税人专票免税吗?
  • 冲减以前年度的成本会计分录
  • 原材料盘亏自然损耗
  • 增值税怎么纳税比率
  • 应收款确认坏账分录
  • 调账以前年度损益调整如何结转
  • 营业外支出税前可以扣除吗
  • 如何确定赊销额度
  • 公司关门账上的盈余公积怎么处理?
  • 生产成本属于什么会计要素
  • 企业汇算清缴后还能更正吗
  • 地方教育费附加的会计分录
  • 两年利润都为负数,如何计算完成率
  • 增值税普通发票怎么开
  • 跨省经营如何缴纳流转税?
  • 增值税月末如何计算
  • 总分公司合并缴纳个税
  • 勒索病毒文件怎么恢复
  • win 安全
  • 分公司可以向总公司缴纳管理费吗
  • 出口货物做内销处理
  • php怎么把图片存入mysql
  • deepin linux安装教程
  • mcrlnstaller
  • 怎样选好布艺沙发
  • hg8321r路由
  • 热带雨林瀑布群雪野
  • php根据经纬度计算距离
  • php str函数
  • 企业所得税申报表A类
  • 第二季度所得税怎么算
  • php查询mysql数据库
  • php ajax 实现
  • 日本蜡烛图形
  • 预付卡销售可以报销吗
  • 增值税附加税的计算基数
  • 购买研发设备可以直接列入研发开支不
  • python爬虫入门教程
  • Ficstar Software � Web Data Extraction Tools
  • 公对公二手车交易税
  • mysql 使用索引
  • 分享使用护肤品的感受
  • 公司账户转钱到私人账户要扣税吗
  • SQL SERVER 2000通讯管道后复用劫持
  • 只有收入没有成本怎么做账
  • 哪些进项税额不能抵扣
  • 现金日记账采用哪一种账簿的形式
  • 没有发票的费用怎么报销
  • 进项税额是怎么算的
  • 收到预收款并已付款
  • 会计中预付账款
  • 会计科目漏记怎么补记
  • 税负率偏低
  • 现金存入银行是什么凭证
  • 上月留抵税额怎么看
  • 发票遗失重开需要收费吗?
  • 货物发生退运了怎么办
  • 工程施工和工程造价哪个好
  • 接受捐赠的固定资产计入什么科目
  • win8怎么一开机就进入桌面
  • win10系统怎么删
  • Windows Server 2008提升AD管理效率
  • 教你如何解决蓝光机/KODI无法打开局域网smb共享的问题
  • win8n
  • XP系统升级WIN7系统
  • windows10玩游戏卡吗
  • 可实现的系统
  • unity3d音效
  • 折中查找偶数怎么办
  • python jsondecodeerror异常捕获
  • Javascript字符串奇数位替换
  • 浦发银行企业银行电话
  • 税控发票开票系统对电脑配置有要求吗?
  • 河南车船税收费标准2022年
  • 拉萨税务局拉巴卓玛
  • 资源税原矿和选矿的区别
  • 税务核查系统
  • 仪征十大名人是哪些人
  • 交强险是什么样的照片
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设