位置: IT常识 - 正文

MAE详解

编辑:rootadmin
MAE详解

目录

一、介绍

二、网络结构

1. encoder

2. decoder

3. LOSS

三、实验


推荐整理分享MAE详解,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

全文参考:论文阅读笔记:Masked Autoencoders Are Scalable Vision Learners_塔_Tass的博客-CSDN博客

masked autoencoders(MAE)是hekaiming大佬又一新作,其做法很简单,就是随机mask掉一部分patches并重建这部分丢失的像素,可看作是一个可扩展的(scalable)自监督学习器,能极大加速模型的训练速度并提升准确率。下游迁移性能优于有监督预训练,并有良好的的scaling(可扩展性)。

一、介绍

mask autoencoders是一种更一般的去噪方式。

语言的信息密度更高,mask掉部分文字可能使得语义完全不同,这个任务会导致更复杂的语言理解;而图像的冗余度就很高,因此mask掉部分patch,大大减少冗余信息。并创建一个很有挑战性的自监督创建任务,提升对图像的整体理解。

AE的decoder将潜在表示映射回输出,相比于语言的重建,图像像素的重建,语义级别更低。decoder往往仅需要轻量级即可,比编码器更浅更窄。但我们发现,对于图像,decoder的设计很大程度上影响着潜在表示的语义表达水平。

二、网络结构MAE详解

我们设计的是非对称的encoder decoder,encoder仅在未被mask的patch上进行编码,生成潜在表示,decoder再基于潜在表示和被mask的patch一起重建。

1. encoder

这里,encoder对于被mask的patch,并不是用0填充,而是直接忽略,因此patch数量的减少,能直接降低计算量,加快训练速度(75%的mask率就相当于加速3倍),且降低了内存消耗使得可以用更大模型。

2. decoder

而decoder仅在预训练阶段进行重构任务(即在下游任务finetune的时候是不需要decoder的),因此decoder的设计可以灵活。

encoder的加深有利于潜在表示能表达更抽象的语义信息,而decoder可以设计的更浅更窄,我们使用单个的transfomer这种小型解码器也可以表现出色,且速度快。

3. LOSS

我们使用原始图像与重构图像在mask patch部分的MSE损失(均方误差)。一个变体是,用每个patch的mean std进行归一化后,计算每一个patch的归一化像素的MSE,这个可以明显提高表示质量。

三、实验

(与有监督/无监督的预训练方法进行比较)

1)比MOCOv3的预训练finetune效果更好

2)在目标检测任务中,ViT与FPN搭配更好,与有监督的预训练相比,MAE要更优。

自己的总结:MAE是一种很好的自监督训练器,其训练的预训练模型,比有监督的、MOCO自监督的,在下游任务finetune上都取得更好的效果

本文链接地址:https://www.jiuchutong.com/zhishi/299587.html 转载请保留说明!

上一篇:less变量

下一篇:路由vue-route的使用(vue router 路由参数)

  • 材料采购成本是主营业务成本吗
  • 什么是进口增值业务
  • 建筑公司预收了款项已经开了增值税发票怎么做账
  • 分公司财务负责人和总公司财务负责人
  • 出口报关单怎么做会计凭证
  • 分公司怎么分配股权
  • 固定资产折旧年限
  • 海关缴款书税号
  • 银行罚息怎么入账
  • 红字发票信息表可以撤销吗
  • 单位不发工资怎么解决要什么证据
  • 物料买回来再发货可以吗
  • 工资税金算法
  • 抵扣联必须当月认证吗
  • 防暑降温费会计处理
  • 铡什么意思
  • 存出投资款现金流量表选什么
  • mysqli php
  • 系统托盘无法隐藏文件夹
  • linux 密码重置
  • 如何配置无线路由器参数
  • php数组统计函数
  • php数组函数实现机选双色球
  • 制造业成本核算明细表
  • 深入php:面向对象、模式与实践
  • php处理xml
  • php的了解
  • php echo js
  • thinkphp ide
  • php swoole框架
  • 其它收益和递延收益
  • 头歌HTML基础第一关初识HTML
  • 读懂spring源码
  • 单目深度估计算法
  • 分布式网络爬虫
  • Pytorch深度学习实战3-5:详解计算图与自动微分机(附实例)
  • uniapp支付宝支付开发
  • 个税系统怎么查询已申报个人明细
  • java泛型类和泛型方法
  • 固定资产清理的含义
  • 持有投资期间,被投资单位编制合并报表
  • 商誉 减值
  • 上期未申报怎么办
  • 红冲后的发票税怎么办
  • 认缴制和实缴制的区别公司破产
  • 小微企业所得税税率
  • 认缴制下,资金什么时候必须到位
  • sqlserver2012备份
  • mysql误删数据
  • 建筑业普票与专票怎么抵扣
  • 消费税为什么是中央税还是地方税
  • 补计提所得税怎么做分录
  • 成本类科目在哪里列式
  • 生产成本增加记哪边
  • mysql查看使用情况
  • win10系统问题怎么修复
  • windows7更新80072efe
  • windowsxp电脑开机
  • windows8文件夹怎么加密
  • ubuntu16.04怎么设置网络
  • mac截图后怎么编辑
  • win7怎么设置禁止安装软件
  • downloader.exe是什么
  • ghost操作指南
  • 微软发布更新的时间每月
  • node操作mongodb数据库
  • 安卓listview用法
  • jquery校验数字
  • dos命令中删除文件命令有哪些
  • 如何把多个文本文档合并成一个且分行不重叠
  • python语言面向过程吗
  • jquery是怎样实现链式调用的?
  • 开票怎么查发票总额
  • 广东省为什么电不够用
  • 辽宁取暖补贴发放标准2020
  • 不动产租赁和经营租赁发票的区别
  • 浙江省电税务局电话
  • 12366重庆电子税务局
  • 财税公司经营范围介绍
  • 社保申报截止日期每月
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设