位置: IT常识 - 正文

CNN中的底层、高层特征、上下文信息、多尺度(cnn三层)

编辑:rootadmin
CNN中的底层、高层特征、上下文信息、多尺度 一、CNN中的底层、高层特征:

推荐整理分享CNN中的底层、高层特征、上下文信息、多尺度(cnn三层),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:cnn几层网络比较好,cnn各层,cnn三层,cnn每一层学到怎样的特征,cnn包括哪些层,cnn有哪几层,cnn各层的作用,cnn各层,内容如对您有帮助,希望把文章链接给更多的朋友!

简短总结: 分类要求特征有较多的高级信息,回归(定位)要求特征包含更多的细节信息

1)图像的低层特征(对定位任务帮助大,我们可以想想比如轮廓信息都不准那怎么去良好定位): 图像底层特征指的是:轮廓、边缘、颜色、纹理、棱角和形状特征。 边缘和轮廓能反映图像内容;如果能对边缘和关键点进行可靠提取的话,很多视觉问题就基本上得到了解决。图像的低层的特征语义信息比较少,但越浅的层特征越细节(低级)且特征图分辨率大,所以位置信息很充足,目标位置准确。再从另一个方面讲,越浅层的特征感受野越小(每个像素点映射回原图的覆盖面积小),故用浅层特征图检测大目标时就有点像瞎子摸象的感觉效果并不好,因为光能看到象腿也不知道这是啥东西。当然对于小目标检测来说如果能利用足够的上下文信息也是有好处的!例如,通过只看图中的一个小目标所在的那个位置,人类甚至很难识别这些物体。然而,通过考虑到它位于天空中的背景,这个物体可以被识别为鸟类。因此,我们认为,解决这个问题的关键取决于我们如何将上下文作为额外信息来帮助检测小目标。

CNN中的底层、高层特征、上下文信息、多尺度(cnn三层)

2) 图像的高层特征也叫语义特征(高层特征即CNN中网络越深的层得到的特征,高层的特征包含很丰富的组合信息,象征着人对它的分辨能力,越高层越好分辨出是啥东西,如表征着类别啥的,对识别任务帮助大): 图像的高层语义特征值得是我们所能看的东西,比如对一张人脸提取低层特征我们可以提取到连的轮廓、鼻子、眼睛之类的,那么高层的特征就显示为一张人脸。高层的特征语义信息比较丰富,但是目标位置比较粗略。 愈深层特征包含的高层语义性愈强、分辨能力也愈强。我们把图像的视觉特征称为视觉空间 (visual space),把种类的语义信息称为语义空间 (semantic space)

二、上下文信息

做图像的,上下文特征是很常见的,其实上下文大概去理解就是图像中的每一个像素点不可能是孤立的,一个像素一定和周围像素是有一定的关系的,大量像素的互相联系才产生了图像中的各种物体,所以上下文特征就指像素以及周边像素的某种联系。

具体到图像语义分割,一般论文会说我们的XXX算法充分结合了上下文信息,意思也就是在判断某一个位置上的像素属于哪种类别的时候,不仅考察到该像素的灰度值,还充分考虑和它临近的像素。

然后上下文信息还分全局和局部,意思就是考虑全图不同范围内的像素和只考虑邻近的一些像素。

全局上下文信息 也可以理解为能够捕捉来自更多的不同尺度的上下文信息,不同尺度就是指不同感受野。

三、多尺度

个人感觉,多尺度 就是 你能看到的范围(看到尺度就理解为CNN的感受野就完事了!!!)。关于感受野的理解可以看我的这篇文章:深度理解CNN中的感受野(大杀器)

图像中一个东西的尺度越大,就指距离越近相当于被放大了,那么给人感觉就越模糊。例如: 1)训练的时候,把图片缩放到不同大小输入给同一个网络,网络就能看到不一样大小范围的内容,缩放得分辨率越高就指尺度越大,因为对图中的某一个物体来讲就是被放大的感觉。然后就是因为缩放后,比如中间特征图上的某个像素点都只能看到原图3乘3的区域,可随着输入的图片尺度不一样,同样是看到的3乘3区域,但相对于整张图的范围也自然就不一样了,然后就叫做多尺度训练;好处是可以适应不同尺度的输入,泛化性好。 2)把一个特征层用由不同感受野的卷积核组成的网络层(例如SPP)处理,这层网络的同一个像素位置就能看到不同范围的上层特征,就叫做多尺度特征融合;好处是能考虑到不同范围的空间特征上下文(例如头发下面一般会有一张脸)。 3)把一个网络中不同深度的层做融合:浅层感受野小,分辨率大,能够处理并保存小尺度的几何特征;高层感受野大,分辨率小,能够处理并保存大尺度的语义特征。这也叫做多尺度特征融合;好处是能够将语义特征和几何特征进行融合(例如这块区域是头发,低分辨率图上的分界线一般是线状特征和非线状特征的边界)。

本文链接地址:https://www.jiuchutong.com/zhishi/299526.html 转载请保留说明!

上一篇:React组件化-类组件和函数组件介绍(react 组件化)

下一篇:Vue前后端交互(vuenode前后端交互的方式)

  • 未交增值税和应交增值税科目怎么调整
  • 企业所得税广告费30%扣除
  • 纳税人办理退税流程
  • 关税是价内税还是税外税
  • 计提房产税会计分录怎么做
  • 付加工费会计分录怎么做
  • 个税申报信息怎么恢复
  • 嵌入式软件产品的批准放行
  • 向关联企业捐赠现金500万元,假定按照税法规定
  • 会计凭证可分为哪三类
  • 过路费发票可以抵扣增值税吗
  • 河道维护中心职责
  • 第三方协议补贴
  • 公司买房需要交房产税吗
  • 出口退税总是差进项票怎么处理
  • 不同项目之间进项税能否抵扣?
  • 职工报销费用的处理流程
  • 购物预付卡怎么用
  • 公司买珠宝会计分录
  • 补缴的公积金可以取出来吗
  • 公司没成本票怎么暂估
  • 企业报税提交清算了怎么撤销
  • 个人股票期权收益所得税怎么缴纳?
  • 可引导的macos
  • 电脑不用的情况下怎么让它关闭屏幕
  • ps4运行windows
  • PHP:oci_lob_is_equal()的用法_Oracle函数
  • 若依框架登录后跳转到指定页面
  • 获取当前位置被拒怎么办
  • 跨年度费用应如何计算
  • 解决本地浏览器的方法
  • 装修费用如何做分录
  • php+oracle
  • uni-app list
  • 国家公园好玩吗
  • wordpress文章编辑使用教程
  • 购买办公楼之后怎么入账
  • 小型微利企业减免所得税计算公式
  • 信用减值损失在借方是增加还是减少
  • 清包劳务有措施费吗
  • 个税申报中是否婚前各自首套贷款
  • python结合
  • three.js 教程
  • vue 自适应网站ui框架
  • 关于古老的jsp页面的知识汇总(超详细)
  • echarts在地图上标记图标
  • uni app ios
  • 应收账款坏账准备计提方法
  • 个税APP怎么填报扣税最少
  • 抵扣联怎么抵扣使用
  • 电子发票开错了应该怎么办?
  • 在建工程账务处理会计分录
  • 红字更正法适用于更正什么样的错误
  • 专家评审费如何入账
  • 差旅费住宿费专票
  • 卖二手车买卖
  • 以公允价值计量的金融资产
  • 互联网金融理财产品的优势
  • 2023年职工养老保险缴费标准
  • 红十字会是事业编还是行政编
  • 赠送设备如何做账务处理
  • 存货跌价准备可以转回吗,分录怎么写
  • 支票上的金额和确定的金额
  • mysql不同数据库不同数据表导入数据
  • Linux下安装MySQL5.7.19问题小结
  • win8还能用吗
  • solaris 2020
  • win10如何添加蓝牙驱动
  • 重装系统后没声音怎么解决win7
  • pkjobs.exe - pkjobs是什么进程 有什么用
  • cocos2dx怎么用
  • node.js nvm
  • dom事件模型由什么组成
  • linux如何配置
  • 用python写脚本
  • python中fun函数怎么用
  • 小微企业 2018
  • 甘肃税务局电子税务局官网电子发票怎么查询
  • 江西省抚州市黎川县洵口镇
  • 税务会计业务处理流程
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设