位置: IT常识 - 正文

点云数据的语义分割算法综述总结大全(传统方法+基于深度学习的方法)(什么叫点云数据)

编辑:rootadmin
点云数据的语义分割算法综述总结大全(传统方法+基于深度学习的方法)

目录

1 传统方法

1.1基于边缘信息的分割

1.2基于模型拟合的分割

1.3基于区域增长的分割

1.4基于属性的分割

1.5基于图优化的分割

2基于深度学习的方法

2.1基于投影的分割

2.1.1多视图表示

2.1.2球状表示

2.2基于体素的分割

2.3基于点的分割

2.3.1 逐点MLP方法

2.3.2 点卷积方法

2.3.3 基于RNN的方法

2.3.4 基于图优化的分割

3 总结


推荐整理分享点云数据的语义分割算法综述总结大全(传统方法+基于深度学习的方法)(什么叫点云数据),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:点云数据的处理,点云数据的特点是什么,点云数据的特点是什么,点云数据的语义有哪些,点云数据中包含哪些信息,点云数据的语义有哪些,点云数据语义分割的理论与方法,点云数据语义分割,内容如对您有帮助,希望把文章链接给更多的朋友!

相比较于2D数据(图像数据),三维点云数据大多是非规则化、非结构化并且无序的,保留了原始的几何信息在三维空间中,虽然可以获取对象的形状大小,但对其空间位置、几何属性、实质属性等特征的分割也带来了更多的问题。加上其采集过程中,光线以及设备角度变化的速率造成采集的点数据的密度分布不均,点云语义分割仍面临一系列的问题。

早期也有不少人尝试在点云分割领域做研究,这些传统的分割方法也取得了一定的效果,但大多受限于特定的场景和先验知识,无法推广应用,并且比较耗时。

随着近些年来深度学习的快速发展,点云语义分割的研究重点也转移到以深度学习为首的相关方法上。这些方法相较于早期的传统方法,分割的准确度有了极大的提升,尤其是直接在点云上处理数据的思想被提出以后,越来越多的人开始倾向于直接在点云上进行处理,来充分利用3D点云中所包含的丰富的空间信息。

1 传统方法

在深度学习应用于点云分割领域之前,已经有相当多的方法在尝试点云的分割,这些传统的点云分割方法主要依赖于几何约束和统计规则来人工设计物体的特征,将原始的点云数据分为不重叠的几组区域,来对应场景中的各个对象,虽然效果不太理想,但思想仍然有可借鉴的地方,这些方法可分以下四个方面。

1.1基于边缘信息的分割

基于边缘的分割方法是通过识别亮度突变点来识别边缘信息,从而描述物体的形状,再对这些边缘信息点进行分组来确定最终的分割结果。

该方法分割速度较快,但缺点是准确度比较低,对于密度不均匀或稀疏的点云很敏感,还会受到噪声的干扰。

1.2基于模型拟合的分割

基于模型拟合的分割是以点云数据的分类和几何形状为基础的,将点云与已知的几何图形进行对比匹配(如圆柱体、圆锥体、球体等)将具有相同数学特征的点划为一类,从而在点云中分割出已知的几何形状,

该方法主要是基于数学原理的分割方法,与基于边缘信息的分割相比,不仅受噪声干扰小,还有较快的计算速度。

1.3基于区域增长的分割

以区域为基础的分割方法就是对点云区域进行分割,根据一定的差异准则,将差异性小的点云归为同一区域。具体分为种子和非种子区域方法。

种子区域首先需要选取多个种子点作为起始点,依据设定好的生长规则,在种子周围添加特征相似度高的邻域点,使其邻域空间生长扩散,再以此邻域点作为新的种子点重复以上生长过程。种子区域分割受噪声影响较大,计算时间较长。另外,该方法的分割精度很大程度受初始种子点选取的影响,因此,如何选择合适的初始种子点是该方法的关键点和难点。

非种子区域则是先将空间域所有的点归为同一区域,再对该区域进行进一步细分。和种子区域相比,非种子区域分割的缺点在于难以细分位置,而且存在分割过度的情况,分割的精度对先验知识的要求较高。

1.4基于属性的分割

先根据点云属性进行计算,将计算得到的点的属性进行聚类,为每一个点定义一个特征向量,相似的特征向量将会被归于一类,以此来完成分割。

该方法可以较好的解决噪声和异常值的影响,但缺点是对点云密度要求高且计算时间较长。

1.5基于图优化的分割

基于图的分割方法通过建立点之间的关系,将点云数据转变为图数据,再对这个图数据进行卷积计算,即选用合适的图卷积神经网络对其进行表征学习。

该方法的优点是图卷积能够聚合物体的点集特征,并且保持其三维空间的平移不变性,但怎么合适地建立点与点之间的关系还是一个待解决地难题。

2基于深度学习的方法

随着深度学习的发展,计算机视觉的各个领域已经越来越离不开深度学习。利用深度学习处理2D图像数据的技术已经十分成熟并且取得了很好的效果。近年来越来越多的研究者将目光投向利用深度神经网络处理点云。

二维的数字图像是由像素组成矩阵构成的,很容易的在计算机中进行表示。但三维的点云数据由空间中无序的点构成,很难在计算机中直接处理。因此需要将点云转化适合卷积神经网络(Convolutional Neural Network,CNN)处理的规则结构。

主要有以下方式:基于投影、基于体素和基于点的分割。

2.1基于投影的分割2.1.1多视图表示

早期的深度学习方法尝试将3D点云投影到2D平面上,然后基于CNN的网络模型来对数据进行处理。这个方法解决了三维点云数据难以处理的问题,利用CNN提取平面投影的特征,将多视图的平面投影特征聚合在一起,通过全连接层和池化层得到语义分割的结果。

图2.1 基于多视图表示的代表性网络结构

Fig.2.1 Representative network structure based on multi-view approach

点云数据的语义分割算法综述总结大全(传统方法+基于深度学习的方法)(什么叫点云数据)

由于三维点云被投影到二维图像上会受到不同视点选择和投影角度的影响,导致图像丢失部分可用的空间集合信息,一定程度上会造成分割精度的下降,而这个缺点是该算法难以避免的。

2.1.2球状表示

激光雷达扫描后的点云的几何形状类似一个空心圆柱体,从垂直与圆柱体主轴的方向来看空心圆柱时,可以将其理解为一个环绕的平面图像,这样就可用球状投影图像来表示三维点云。

此方法突出特点是速度快,相较于多视图投影,球面投影方式保留了更多的点云信息,但对于多视图存在的遮挡物问题,球面投影方式仍无法解决。

2.2基于体素的分割

体素(occupancy voxels)是一种结构化的表示方法,即将原始的点云数据分成具有一定空间大小的体素。

图2.2 基于多视图表示的代表性网络结构

Fig.2.2 Representative network structure based on voxel approach

总体来看,体素化表示点云能较好保留原始点云的邻域结构,体素化表示的结构也具有良好的可扩展性,具有较好的分割效果。但体素化本身会带来离散伪影和信息丢失等问题,虽然点云体素化将点云转变为了规则数据,但选择高分辨率的同事也带来了计算效率低与占用内存大的问题,导致难以选择适合的网格分辨率来满足各方面的均衡。

2.3基于点的分割

由于基于投影和基于体素的方法都存在空间信息丢失和结构分辨率下降等局限性,因此需要一种更加有效的方法来处理点云。基于点的分割方法,不仅能够更充分利用点云的几何结构信息,还提升了计算效率。

目前基于点的分割方法大致分为逐点MLP方法、点卷积方法、基于RNN的方法和基于图的方法。

图3 基于点云方法的代表性网络结构

Fig.2.3 Representative network structure based on point

2.3.1 逐点MLP方法

PointNet:直接在点云数据上进行处理,使用共享多层感知机(MLP)提取输入点云数据中每个点的特征,经由最大池化得到全局特征。其核心在于T-Net网络,先利用第一个T-Net对点云构造转换矩阵进行空间对齐,解决点云转换不变性的问题,再用一个T-Net对点云构造转换矩阵进行特征空间对齐。

PointNet通过点云的全局特征完成了点云的分类与分割,但也忽略了局部特征,后续为了解决这一问题,PointNet++被提出,通过将点分层,在每层内分组来学习特征,这允许网络从更大的局部区域内来逐步学习点特征。另外,为了解决点云中密度不均匀的问题,设计了一种多分辨率组合算法,由两部分向量组成,一部分是对这部分所有点进行特征提取所得到的向量,即为局部的全局特征向量;另一部分是对子集进行特征提取,即为局部的局部特征向量。该算法较好地提升了多尺度组合算法的计算速度。后续的改进也大多集中在如何学习到更为丰富的每个点关联的上下文信息和局部结构,主要发展为以下几个方法,包括相邻特征池,基于注意力的聚合以及局部全局特征串联的方法。

虽然PointNet没有关注局部特征信息,难以适用于复杂或点云密度不均匀的场景,但由于其开创性的思想,为后来的点云语义分割研究提供了很好的借鉴意义。

2.3.2 点卷积方法

卷积操作的优点是能够很好的提取规则数据的空间信息,但点云数据本身所固有的不规则性使普通的卷积操作无法直接应用于原始点云数据。

PointCNN:设计了一种Xtransformation先对点云数据进行规则化处理,重新加权和排列各点的相关联特征,保留点云的空间位置信息,然后对处理过的点云进行传统的卷积操作。PointCNN能够利用数据中以网格形式密集表示的空间局部相关性,因此在点云分割和分类上取得了比较好的表现,但在这些点关联的特征上直接求核的卷积会导致部分形状信息的丢失,还存在因点云顺序不同导致计算结果存在差异的问题。

除此之外,也有直接对传统的卷积操作进行改进的方法,Thomas等人[15]提出的核点卷积网络KPConv,将点云空间中的三维点作为卷积中心,坐标点之间的相对位置信息使用欧氏距离,通过多个卷积中心和根据距离赋予每个点不同的权重值来保存实际三维空间的位置信息。通过两种不同的卷积中心,一种刚性的Rigid Kernel处理均匀分布的简单任务,一种可变的Deformable Kernel处理位置变化的复杂任务。 

2.3.3 基于RNN的方法

循环神经网络(RNN)用于点云语义分割主要是为了获取点云本身固有的上下文特征,空间上下文信息对于分割性能的提高很重要。

Ye等人[17]提出一种用于非结构化点云语义分割的新型端到端方法,构建了一个高效的金字塔池化模型来提取3D点云的局部信息,再通过一个双向的RNN提取空间的点云全局依赖性。两个RNN通过不同的方向扫描3D空间提取信息,通过使用两个方向上的层级顺序RNN来融合不同尺度的局部信息以获得更大范围的上下文信息,最终达到良好的3D语义分割的效果。但过多的融合局部特征会丢失原始点云的丰富的几何特征。

2.3.4 基于图优化的分割

基于图的分割方法,是通过建立点之间的关系,将点云数据转变为图数据,再对这个图数据进行卷积计算,即选用合适的图卷积神经网络对其进行表征学习。

基于图的方法的思想是将点云中每个点视为图的顶点,与其领域点构成图的有向边,以此来捕获点云的底层形状和几何结构。

该方法的优点是图卷积能够聚合物体的点集特征,并且保持其三维空间的平移不变性,但怎么合适地建立点与点之间的关系还是一个待解决地难题。

3 总结

点云数据与普通图像相比具有稀疏性、不规则性、无序性等特点,且对算法效率、内存占用等方面的要求较高,传统的算法难以对三维点云数据进行处理和建模。相比传统方法,基于深度学习对点云数据进行特征提取能够应用于更多的场景,分割效果也更好,基于图卷积神经网络的三维点云分类和分割算法也得到越来越多人的关注和研究。

基于点的网络是目前最常用的研究方法,也有一些点-体素或其他表示方式的联合方法也表现出良好的分割性能,多方法的融合为点云分割领域带来了更多的可能性,目前已有一些工作试图结合不同深度学习方法的优点,但还未取得较好的效果。因此,未来对于不同方法之间的融合是点云数据语义分割仍研究的难点和重点。

参考文献

Y. H. Qu, Q. Pan, J.G. Yan. Flight path planning of UAV based on heuristically search agenetic algorithmns Industrial Electronics Society, 2005C]. IECON 2005. 31st Annt Conference of IEEE.IEEE,NC,USA,2005.F. J. Lawin, M. Danelljan, P. Tosteberg, G. Bhat, F. S.landM.Felsberg,“Deep projective 3D semantic segmtion,”inCAIP,2017.Chen X,Ma H,Wan J,et al. Multi-view 3d object detection nProceedings of the IEEE conference on Computer Vision and Pattern Recognition.2017:1907-1915Isacson D,Smedh K,Nikberg M, et al. Long - term follow - up of the AVOD ramdomized trial of antibiotic avoidance in uncomplicated diverticulitis[J]. British  Journal of Surgery,2019,106(11):1542-1548Boulch A, Guery J, Le Saux B, et al SnapNet: 3D point cloud semantic labeling with 2D deep segmentation networks[J].Computers & Graphics,2018,71:189-198.Wu, A. Wan, X. Yue, and K. Keutzer,“SqueezeSeg: Convolutional neural nets with recurrent CRF for real-time road object segmentation from 3D LiDAR  point cloud,”in Proc.IEEE Int. Conf. Robot.Autom.,2018,pp.1887-1893.Milioto, I. Vizzo, J. Behley, and C. Stachniss“RangeNet+ +:Fast and accurate LiDAR semantic segmentation,”in Proc. IEEE/ RSJInt. Conf.Intell.Robots Syst.,2019, pp. 4213-4220.J. Huang and S. You, “Point cloud labeling using 3D convolutional neural network,inICPR,2016.Liu B,Wang M,Foroosh H,et al Sparse convolutional neural networks[C]. Proceedings of the IEEE conference on computer vision and pattern recognition.2015:806-814Klokov R, Lempitsky V. Escape from cells: Deep kd-networks for the recognition of 3d point cloud models[C]. Proceedings of the IEEE International Conference on Computer Vision.2017:863-872.Riegler G,Osman Ulusoy A,Geiger A. Octnet: Learning deep 3d representation at high resolutions[C]. Proceedings of the IEEE conference on computer vision and pattern recognition 2017:3577-3586.Qi C R, Su H, Mo K, et al. Pointnet: Deep learning on point sets for 3d classification and segmentation[C] //Proceedings of the IEEE conference on computer vision and pattern recognition.2017:652-660Qi C R, Yi L, Su H, et al. Pointnet+ +: Deep hierarchical feature learning on point sets in a metric space. Proceedings of the Advances in Neural Information Processing Systems[C]2017: 5099-5108.Li, Yangyan, et al. "Pointcnn: Convolution on x-transformed poin-ts."Advances in neural information processing systems31 (2018).Thomas, Hugues, et al. "Kpconv: Flexible and deformableconvolution for point clouds."? Proceedings of the IEEE/CVF international conference on computer vision. 2019.F.Engelmann,T.Kontogianni,A.Hermans,and B.Leibe,“Exploring spatial context for 3D semantic segmentation of point clouds,”in Proc. IEEE/CVF Int.Conf.Comput.Vis.,2017,pp. 716-724.L. Landrieu and M.Simonovsky, “Large-scale point cloud sem-antic segmentation with superpoint graphs,” in Proc. IEEE/ CVFConf. Comput. Vis. Pattern Recognit, 2018,pp.4558-4567L. Landrieu and M. Boussaha, Point cloud oversegmentationwith graph-structured deep metric learning,”in Proc. IEEE/CVFConf. Comput. Vis. Pattern Recognit., 2019, pp. 7432-7441.
本文链接地址:https://www.jiuchutong.com/zhishi/298421.html 转载请保留说明!

上一篇:SSD训练数据集流程(学习记录)(ssd训练自己的数据集pytorch)

下一篇:看这篇就够了——opencv与libopencv与cv_bridge的安装与使用(看了这篇文章感触很深的说说)

  • lt18i评测(lt18)(lt183)

    lt18i评测(lt18)(lt183)

  • 成都成华区代理记账_兼职会计_费用低_会计兼职群(成都市成华区有哪些公司)

    成都成华区代理记账_兼职会计_费用低_会计兼职群(成都市成华区有哪些公司)

  • excel怎么选中自己想选范围(excel怎么选中自己想选范围打印)

    excel怎么选中自己想选范围(excel怎么选中自己想选范围打印)

  • qlv格式用什么播放器(qlv格式什么播放器好用)

    qlv格式用什么播放器(qlv格式什么播放器好用)

  • obs推流无法连接服务器(obs推流不了)

    obs推流无法连接服务器(obs推流不了)

  • 索尼n3ap属什么级别(索尼n3ap n3bp)

    索尼n3ap属什么级别(索尼n3ap n3bp)

  • 计算机硬件系统的组成(计算机硬件系统包括)

    计算机硬件系统的组成(计算机硬件系统包括)

  • 苹果电脑投影仪切换键(苹果电脑投影仪投屏怎么设置)

    苹果电脑投影仪切换键(苹果电脑投影仪投屏怎么设置)

  • 钉钉可以同时加入两个班级吗(钉钉可以加两个群吗)

    钉钉可以同时加入两个班级吗(钉钉可以加两个群吗)

  • 滴滴注册城市修改不了(滴滴车主注册城市在哪里更改)

    滴滴注册城市修改不了(滴滴车主注册城市在哪里更改)

  • 华为荣耀20Pro手机怎样给照片打上马赛克(华为荣耀20pro手机长度)

    华为荣耀20Pro手机怎样给照片打上马赛克(华为荣耀20pro手机长度)

  • r17耗电快怎么解决(r17掉电快)

    r17耗电快怎么解决(r17掉电快)

  • n卡数字振动伤害眼睛吗(n卡数字振动没应用到游戏咋办)

    n卡数字振动伤害眼睛吗(n卡数字振动没应用到游戏咋办)

  • 斐讯无线扩展有什么用(斐讯路由器无线扩展模式有没有连接上)

    斐讯无线扩展有什么用(斐讯路由器无线扩展模式有没有连接上)

  • 安卓机root有什么危害(安卓root能干嘛)

    安卓机root有什么危害(安卓root能干嘛)

  • 启动通讯助理漏话提醒是怎么回事(启动通讯助理漏了怎么办)

    启动通讯助理漏话提醒是怎么回事(启动通讯助理漏了怎么办)

  • 荣耀9x支持面部解锁吗(荣耀9x面部识别在哪)

    荣耀9x支持面部解锁吗(荣耀9x面部识别在哪)

  • 淘宝怎么查删过的订单(如何查询删除的淘宝记录)

    淘宝怎么查删过的订单(如何查询删除的淘宝记录)

  • 华为nova5pro怎么插耳机孔(华为nova5pro怎么样)

    华为nova5pro怎么插耳机孔(华为nova5pro怎么样)

  • 抖音一鸣惊人特效在哪里(一鸣惊人2021)

    抖音一鸣惊人特效在哪里(一鸣惊人2021)

  • 怎么看iphone11是不是国行(怎么看iphone11是不是pro)

    怎么看iphone11是不是国行(怎么看iphone11是不是pro)

  • 就寝闹钟怎么关(就寝闹钟关闭)

    就寝闹钟怎么关(就寝闹钟关闭)

  • 苹果11支持双卡吗(苹果11支持双卡4G吗)

    苹果11支持双卡吗(苹果11支持双卡4G吗)

  • 怎样删除qq音乐云端记录(怎样删除qq音乐里的最近常听的音乐)

    怎样删除qq音乐云端记录(怎样删除qq音乐里的最近常听的音乐)

  • 小米手机望远镜在哪里(小米手机望远镜怎么设置在哪里)

    小米手机望远镜在哪里(小米手机望远镜怎么设置在哪里)

  • miplay是什么型号(miplayclient)

    miplay是什么型号(miplayclient)

  • 怎么养火花

    怎么养火花

  • Oppo reno的电池容量是多少(opporeno的电池容量在哪里看)

    Oppo reno的电池容量是多少(opporeno的电池容量在哪里看)

  • 苹果xsmax怎样通话录音

    苹果xsmax怎样通话录音

  • vue3与vue2的对比(vue3与vue2的区别)

    vue3与vue2的对比(vue3与vue2的区别)

  • 增值税发票确认平台怎么认证发票
  • 用友t6会计科目在哪里找
  • 税控抵减会计分录
  • 出口货物离岸价格
  • 预缴土地增值税的会计处理
  • 多计提的应收账款如何调整
  • 发票额开多了多出的金额怎么处理?
  • 发行债券支付的费用要减吗
  • 公司租的员工宿舍退租,现在要开发票给人家退房租
  • 营改增成功案例
  • 小规模时取得的专票在一般纳锐人之后可以抵扣吗
  • 外资企业所得税税率25
  • 工会发票的纳税识别号
  • 广告宣传费扣除标准30%是什么?
  • 广告支持政策
  • 银行汇款风险提示
  • 一般纳税人如何零申报
  • 公司账上收到退回的多交的附加税怎么做
  • 财政收据可以抵税吗
  • 增值税防伪税控系统管理办法
  • 记账凭证做完之后干什么
  • 符合条件的小型微利企业减按多少的税率征收企业所得税
  • 改造工程完工会计分录
  • 如何设置电脑任务栏显示
  • 新版Win10中,如何仅修改部分文本大小
  • 百内国家公园塔状尖峰
  • 驾校收入与成本的关系
  • 去年未计提费用,今年付怎么做账
  • 新公司成立的前期准备工作计划
  • php ftp管理系统
  • js map foreach遍历
  • 董事费如何计算个人所得税
  • 银行存款缴纳房产税会计分录
  • axios在vue中的使用慕课笔记
  • html-css
  • 车间装修预算表
  • ChatGPT 中文调教指南。各种场景使用指南。学习怎么让它听你的话
  • critical_section 结构
  • php推送微信公众号客户消息
  • 销售收入是营业总收入么
  • 自产自销的农产品可以抵税吗
  • 计提印花税会计
  • 怎么判断其他债权债务
  • 小规模企业收到专票怎么做账
  • 行政单位与事业单位净资产的比较
  • 因管理不善材料被盗应记啥科目
  • 本月开红字发票如何报税?
  • 公司自己制造设备怎么办
  • 应收账款周转率高说明
  • 事业单位利息收入
  • 预计负债可以获取利润吗
  • 企业出售投资性房地产应按照售价与账面价值
  • 建账的要点及应注意的问题
  • 暂估入账后续处理
  • MySQL关于exists的一个bug
  • sql中存储过程的用法
  • windowsxp不能启动怎么修复
  • win8 系统设置
  • windows 2008
  • winxp中网桥Bridge功能概述及配置注意事项
  • xp系统网络设置在哪
  • 调整linux时间
  • linux shell脚本实例
  • window10打补丁
  • win8适用的pr
  • WIN10任务栏时间不动
  • linux系统怎么弄
  • 打地鼠android
  • js设计模式书
  • Node.js中的事件循环是什么
  • js继承怎么实现
  • python自动发邮件内容
  • unity smooth
  • shell脚本windows
  • [置顶]bilinovel
  • html5 jquery
  • jquery选择器的分类有哪些
  • 国家税务总局72号文件
  • 浙江省电子税务局电话
  • 税务局临时工工资多少
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设