位置: IT常识 - 正文

立体匹配入门指南(8):视差图、深度图、点云(立体匹配原理)

发布时间:2024-01-17
立体匹配入门指南(8):视差图、深度图、点云

推荐整理分享立体匹配入门指南(8):视差图、深度图、点云(立体匹配原理),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:立体匹配步骤,sgbm立体匹配,立体匹配算法的研究和应用,立体匹配 综述,立体匹配算法的研究和应用,立体匹配步骤,立体匹配入门指的是什么,立体匹配的作用,内容如对您有帮助,希望把文章链接给更多的朋友!

本篇是比较简单的基础概念,刚入门的朋友可能是需要的。

视差图

三维点云

首先,我们要介绍下这三个概念。

视差(disparity)

视差 ddd 等于同名点对在左视图的列坐标减去在右视图上的列坐标,是像素单位 d=xl−xrd=x_l-x_rd=xl​−xr​立体视觉里,视差概念在极线校正后的像对里使用。

深度(depth)

深度D等于像素在该视图相机坐标系下ZZZ坐标,是空间单位。深度并不特在校正后的图像对里使用,而是任意图像都可获取深度图。

视差图(disparity map)

视差图指存储立体校正后单视图所有像素视差值的二维图像。

视差图是一张二维图像,和原图等大小视差图每个位置保存的以像素为单位的该位置像素的视差值以左视图视差图为例,在像素位置p的视差值等于该像素在右图上的匹配点的列坐标减去其在左图上的列坐标深度图(depth map)立体匹配入门指南(8):视差图、深度图、点云(立体匹配原理)

深度图指存储单视图所有像素的深度值的二维图像,是空间单位,比如毫米。

深度图是一张二维图像,和原图等大小,也就和视差图等大小深度图每个位置保存的是该位置像素的深度值深度值就是相机坐标系下的Z坐标值点云(point cloud)

点云指三维空间的三维点集合,坐标属性(X,Y,ZX,Y,ZX,Y,Z),法线属性(Nx,Ny,NzN_x,N_y,N_zNx​,Ny​,Nz​)(可选),颜色属性(R,G,BR,G,BR,G,B)(可选)

其次,为什么会有视差图和深度图呢?

我们知道,立体匹配一般是指逐像素的稠密匹配,这意味着每个像素都会得到一个视差值(包括无效值),如何存储这些视差值呢,显然以二维图的方式存储是很合适的,最大的两点优势是一方面可以通过像素坐标快速的在二维图中找到对应位置的视差值,而且和图像一样是有序的,邻域检索、视差滤波等将会变得非常方便;另一方面是可以直观的通过观察视差图和原图的对比,对视差图的质量有初步的判定。

而深度图的意义则是以更少的存储空间、有序的表达图像匹配的三维成果。更少的存储空间是因为只保存了一个深度值,而不是三维点云的三个坐标值,而深度值是可以结合像素坐标计算三维点坐标值的。有序是因为深度图和原图像素是一一对应的,所以原图的邻域信息完全继承到了深度图里。

这就是视差图和深度图的意义,视差图是立体匹配算法的产出,而深度图则是立体匹配到点云生成的中间桥梁。

视差图和深度图中间,有着一对一的转换公式: D=Bfd+(xr−xl)D=\frac {Bf}{d+(x_{0r}-x_{0l})}D=d+(x0r​−x0l​)Bf​ 其中,DDD为深度,ddd为视差,BBB为基线长度,fff为焦距(像素单位),xlx_{0l}x0l​和xrx_{0r}x0r​分别为左右视图主点的列坐标。,另一个较为熟知的公式是 D=BfdD=\frac {Bf}{d}D=dBf​ 这是在左右视图主点的列坐标相同的特殊情况,比如主点都在中心。

深度图计算相机坐标系下的点云,也有着简单的公式: Z=DX=D(x−xl)fY=D(y−yl)f\begin{aligned} Z &= D\\ X &= \frac {D(x-x_{0l})}{f}\\ Y &= \frac {D(y-y_{0l})}{f} \end{aligned}ZXY​=D=fD(x−x0l​)​=fD(y−y0l​)​​ 其中,x,yx,yx,y为像素的列坐标和行坐标,xlx_{0l}x0l​和yly_{0l}y0l​为主点的像素坐标。

常见问答: 问:为什么我从.png格式的视差图里读取到的视差值和真实值有很大差异? 答: 我们要先搞清楚,视差图是如何存储的。通常而言,我们是把二维视差图以图像格式存储,常见的格式有png、tif、pfm等,但这些图像格式存储的数据类型是有区别的,其中png只能存储整数,而tif和pfm则可以存储小数。而显然准确的视差值必然是浮点型的小数,所以存储为tif和pfm可以原值无损存储,而存储为png必然会损失精度,所以有的代码比如opencv会把得到的浮点型视差值乘以16倍取整,存储到png里,这样存储视差值的精度变为1/16,对于这种情况我们在读取png后要先除以16才是真实视差值,且视差会有阶梯分层现象。

那有同学就问,既然这样为什么要存储png呢?是因为目前主流的图像软件,不支持直接看浮点格式的tif和pfm,存储为png可以更好的观看视差图,当然要是实际生产使用,是必然不建议存储为png的,用来查看视差结果是可以的。

还有人会直接把视差值拉伸或者压缩到0~255,存储到png或bmp等存储整数的格式中,这样的视差图只能用来观看视差效果,没有其他作用,比如我的代码里的存储方式。

问:极线像对下的深度图和原图的深度图是一样的吗?如何转换? 答: 不一样,因为深度图是在视图所在的相机坐标系下的,所以和相机坐标系强挂钩,极限校正后的左视图和原始的左视图是不一样的相机坐标系,所以它们的深度图是不一样的。

对于极线像对左视图某像素ppp,通过单应变换 HHH 转换到原左视图上,得到原图上的像素坐标 qqq。将ppp的相机坐标系坐标通过一个旋转 RRR 变换到原左视图的相机坐标系坐标,得到 qqq 的深度。HHH和RRR在极线校正步骤可以获取(极线校正的必然产出)。
本文链接地址:https://www.jiuchutong.com/zhishi/299862.html 转载请保留说明!

上一篇:大语言模型集成工具 LangChain(大语言模型集成工具)

下一篇:SpringBoot【基础篇】---- 基于SpringBoot实现SSMP整合(springboot基本结构)

  • 支付给员工的工资属于什么科目
  • 房产税城镇土地使用税税率
  • 房地产企业什么时候开具正式发票
  • 纳税申报表申报日期
  • 年前一个月工资年后发
  • 年数总和法怎么做
  • 免税蔬菜税额用什么表示
  • 免征的附加税是什么
  • 支付货款未收到产品算货值吗
  • 防伪税控系统服务费发票在哪里开
  • 设计、制造
  • 建筑企业会计科目分类及明细表
  • 指定会计科目是
  • 收到公司退货会计分录
  • 固定资产原值减少账务处理
  • 汽车销售公司办公室周末上班吗知乎
  • 增值税普票跨月怎么冲红
  • 不交社保的单位违法吗?
  • 企业收取多年租金怎么算
  • 福利费用计入
  • 经济法基础企业所得税好难
  • 认缴制下股权转让如何不交税
  • 技术转让所得一百万交多少税
  • 营改增后营业外收入交增值税吗?
  • 增值税专用发票怎么开
  • 延期缴纳税款的条件是什么
  • 工会基金是扣个人还是扣企业的
  • 文化公司发展战略
  • 出口退税挂靠业务如何做帐?
  • 华为鸿蒙系统开发平台
  • 默认网关不可用的解决办法
  • 新成立的公司需要报残保金吗
  • 微软win11预览版
  • Win10怎么显示文件类型
  • 以物易物怎么写分录
  • 北极熊睡觉图片卡通
  • win7界面旋转
  • 应付债券的应付利息怎么计算
  • 记录一次游戏
  • 小微企业资金数额
  • 制造费用主要核算项目
  • 循环logo
  • 帝国cms移动端
  • 母公司给我们减工资
  • 小规模纳税人可以开13的税吗
  • 劳务费发票入账科目
  • 银行承兑汇票套利案例
  • 年化收益率和年利率区别
  • 收到现金货款怎么处理
  • 弱电工程怎么入账
  • 收款人是否应当承担还款责任
  • 一般来说,采取质押贷款方式
  • 无形资产的处置方式有哪些
  • 工会经费是应付职工福利还是管理费用
  • 机票抵扣怎么填申报表
  • 研发费用资本化条件
  • 建立明细账的注意事项
  • sql基础问题
  • 深入浅出了解啥意思
  • windows.old文件夹有啥用
  • 双系统计算机怎么开机
  • ip冲突不能上网怎么解决
  • linux cp 不是目录
  • windows8.1 preview
  • win7系统文件夹怎么加密
  • Win10计算机管理该文件没有与之关联的应用
  • win7累计更新补丁包
  • macbook xcode
  • android怎么ping
  • js必须掌握的
  • linux中argv
  • dos删除文件夹下所有文件 不删除父目录
  • python双循环题
  • python matplotlab
  • 源码分析怎么写
  • KBEngine v0.4.0 发布,分布式游戏服务端引擎
  • bash 入门
  • ajax获取数据两种类型
  • 抓落实韧劲不足的具体表现
  • 广东省职称证书编号查询系统
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号