位置: IT常识 - 正文

机器学习中的隐变量/潜变量和隐藏空间/潜在空间

编辑:rootadmin
机器学习中的隐变量/潜变量和隐藏空间/潜在空间 机器学习中的隐变量/潜变量和隐藏空间/潜在空间1.什么是隐变量?1.什么是潜在空间(Latent Space)?2.机器学习中为什么要压缩数据?3.潜在空间中的“空间”是什么意思?4.数据相似的相似是什么意思?1.什么是隐变量?

推荐整理分享机器学习中的隐变量/潜变量和隐藏空间/潜在空间,希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

  在统计学中,隐变量或称潜变量,潜在变量,与观测变量相对,指的是不可观测的随机变量。潜变量可以通过使用数学模型依据观测得的数据被推断出来。用潜在变量解释观测变量的数学模型称为潜变量模型。 有些情况下,潜变量和现实中的一些因素是有关系的。测量这些因素理论上可行,实际上却很困难。这些情况里通常使用“隐变量(hidden variables)”这个词。另外一些情况下,潜变量指的是抽象概念,例如分类、行为、心理状态、数据结构等等。在这些情况下人们用 hypothetical variables 或者 hypothetical constructs 指代潜变量。

  使用潜变量的好处之一是潜变量能用来降低数据的维度。大量的观测变量能够被整合起来成为一个潜变量来表示深层次的概念,使得观测数据更容易理解。

1.什么是潜在空间(Latent Space)?

  如果必须用一句话来描述潜在空间,它仅仅意味着压缩数据的表示。   上图是手写数字(0-9)的大数据集。同一个数字3的手写图像与不同数字的图像7两者是最相似的。我们能否训练一种算法来识别这些相似性呢?如何做到呢?

  如果你已经训练了一个模型来对数字进行分类,那么这个模型已经学到了图像之间的 “结构相似性”。事实上,这就是模型为什么能够对数字进行分类–通过学习每个数字的特征。

  但模型学到每个数字的特征这个过程对你来说是“隐藏的”。这也就是隐藏/潜在空间中的Latent的意思,“隐藏的”。

  “潜在空间”的概念很重要,是“深度学习”的核心。深度学习就是学习数据的特征并简化数据表示,以寻找模型。

2.机器学习中为什么要压缩数据?

  数据压缩(Data compression)被定义为使用比原始表示更少的位来编码信息的过程。比如一共数据点是19D的数据点,即需要19个值来定义唯一点,然后将所有这些信息压缩到一个9D数据点中。如下图所示:   通常在机器学习中,数据被压缩以学习有关数据点的重要信息。例如,假设我们想使用全卷积神经网络(FCN)训练一个模型来对图像进行分类,即给定数字的图像后对输出相应的数字。在模型“学习”过程中,它只是简单地学习每一层的特征(边、角度等),并将这些特征组合到特定的输出中。

  但每次模型通过一个数据点学习时,图像的维数首先会降低,然后才会增加。(如下图中的编码器和瓶颈层Bottleneck)。当降维时,我们认为这是一种有损压缩。

Bottleneck layer又称之为瓶颈层,使用的是1x1的卷积神经网络。之所以称之为瓶颈层,是因为长得比较像一个瓶颈,即中间比较细。使用 1x1 网络的一大好处就是可以大幅减少计算量。 由上图可以看到,输入和输出的通道数是相同的都是256,但block结构里面的通道数先是64,是小于输入输出的通道数的。

机器学习中的隐变量/潜变量和隐藏空间/潜在空间

有损压缩:有损数据压缩(英语:lossy compression)是一种数据压缩方法,经过此方法压缩、解压的数据会与原始数据不同但是非常接近。它是与无损数据压缩相对的压缩方法。有损数据压缩又称破坏性资料压缩、有损压缩、不可逆压缩。有损数据压缩借由将次要的数据舍弃,牺牲一些质量来减少数据量、提高压缩比。

  因为模型需要重建压缩数据(见解码器),它必须学会存储所有相关信息,忽略噪声。这就是压缩的价值所在——它可以让我们去掉任何无关的信息,只关注最重要的特性。

这个“压缩状态”是我们数据的潜在空间表示。

3.潜在空间中的“空间”是什么意思?

  压缩的数据好像跟空间毫无关联,但两者有相似的地方。

  假设我们的原始数据集是尺寸为5 x 5 x 1的图像。我们将我们的潜在空间维数设为3 x 1,这意味着我们的压缩数据点是一个三维的向量。   现在,每个压缩数据点仅由3个数字唯一定义。这意味着我们可以在3D空间上绘制这些数据(一个数字是x,另一个是y,另一个是z)。这就是我们所说的“空间”。

  当我们绘制潜在空间中的点时,我们可以把它们想象成空间中的坐标,在这个坐标中,“相似”的点在图上更接近。

  那么现在的问题是,一般潜在空间的表示往往不是2维或3维向量,因为会丢失太多的信息。那对于空间中的四维点或n维点,甚至非向量我们如何想象呢?

  答案是,我们不能。我们是三维生物,无法理解n维空间(比如n > 3)。然而,有一些工具,如t-SNE,可以将我们的高维潜在空间表示转换成我们可以可视化的表示(2D或3D)。(见下面可视化潜在空间部分。)

  什么又是“相似”的图像,为什么我们数据的维度降低会使相似的图像在空间中“更接近”?

4.数据相似的相似是什么意思?

  举个例子,如果我们看下面三张图片-两张椅子和一张桌子,我们很容易地会说两张椅子的图片是最相似的,而桌子是最不同于任何一张椅子的图片。   是什么让这两个椅子图像“更相似”呢?因为椅子与桌子相比有不同的特点(如靠背,没有抽屉,腿之间的连接)。这些都可以通过我们的模型通过学习边、角等模式来“学习”出来。如前所述,这些特征会被打包在数据的潜在空间表示中。

因此,随着维数的降低,每个图像不同的“多余的”信息(例如椅子颜色)会从潜在空间表示中被“移除”,因为每个图像只有最重要的特征被存储在潜在空间表示中。

  因此,当我们降低维度时,这两个椅子的模型表示变得更相似。如果我们想象它们在同一个空间,它们挨得更近。

==注意:==在整篇文章中提到的“更近”是一个模糊的概率,并不是一个确定的欧几里得距离。

参考自Understanding Latent Space in Machine Learning

本文链接地址:https://www.jiuchutong.com/zhishi/294522.html 转载请保留说明!

上一篇:Tomcat服务器(怎么配置tomcat服务器)

下一篇:关于uni-app中uni-forms表单验证时“多级结构对象数据”如何做数据校验的解决方案(uni-app实例教程)

  • 电信查话费的号码是多少(电信查话费)(电信查话费的号码是多少)

    电信查话费的号码是多少(电信查话费)(电信查话费的号码是多少)

  • vivo手机能登3个微信吗(vivo手机登3个微信)

    vivo手机能登3个微信吗(vivo手机登3个微信)

  • 微信怎么更改密码(微信怎么更改密码支付)

    微信怎么更改密码(微信怎么更改密码支付)

  • 取消撤回按哪个键(关闭撤回功能)

    取消撤回按哪个键(关闭撤回功能)

  • soul怎么删除聊天记录(soul怎么删除聊天列表)

    soul怎么删除聊天记录(soul怎么删除聊天列表)

  • 相机专业模式的英文都是什么意思(相机专业模式的s)

    相机专业模式的英文都是什么意思(相机专业模式的s)

  • 探探怎么聊天要钱吗(探探要怎么样才能聊天)

    探探怎么聊天要钱吗(探探要怎么样才能聊天)

  • 苹果锁不了屏怎么回事(苹果屏幕锁不了)

    苹果锁不了屏怎么回事(苹果屏幕锁不了)

  • 笔记本电脑机械硬盘和固态硬盘有什么区别(笔记本电脑机械革命)

    笔记本电脑机械硬盘和固态硬盘有什么区别(笔记本电脑机械革命)

  • 苹果7掉水里了防水不(苹果7掉水里了,但是还能用,有影响吗)

    苹果7掉水里了防水不(苹果7掉水里了,但是还能用,有影响吗)

  • 手机压板是什么意思(手机压面板是什么意思)

    手机压板是什么意思(手机压面板是什么意思)

  • 电话手表必须要装移动卡吗(电话手表必须要开流量吗)

    电话手表必须要装移动卡吗(电话手表必须要开流量吗)

  • 什么是通信网(通信网概念)

    什么是通信网(通信网概念)

  • alp-al00是哪款手机型号(alp-al00是华为什么型号)

    alp-al00是哪款手机型号(alp-al00是华为什么型号)

  • iphone11拍照模糊(为什么iphone11拍照模糊)

    iphone11拍照模糊(为什么iphone11拍照模糊)

  • 苹果11系列都有哪些(苹果11系列都有什么颜色)

    苹果11系列都有哪些(苹果11系列都有什么颜色)

  • mpgt2ch/a是ipad几(mpgw2ch/a是ipad几)

    mpgt2ch/a是ipad几(mpgw2ch/a是ipad几)

  • xr有广角拍摄吗(苹果xr怎么设置广角拍摄)

    xr有广角拍摄吗(苹果xr怎么设置广角拍摄)

  • 手机b站怎么关弹幕(手机B站怎么关自己的直播)

    手机b站怎么关弹幕(手机B站怎么关自己的直播)

  • 电脑怎么取消后台运行

    电脑怎么取消后台运行

  • 苹果11有广角吗(苹果手机11有广角吗)

    苹果11有广角吗(苹果手机11有广角吗)

  • 能看朋友圈却不能点赞(能看朋友圈却不能看到动态)

    能看朋友圈却不能点赞(能看朋友圈却不能看到动态)

  • 不忘初心方得始终这句出自哪里? -(不忘初心方得始终什么意思)

    不忘初心方得始终这句出自哪里? -(不忘初心方得始终什么意思)

  • 苹果xsmax录制屏幕在哪(苹果xsmas录屏)

    苹果xsmax录制屏幕在哪(苹果xsmas录屏)

  • excel在哪下载

    excel在哪下载

  • Win10 预览版用户收到 Win11 升级提示,可选择继续接收 21H2 更新(win10预览版是什么意思)

    Win10 预览版用户收到 Win11 升级提示,可选择继续接收 21H2 更新(win10预览版是什么意思)

  • gpasswd命令  设置管理用户组(gparted 命令行)

    gpasswd命令 设置管理用户组(gparted 命令行)

  • 工程承包公司账务处理
  • 建筑施工企业的分公司区域公司等较大的
  • 购买理财产品计入交易性金融资产
  • 申领的发票多久过期
  • 水电费分析小报
  • 坏账核销的会计规定
  • 水利建设基金的会计分录
  • 小微企业季报
  • 单位车辆交强险赔付流程
  • 固定收益款可以开增值税专票吗?
  • 企业不得将生产经营项目、场所
  • 金融机构利息收入缴纳增值税
  • 企业承担的法律责任有哪些保险
  • 房地产企业进项税额转出
  • 费用利润率计算公式是什么意思
  • 固定资产报废的账务处理例题
  • 非营利组织注册登记证件图片
  • 结转上年度的企业所得税会计分录?
  • 不征税收入税收政策
  • 印花税计入税金及附加吗
  • 亏损企业股东年底借钱未还
  • 营改增之后还有营业税吗
  • 应税服务计入什么科目
  • 半成品牛排有营养吗
  • 敏感资产额怎么算
  • 企业所得税固定资产折旧计算
  • 事业单位洗车费如何入账
  • 小规模企业交纳印花税吗
  • 待处理财产损益期末结转到哪里
  • 华为哪些手机有hicar
  • 企业购入一批材料卖价5万元
  • 事业单位收入需要缴纳所得税吗
  • php数组函数大全
  • 机票增值税怎么计算
  • 如果工资少发怎么办
  • 开机自动连接宽带怎么设置w11
  • 商业银行贷款的三种基本形式
  • 商住房买卖过户流程
  • 威尼斯海滩滑板场
  • 国有土地租赁合同规定多少年
  • 利润总额为负还交所得税吗
  • php制作网页
  • 房屋所在地的房子怎么查
  • php_imagick
  • echarts柱状图立体
  • 全卷积网络fcn详解
  • 微信小程序小小驯龙师破解版
  • 使用ajax实现页面分页
  • 发票失控进项转出
  • 优先股可转让吗
  • 个体户开普票有没有完税证明
  • python的继承用法
  • 装货费用
  • 普通的增值税
  • 主管盾和制单盾是是转账使用的U盾吗?
  • 收据的种类是有几种
  • 一般纳税人在任何情形下都可以领购使用增值税专用发票
  • access数据保存
  • 一般纳税人实际税负怎么核算
  • 无偿调出固定资产应计入什么
  • 企业借款利息如何计算
  • 公司名下没有车可以办油卡吗
  • 企业如果为员工缴纳社保
  • 产品质量问题有赔偿吗
  • 企业所得税虚报成本多少属于犯罪
  • 探讨探讨
  • having的用法详解
  • sql合并多行到一列
  • Mac下mysql 5.7.17 安装配置方法图文教程
  • windows中双击硬盘驱动器图标操作的作用
  • ubuntu升级到21.04
  • Linux系统启动文件在哪个文件
  • mediaexplorer是什么意思
  • thinkpad笔记本键盘无法输入
  • javascript 中的事件委托详解
  • django返回json数据
  • 电子税务局怎么添加银行账户信息
  • 河南省税务零申报怎么操作
  • 青岛市地方税务局关于发票
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设