位置: IT常识 - 正文

学习笔记:统计建模方法的比较分析(统计 α)

编辑:rootadmin
学习笔记:统计建模方法的比较分析 前言

推荐整理分享学习笔记:统计建模方法的比较分析(统计 α),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:统计烦吗,统计itt,统计tli,统计 ci,统计 ci,【统计 】,统计 α,统计 α,内容如对您有帮助,希望把文章链接给更多的朋友!

本文介绍了隐马尔可夫模型 (HMM)、最大熵马尔可夫模型 (MEMM) 和条件随机场 (CRF) 的比较分析。 HMM、MEMM 和 CRF 是三种流行的统计建模方法,通常应用于模式识别和机器学习问题。 让我们更详细地探讨每种方法。

一、隐马尔可夫模型 (HMM)

“隐藏”一词象征着只有系统发布的符号是可观察的,而用户无法查看状态之间的底层随机游走。 该领域的许多人将 HMM 视为有限状态机。

HMM的优势

HMM 具有强大的统计基础和高效的学习算法,可以直接从原始序列数据中进行学习。 它允许以本地可学习方法的形式一致地处理插入和删除惩罚,并且可以处理可变长度的输入。 它们是序列概况最灵活的概括。 它还可以执行多种操作,包括多重对齐、数据挖掘和分类、结构分析和模式发现。 它也很容易组合到库中。

HMM 的缺点

HMM 仅依赖于每个状态及其对应的观察对象:

序列标注,除了与单个词有关系外,还与观察到的序列长度、词上下文等方面有关。

目标函数和预测的目标函数不匹配:HMM得到的是状态和观测序列的联合分布P(Y, X),而在估计问题上,我们需要一个条件概率P(Y|X)。

二、最大熵马尔可夫模型 (MEMM)

MEMM 考虑了相邻状态和整个观察序列之间的依赖关系,因此具有更好的表达能力。 MEMM不考虑P(X),减少建模工作量,学习目标函数与估计函数的一致性。

MEMM 标签偏差

在上图 中,状态 1 倾向于转换为状态 2,同时状态 2 倾向于停留在状态 2。

P(1-> 1-> 1-> 1)= 0.4 x 0.45 x 0.5 = 0.09, P(2->2->2->2)= 0.2 x 0.3 x 0.3 = 0.018,

P(1->2->1->2)= 0.6 x 0.2x 0.5 = 0.06,P(1->1->2->2)= 0.4 x 0.55 x 0.3 = 0.066。

然而,最佳状态转换路径是 1 > 1 > 1 > 1。 为什么?

这是因为 State 2 的可转换状态比 State 1 多,从而降低了转换概率——MEMM 倾向于选择可转换状态较少的状态。 这种选择被称为标签偏差问题。 CRF 很好地解决了标签偏差问题。

三、条件随机场(CRF 模型)

CRF 模型解决了标注偏差问题,消除了 HMM 中两个不合理的假设。 当然,模型也变得更复杂了。MEMM采用局部方差归一化,CRF采用全局方差归一化。另一方面,MEMM 无法找到满足以下分布的相应参数,但是 CRF 可以:

1.生成模型或判别模型学习笔记:统计建模方法的比较分析(统计 α)

假设 o 是观测值,m 是模型。

a) 生成模型:无限样本>概率密度模型=生成模型>预测

如果你对 P(o|m) 建模,它就是一个生成模型。 其基本思想是,首先建立样本的概率密度模型,然后利用该模型进行推理预测。 样本无限大或尽可能大的要求是常识。 该方法借鉴了统计力学和贝叶斯理论。

HMM直接对转移概率和表型概率进行建模,计算共现概率。 因此,它是一个生成模型。

b) 判别模型:有限样本>判别函数=判别模型>预测

如果你在条件概率 P(m|o) 上建模,它就是判别模型。 其基本思想是以有限样本建立判别函数,不考虑样本的生成模型,直接研究预测模型。 其代表理论是统计学习理论。

CRF是一种判别模型。 MEMM 不是生成模型,而是基于状态分类的具有有限状态的模型。

2.拓扑结构

HMM和MEMM是有向图,而CRF是无向图。

3.全局最优或局部最优

HMM直接对转移概率和表型概率进行建模,计算共现概率。

MEMM 基于转移概率和表型概率建立共现概率。 它计算条件概率,只采用局部方差归一化,容易陷入局部最优。

CRF 在全局范围内计算归一化概率,而不是像 MEMM 那样在局部范围内计算。 它是一个最优的全局解决方案,解决了 MEMM 中的标签偏差问题。

4.CRF的优点和缺点

(1)优点

与HMM相比:由于CRF没有HMM那样严格的独立性假设,它可以容纳任何上下文信息。 其功能设计灵活(与ME相同)。

与MEMM相比:由于CRF计算的是全局最优输出节点的条件概率,因此克服了MEMM中label bias的弊端。

与ME相比:CRF计算的是在有待标记的观察序列时,整个标记序列的联合概率分布,而不是定义给定当前状态条件下下一个状态的状态分布。

(2)缺点

CRF 在算法的训练阶段具有高度的计算复杂性。 当更新的数据可用时,很难重新训练模型。

结论

这篇博客详细介绍了隐马尔可夫模型 (HMM)、最大熵马尔可夫模型 (MEMM) 和条件随机场 (CRF) 之间的比较分析。 在这篇文章中,我们明确了解到 CRF 和 MEMMS 主要是判别序列模型,而 HMM 主要是生成序列模型。 贝叶斯规则构成了 HMM 的基础。 相反,CRF 和 MEMM 基于过渡和可观察特征的 MaxEnt 模型。

本文链接地址:https://www.jiuchutong.com/zhishi/297679.html 转载请保留说明!

上一篇:【JavaScript】手撕前端面试题:对象参数浅拷贝 | 简易深拷贝 | 完整深拷贝(javascript手机版)

下一篇:【Python】ttkbootstrap的介绍与使用(/t python)

  • 小米10开发者选项在哪(小米10开发者选项最佳设置)

    小米10开发者选项在哪(小米10开发者选项最佳设置)

  • iphone11的无线充电功率(苹果11系列无线充电)

    iphone11的无线充电功率(苹果11系列无线充电)

  • 华硕b450m pro和plus的区别(华硕b450m pro和pro s)

    华硕b450m pro和plus的区别(华硕b450m pro和pro s)

  • 网转是什么意思(网转账是什么意思)

    网转是什么意思(网转账是什么意思)

  • 快手作品评论不显示了(快手作品评论不让别人看怎么设置)

    快手作品评论不显示了(快手作品评论不让别人看怎么设置)

  • 苹果手机录屏之后在哪里找视频(苹果手机录屏之后在哪里找)

    苹果手机录屏之后在哪里找视频(苹果手机录屏之后在哪里找)

  • vulkanrt是什么软件呀(vulkan是什么下载)

    vulkanrt是什么软件呀(vulkan是什么下载)

  • 腾讯会议突然没有声音(腾讯会议突然没声音怎么回事电脑)

    腾讯会议突然没有声音(腾讯会议突然没声音怎么回事电脑)

  • oppo手机gps在哪里打开(oppo手机的gps定位在哪个里面找)

    oppo手机gps在哪里打开(oppo手机的gps定位在哪个里面找)

  • 手机号码可以异地注销吗(手机号码可以异地注销吗移动)

    手机号码可以异地注销吗(手机号码可以异地注销吗移动)

  • pacm00是什么手机(下一页p20)

    pacm00是什么手机(下一页p20)

  • recycler文件夹是什么(recycle文件夹什么意思)

    recycler文件夹是什么(recycle文件夹什么意思)

  • 手机用就发烫一般是哪里的问题(手机用就发烫一下正常吗)

    手机用就发烫一般是哪里的问题(手机用就发烫一下正常吗)

  • 未连接一个windows是什么意思(未连接一个windows怎么办)

    未连接一个windows是什么意思(未连接一个windows怎么办)

  • 抖音录的视频没编辑完去哪找(抖音录的视频没有声音怎么回事)

    抖音录的视频没编辑完去哪找(抖音录的视频没有声音怎么回事)

  • 荣耀10性能模式是什么(荣耀10性能模式怎么设置)

    荣耀10性能模式是什么(荣耀10性能模式怎么设置)

  • 拼多多id在哪看本人的(拼多多id在哪看出来)

    拼多多id在哪看本人的(拼多多id在哪看出来)

  • 手机数据开不了怎么办(苹果手机数据开着上不了网)

    手机数据开不了怎么办(苹果手机数据开着上不了网)

  • iphone11用不用贴膜(iphone11需不需要贴膜)

    iphone11用不用贴膜(iphone11需不需要贴膜)

  • oppo怎么连接小爱同学(oppo怎么连接小米手环)

    oppo怎么连接小爱同学(oppo怎么连接小米手环)

  • iphone xr能无线充电吗(苹果xr能用无线充电器)

    iphone xr能无线充电吗(苹果xr能用无线充电器)

  • 华为荣耀20怎么改时间(华为荣耀20怎么设置返回键和主键)

    华为荣耀20怎么改时间(华为荣耀20怎么设置返回键和主键)

  • 小米蓝牙耳机充不进去电怎么办(小米蓝牙耳机充电)

    小米蓝牙耳机充不进去电怎么办(小米蓝牙耳机充电)

  • vivoz3x怎么弄返回键(vivoz3i怎么有返回键)

    vivoz3x怎么弄返回键(vivoz3i怎么有返回键)

  • cad套坐标最简单方法(cad套坐标步骤视频)

    cad套坐标最简单方法(cad套坐标步骤视频)

  • 主板上两个m2插哪一个(主板上两个m2插哪个孔)

    主板上两个m2插哪一个(主板上两个m2插哪个孔)

  • 显示器最高多少hz(显示器最高多少赫兹)

    显示器最高多少hz(显示器最高多少赫兹)

  • 营业税是什么意思 视频
  • 市政道路工程建筑包括什么
  • 新企业会计准则2021
  • 应收保险公司赔款计入
  • 净营业周期和营业周期
  • 农业技术服务个人总结
  • 社会团体所涉及的法律
  • 驾驶员行车补贴开什么发票
  • 医院增值税免税性质代码是什么
  • 个体户免费发票怎么领
  • 实收资本未到位情况说明
  • 单位和职工个人缴费基数如何确定的规定
  • 哪些税金不得在借方增加
  • 房产评估费会计分录
  • 应交税费未交增值税借方余额表示什么
  • 合作经营利润分配税务处理
  • 安全费用支出范围包括
  • 超过一年的保证金怎么交个税
  • 免租金政策
  • 小规模纳税人开专票税率是1%还是3%
  • 以后年度继续扣除广告宣传费,要怎么写分录?
  • 预收账款怎么冲减应收账款
  • 主营业务成本结转方法
  • 企业购买的土地计入无形资产
  • 耗材会计分录做账怎么做
  • 小规模纳税人收到增值税专用发票怎么办
  • 汇算清缴补缴税款分录小企业会计
  • 硬盘损坏类型
  • 在win7系统中如何让电脑恢复出厂设置方法
  • 应交税费贷方余额负数表示什么
  • 暂估人工成本分录怎么写
  • Win11截图工具怎么设置快捷键
  • php数组函数输出《咏雪》里有多少"片"字
  • 小规模纳税人免征增值税的账务处理
  • 支付宝消费计入什么科目
  • 销售返利计入什么费用
  • 提前预支工资怎么报税
  • win10右键个性化显示该文件
  • 免抵退税务处理
  • ant design vue vue3
  • 委托加工的加工费是含税的吗
  • php的了解
  • win11电源高性能模式代码
  • yolov3 改进
  • vscode搭建vue项目
  • 汇编语言a命令怎么用
  • 支付临时工工资,需要个税申报吗
  • 帝国cms使用手册
  • 2022年最新办公用房标准
  • mysql的密码忘了
  • 合并报表中的抵消分录是什么意思?
  • 摊余成本通俗易懂
  • 隔月发票退回是怎么回事
  • 多交增值税退税抵欠怎么处理
  • 房租预付款会计分录
  • 增值税申报表中期初未缴税额指什么
  • 租赁房产税计税依据及计算方式是什么
  • 建安行业外地预审要多久
  • 发放奖金怎么做账
  • 资产减值损失属于损益类的收入还是费用
  • 印花税申报流程视频
  • 主营业务收入和库存商品怎么区分
  • centos7怎么配置yum源
  • windows xp安装win32程序
  • win8开机启动
  • 苹果mac与平板的区别
  • centos7 lo
  • bd是什么文件
  • Win10系统如何利用360压缩软件解决打不开RAR压缩包的问题
  • redhat本地yum配置的基本步骤
  • linux的含义
  • win8命令提示符怎么运行命令
  • win8.1如何设置
  • win10 rs3
  • nodejs怎么学
  • linux系统如何搜索文件内容
  • js制作网站
  • 东莞市国家税务局网上办税大厅
  • 国税系统升级后怎么添加办税人
  • 税务人的形象
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设