位置: IT常识 - 正文

学习笔记:统计建模方法的比较分析(统计 α)

编辑:rootadmin
学习笔记:统计建模方法的比较分析 前言

推荐整理分享学习笔记:统计建模方法的比较分析(统计 α),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:统计烦吗,统计itt,统计tli,统计 ci,统计 ci,【统计 】,统计 α,统计 α,内容如对您有帮助,希望把文章链接给更多的朋友!

本文介绍了隐马尔可夫模型 (HMM)、最大熵马尔可夫模型 (MEMM) 和条件随机场 (CRF) 的比较分析。 HMM、MEMM 和 CRF 是三种流行的统计建模方法,通常应用于模式识别和机器学习问题。 让我们更详细地探讨每种方法。

一、隐马尔可夫模型 (HMM)

“隐藏”一词象征着只有系统发布的符号是可观察的,而用户无法查看状态之间的底层随机游走。 该领域的许多人将 HMM 视为有限状态机。

HMM的优势

HMM 具有强大的统计基础和高效的学习算法,可以直接从原始序列数据中进行学习。 它允许以本地可学习方法的形式一致地处理插入和删除惩罚,并且可以处理可变长度的输入。 它们是序列概况最灵活的概括。 它还可以执行多种操作,包括多重对齐、数据挖掘和分类、结构分析和模式发现。 它也很容易组合到库中。

HMM 的缺点

HMM 仅依赖于每个状态及其对应的观察对象:

序列标注,除了与单个词有关系外,还与观察到的序列长度、词上下文等方面有关。

目标函数和预测的目标函数不匹配:HMM得到的是状态和观测序列的联合分布P(Y, X),而在估计问题上,我们需要一个条件概率P(Y|X)。

二、最大熵马尔可夫模型 (MEMM)

MEMM 考虑了相邻状态和整个观察序列之间的依赖关系,因此具有更好的表达能力。 MEMM不考虑P(X),减少建模工作量,学习目标函数与估计函数的一致性。

MEMM 标签偏差

在上图 中,状态 1 倾向于转换为状态 2,同时状态 2 倾向于停留在状态 2。

P(1-> 1-> 1-> 1)= 0.4 x 0.45 x 0.5 = 0.09, P(2->2->2->2)= 0.2 x 0.3 x 0.3 = 0.018,

P(1->2->1->2)= 0.6 x 0.2x 0.5 = 0.06,P(1->1->2->2)= 0.4 x 0.55 x 0.3 = 0.066。

然而,最佳状态转换路径是 1 > 1 > 1 > 1。 为什么?

这是因为 State 2 的可转换状态比 State 1 多,从而降低了转换概率——MEMM 倾向于选择可转换状态较少的状态。 这种选择被称为标签偏差问题。 CRF 很好地解决了标签偏差问题。

三、条件随机场(CRF 模型)

CRF 模型解决了标注偏差问题,消除了 HMM 中两个不合理的假设。 当然,模型也变得更复杂了。MEMM采用局部方差归一化,CRF采用全局方差归一化。另一方面,MEMM 无法找到满足以下分布的相应参数,但是 CRF 可以:

1.生成模型或判别模型学习笔记:统计建模方法的比较分析(统计 α)

假设 o 是观测值,m 是模型。

a) 生成模型:无限样本>概率密度模型=生成模型>预测

如果你对 P(o|m) 建模,它就是一个生成模型。 其基本思想是,首先建立样本的概率密度模型,然后利用该模型进行推理预测。 样本无限大或尽可能大的要求是常识。 该方法借鉴了统计力学和贝叶斯理论。

HMM直接对转移概率和表型概率进行建模,计算共现概率。 因此,它是一个生成模型。

b) 判别模型:有限样本>判别函数=判别模型>预测

如果你在条件概率 P(m|o) 上建模,它就是判别模型。 其基本思想是以有限样本建立判别函数,不考虑样本的生成模型,直接研究预测模型。 其代表理论是统计学习理论。

CRF是一种判别模型。 MEMM 不是生成模型,而是基于状态分类的具有有限状态的模型。

2.拓扑结构

HMM和MEMM是有向图,而CRF是无向图。

3.全局最优或局部最优

HMM直接对转移概率和表型概率进行建模,计算共现概率。

MEMM 基于转移概率和表型概率建立共现概率。 它计算条件概率,只采用局部方差归一化,容易陷入局部最优。

CRF 在全局范围内计算归一化概率,而不是像 MEMM 那样在局部范围内计算。 它是一个最优的全局解决方案,解决了 MEMM 中的标签偏差问题。

4.CRF的优点和缺点

(1)优点

与HMM相比:由于CRF没有HMM那样严格的独立性假设,它可以容纳任何上下文信息。 其功能设计灵活(与ME相同)。

与MEMM相比:由于CRF计算的是全局最优输出节点的条件概率,因此克服了MEMM中label bias的弊端。

与ME相比:CRF计算的是在有待标记的观察序列时,整个标记序列的联合概率分布,而不是定义给定当前状态条件下下一个状态的状态分布。

(2)缺点

CRF 在算法的训练阶段具有高度的计算复杂性。 当更新的数据可用时,很难重新训练模型。

结论

这篇博客详细介绍了隐马尔可夫模型 (HMM)、最大熵马尔可夫模型 (MEMM) 和条件随机场 (CRF) 之间的比较分析。 在这篇文章中,我们明确了解到 CRF 和 MEMMS 主要是判别序列模型,而 HMM 主要是生成序列模型。 贝叶斯规则构成了 HMM 的基础。 相反,CRF 和 MEMM 基于过渡和可观察特征的 MaxEnt 模型。

本文链接地址:https://www.jiuchutong.com/zhishi/297679.html 转载请保留说明!

上一篇:【JavaScript】手撕前端面试题:对象参数浅拷贝 | 简易深拷贝 | 完整深拷贝(javascript手机版)

下一篇:【Python】ttkbootstrap的介绍与使用(/t python)

  • 网店推广有哪些办法(网店推广有哪些新思维)

    网店推广有哪些办法(网店推广有哪些新思维)

  • 抖音蚂蚁呀嘿特效怎么做步骤(抖音蚂蚁呀嘿特效用什么软件)

    抖音蚂蚁呀嘿特效怎么做步骤(抖音蚂蚁呀嘿特效用什么软件)

  • mate30如何取消充电自动开机(华为mate30怎么关闭智能充电)

    mate30如何取消充电自动开机(华为mate30怎么关闭智能充电)

  • 索尼c310和c200区别(索尼c200和c300音质有区别吗)

    索尼c310和c200区别(索尼c200和c300音质有区别吗)

  • 苹果怎么把b站缓存的视频转为本地视频(苹果怎么把B站视频存到手机)

    苹果怎么把b站缓存的视频转为本地视频(苹果怎么把B站视频存到手机)

  • 抖音听歌识曲(抖音听歌识曲功能在哪)

    抖音听歌识曲(抖音听歌识曲功能在哪)

  • 什么是VNP?(什么是VNP)

    什么是VNP?(什么是VNP)

  • qq字符是什么意思(qq字符ciao什么意思)

    qq字符是什么意思(qq字符ciao什么意思)

  • 消息免打扰语音聊天还能响吗(消息免打扰语音视频还能响吗)

    消息免打扰语音聊天还能响吗(消息免打扰语音视频还能响吗)

  • jbl耳机左耳不响了(jbl c100tws左耳不出声)

    jbl耳机左耳不响了(jbl c100tws左耳不出声)

  • 联想80ww什么型号(联想 80ww)

    联想80ww什么型号(联想 80ww)

  • amd3600配什么显卡(amd3600配置推荐)

    amd3600配什么显卡(amd3600配置推荐)

  • 宽带电视能看,手机连接不上是什么情况(宽带电视能看中央台吗)

    宽带电视能看,手机连接不上是什么情况(宽带电视能看中央台吗)

  • 三星红卡和橙卡的区别(三星红卡还是黄卡)

    三星红卡和橙卡的区别(三星红卡还是黄卡)

  • 华为平板能插内存卡吗(华为平板插内存卡怎么使用)

    华为平板能插内存卡吗(华为平板插内存卡怎么使用)

  • 手机为什么会出现虚电(手机为什么会出现安全模式)

    手机为什么会出现虚电(手机为什么会出现安全模式)

  • 微信发照片icloud同步中什么意思(微信发照片怎样把几张照片一起发)

    微信发照片icloud同步中什么意思(微信发照片怎样把几张照片一起发)

  • 小米手环4充满要多久(小米手环4充满电会提示吗)

    小米手环4充满要多久(小米手环4充满电会提示吗)

  • 黑鲨手机怎么隐藏视频(黑鲨手机怎么隐藏app图标)

    黑鲨手机怎么隐藏视频(黑鲨手机怎么隐藏app图标)

  • 魅族隐私政策怎么回事(魅族隐私政策怎么打开)

    魅族隐私政策怎么回事(魅族隐私政策怎么打开)

  • 荣耀手环3连不上手机(荣耀手环连不上蓝牙)

    荣耀手环3连不上手机(荣耀手环连不上蓝牙)

  • 三星note10没有耳机孔怎么听歌(三星note10耳机插上去没反应)

    三星note10没有耳机孔怎么听歌(三星note10耳机插上去没反应)

  • 手机时间怎么改成横向(荣耀手机时间怎么改)

    手机时间怎么改成横向(荣耀手机时间怎么改)

  • 无权拨打该号码是什么意思(无权拨打该号码是警察的号码)

    无权拨打该号码是什么意思(无权拨打该号码是警察的号码)

  • realmex和青春版的区别(realmex青春版realmex对比)

    realmex和青春版的区别(realmex青春版realmex对比)

  • 快手分怎么算(快手分怎么算人民币)

    快手分怎么算(快手分怎么算人民币)

  • win10自带截图软件(win10自带截图软件不能用)

    win10自带截图软件(win10自带截图软件不能用)

  • 怎么修改手机分辨率(怎么修改手机分手密码)

    怎么修改手机分辨率(怎么修改手机分手密码)

  • 出口退税无纸化备案
  • 增值税专用发票和普通发票的区别
  • 拍卖行如何征税呢
  • 城建税计税依据扣除增值税期末留抵
  • 出口报关单怎么做会计凭证
  • 融资租赁购入固定资产的融资费用如何扣除
  • 小规模纳税人免征增值税政策
  • 农业种植需要缴税吗
  • 非专利技术转让计入什么科目
  • 发票复印件盖公章
  • 会计核算原则主要包括
  • 出口企业享受增值税优惠政策
  • 图书发票没有明细能报销吗?
  • 企业允许加计扣除的研发费用主要包括哪些?
  • 2020年外资企业
  • 企业所得税季度预缴
  • 水电开发潜力
  • 公司开业期间的费用入管理费用其他行吗
  • 软件企业研发费用占比要求
  • 电费的税费计入什么会计科目
  • 升级设备属于什么科目
  • 单位收到社保补贴会计怎样处理
  • 以前年度多计提了税金怎么办
  • 行政事业单位往来票据使用范围
  • 人力资源管理师考试时间
  • 鸿蒙系统怎么快速充电
  • macbookpro如何检测
  • 进口货物怎样报关
  • php循环语句
  • php的array_multisort()使用方法介绍
  • 集团公司对子公司如何进行资金管理
  • 落枕怎么办怎么治疗
  • members-area.exe是什么进程 members-area进程查询
  • 长期待摊费用与预付账款的区别
  • kali linux如何使用
  • react.strictmode
  • 专家坐诊信息
  • 2023年会出什么车
  • 利用php抓取蜘蛛网
  • 应收利息的罚息是复利吗
  • 国税退税要多久能到账
  • 已经认证了的专利怎么办
  • 新公司筹建期要做账吗
  • 支付宝付款对面知道名字吗
  • 小企业长期债券投资入账价值
  • 出售无形资产科目
  • 企业保持存货的必要性
  • 股权投资所得是什么
  • 其他应收款收不回来怎么写情况说明
  • 企业会计人员审计程序
  • 企业清算未分配利润怎么交税
  • 销售赠品的会计分录
  • 自营工程的账务处理
  • 以物易物有什么好处
  • 房屋租赁的注意问题
  • 购入一辆运输汽车,价值5.6万元,款项尚未支付
  • 哪个行业的会计最难
  • sqlserver数据库备份
  • windows10秋季创意者更新
  • win7系统如何提升性能
  • linux系统主要用途
  • linux tee命令详解
  • win7切换输入法不见了怎么弄出来
  • win10系统中怎么安装安卓应用
  • linux系统怎么弄
  • 浅析Javascript ES6中的原生Promise
  • NGUI学习笔记(摘)
  • 快速备份mysql数据库
  • jQuery同步提交示例代码
  • 折中查找偶数怎么办
  • &&在js中
  • js基于什么
  • 有哪些推荐阅读的书
  • 税率是从什么时候有17%改为13%的呢
  • 青岛市市南区税务局第一税务所
  • 个体户增值税申报比对不符怎么处理
  • 电池涂料消费税问题
  • 博兴公安局局长
  • 建设工程造价咨询合同需要交印花税吗
  • 税务筹划怎么样
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设