位置: IT常识 - 正文

因果推断1--基本方法介绍(个人笔记)(因果推断的常用标准)

编辑:rootadmin
因果推断1--基本方法介绍(个人笔记)

目录

一、因果推断介绍

1.1 什么是因果推断

1.2为什么研究因果推断

1.3因果推断阶梯

1.4因果推断问题分类

二、因果推断理论框架

2.1 定义(这些定义后面会经常用到)

2.2 Assumptions(三大基本假设)

三、因果效应估计

3.1 因果效应问题定义

3.2 消除偏差方法

3.2.1 倾向性得分匹配

3.2.2 双重机器学习

 3.2.3 双重稳健学习

3.3估计因果效应

四、待补充


一、因果推断介绍1.1 什么是因果推断因果推断是基于统计学方法刻画变量之间的因果关系。参考:关于因果推断你知道多少:关于因果推断你知道多少1.2为什么研究因果推断机器学习预测未来,因果推断改变未来。1.3因果推断阶梯第一层级(关联):从数据中观察到哪些相关规律?是对历史数据的总结。第二层级(干预):如果采取某个行动,会产生什么结果?是面向未来的推测。第三层级(反事实):如果当时采取了另外一个行动,结果会是怎样?是面向过去的反思。1.4因果推断问题分类

推荐整理分享因果推断1--基本方法介绍(个人笔记)(因果推断的常用标准),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:因果推断中必不可少的条件,因果推断算法,因果推断算法,因果推断入门,因果推断的作用,因果推断入门,因果推断的作用,因果推断的基本原则,内容如对您有帮助,希望把文章链接给更多的朋友!

因果推断1--基本方法介绍(个人笔记)(因果推断的常用标准)

因果推断解决的问题可以分成两类:

因果关系发现(Causal Discovery):从数据中发掘哪些变量之间存在因果关系,谁是因、谁是果。因果效应评估(Causal Effect Estimatation):评估一个变量变化后能多大程度影响另外一个变量。二、因果推断理论框架

        为形式化地定义和研究因果推断,多种理论框架被建立,其中最著名的是潜在结果框架(Potential Outcome Framework)和结构因果模型(Structural Causal Model,简称SCM),前者由Donald Rubin提出,所以也被称为Rubin Causal Model(简称RCM)。

2.1 定义(这些定义后面会经常用到)unit:因果推断里最小的物理单元,比如一个人treatment:施加给unit的动作,比如吃药。一般用W表示,比如W=1表示吃药,W=0表示不吃药outcome:某个unit在某个treatment下的表现,比如吃药之后好了还是没好。一般用Y表示,Y(W=1)表示这个人在吃药后的表现,如果Y=1表示病好了,则Y(W=1)=1的含义是这个人吃药之后病好了。同理,Y(W=1)=0表示这个人吃药之后病没有好observed outcome:unit在实际的treatment下的表现,这个人实际上是吃了这个药的potential outcome:unit在潜在的treatment下的表现,比如这个人没有吃药,但是如果吃药了,其表现就是potential outcometreatment effect:施加了treatment后的增量效果(or 增益),比如吃药之后相比于没有吃药,其治愈率提升了多少,其存在如下3个维度:Average Treatment Effect (ATE) ,整个群体的因果效应 :ATE = E[Y(W=1)] - E[T(W=0)],所有人的平均treatment effectConditional Average Treatment Effect (CATE),条件平均因果效应:CATE = E[Y(W = 1)|X = x] − E[Y(W = 0)|X = x],在特征X=x的子人群里面treatment effect,X为筛选个体的特征值,也被称为协变量。Individual Treatment Effect (ITE),个体因果效应:ITEi = Yi (W = 1) − Yi (W = 0),某个unit(人维度)的treatment effect数据格式:是这样的三元组,<X,W,Y>,X是特征,W是施加的treatment,Y是outcome参考:2020年因果推断综述《A Survey on Causal Inference》 - 知乎2.2 Assumptions(三大基本假设)1、Stable Unit Treatment Value Assumption (SUTVA):The potential outcomes for any unit do not vary with the treatment assigned to other units, and, for each unit, there are no different forms or versions of each treatment level, which lead to different potential outcomes.每个人对各个treatment的outcome是固定,不会被其他人影响,人和人之间是独立的一个treatment只有一个版本,比如某个药物,在不同的剂量下,则对应不同的treatment2、Ignorability: Given the background variable, X , treatment assignment W is independent to the potential outcomes, i.e:如果两个人的特征X相同,则他们的potential outcome(即Y(W=0)、Y(W=1))是相同的,不论在哪种的treatment下,即outcome和treatment独立具有相同特征X的人群,每个人接受到哪种treatment是完全随机的,概率都相同不存在某个在X之外的隐变量,同时影响outcome和treatment,使得treatment和outcome相关,因此这个假设又称unconfoundedness assumption3、Positivity:For any value of X , treatment assignment is not deterministic: P(W = w |X = x) > 0, ∀ w and x .即对于某个特征X下的人群,每个人都有概率被施加任何treatment,并且人群中存在所有的treatment上述假设只是让我们预估treatment effect能更准确一些,但是由于存在反事实的问题,导致没有ground truth,因此预估值不一定准确。如何预估潜在的treatment effect始终是因果推断的核心问题。三、因果效应估计3.1 因果效应问题定义        因果推断里将采取动作称为施加干预(Treatment),而因果效应为施加干预与否对结果造成的差异。注意,如果想准确衡量差异,需保证其他因素不变而只有“施加干预与否”这个变化。最好的情形应该是:存在两个平行时空,分别施加和未施加干预得到两个结果,两个结果的差异就是干预产生的因果效应。        事实上不存在平行时空,我们不能同时对一个群体既施加干预又不施加干预,而只能观察到其中的一种情况,对于未观察的情况我们称之为反事实的(Counterfactual)。理论上,可以通过随机控制实验(Random Control Trial,RCT)来解决这个问题:将群体随机分成两组,一组施加干预(实验组),另一组不施加干预(控制组/对照组)。这种方法称为实验性研究,广泛应用的AB实验方法其实就是同样的思路。        不过,实验组和控制组之间往往很难实现完全随机,导致两组之间会存在天然差异,即偏差(Bias)。另外,很多时候无法进行随机控制实验,这时只能基于现有观察到的数据,采取一定方法从中筛选出“实验组”和“控制组”,这称为观察性研究或者准实验方法,此时的“实验组”和“控制组”更容易出现偏差。        导致偏差的原因包括:(1)混杂偏差:同时对Treatment和结果有影响的因素叫混杂因子(Confounder),它的存在会导致偏差。消除混杂偏差的方法是将混杂因子控制住,再去度量Treatment和结果的关系。比如在研究“就诊频率与寿命的影响”时,身体状况会同时影响就诊频率和寿命,它就是个混杂因子,如果不消除其影响,就会产生“去医院不利于身体健康”的谬论。        如果针对相同身体状况的人群(即控制住“身体状况”这个因子)对比不同就诊频率下寿命的差异,就能去除偏差。(2)选择偏差:不管是实验性研究还是观察性研究,评估通常都是在一个筛选出来的样本子集上进行,如果样本子集不能代表总体,则会导致选择偏差(或称样本偏差)。比如在研究“就诊频率与寿命的影响”时,为了控制身体状况这个混杂因子,我们筛选特定年龄50岁、身高175CM、体重70KG、血压120/80mmHg、心率80次/分的人群对比不同就诊频率下的寿命,此时得到的结论适用于人群总体时会有选择偏差。        因此,偏差是让从数据中的得到相关性不能推导出因果性的主要原因。3.2 消除偏差方法        当Treatment T和Outcome Y受共同的因素X影响时,就会发生混淆偏差。为去除偏差,需要控制住X,使得实验组和控制组的特征X分布一致,此时的Treatment独立于Y,满足无混淆假设,之后就可以正确地估计因果效应。去除混淆偏差的方法包括:3.2.1 倾向性得分匹配Propensity Score Matching,PSM。方法:首先通过X预测T,得到一个条件概率P(T|X),也称之为倾向性得分(Propensity Score, PS),之后基于PS得分进行匹配,对于实验组的每一个样本,在对照组找到与之匹配(即二者相似)的一个样本,组成一个样本对,最后基于所有的样本对进行因果建模。原理:理解了倾向性得分后,PSM也就是基于PS得分进行匹配,即对于实验组的每一个样本,在对照组找到与之匹配(即二者相似)的一个样本,组成一个样本对,最后基于所有的样本对进行因果建模,以达到控制混淆的目的。根据匹配方式的不同,PSM有两种方法:距离和权重。优点:原理简单,容易理解。倾向性得分可以使用任意ML模型。缺点:需要对PS得分过小或者PS得分过大的样本进行处理。应用场景:适用于二值或者离散Treatment场景疑问:X预测T,在实验组训练还是在实验组和对照组一起训练?3.2.2 双重机器学习

Double Machine Learning, DML。

方法:首先通过X预测T,与真实的T作差,得到一个T的残差,然后通过X预测Y,与真实的Y作差,得到一个Y的残差,预测模型可以是任何ML模型,最后基于T的残差和Y的残差进行因果建模。原理:DML采用了一种残差回归的思想。优点:原理简单,容易理解。预测阶段可以使用任意ML模型。缺点:需要因果效应为线性的假设。应用场景:适用于连续Treatment且因果效应为线性场景 3.2.3 双重稳健学习

Doubly Robust Learning, DRL。

方法:首先通过X预测T,得到一个倾向性得分P(X),然后通过(X,T)预测Y,预测模型可以是任何ML模型,最后基于X和预测的Y进行因果建模。原理:DML采用了一种残差回归的思想。优点:只需倾向性得分预测模型和目标值预测模型的其中一个预测准确即可,预测阶段可以使用任意ML模型。缺点:当两个模型都表现不佳时,误差会变大。应用场景:适用于离散Treatment场景。3.3估计因果效应

四、待补充因果效应估计方法介绍 因果效应评估方式因果效应估计方法代码实现因果森林分裂方式具体应用/运筹优化相关论文学习
本文链接地址:https://www.jiuchutong.com/zhishi/299477.html 转载请保留说明!

上一篇:【原生Ajax】全面了解xhr的概念与使用。(原生ajax和axios的区别)

下一篇:手把手教你基于HTML、CSS搭建我的相册(下)(基于什么意思)

  • iqoo neo5有红外遥控功能吗(iqooneo5支持红外遥控吗)

    iqoo neo5有红外遥控功能吗(iqooneo5支持红外遥控吗)

  • 荣耀30pro有无线充电功能吗(荣耀30pro无线充电怎么打开)

    荣耀30pro有无线充电功能吗(荣耀30pro无线充电怎么打开)

  • 抖音移除粉丝后会取消对方对我的关注吗(抖音移除粉丝后怎么恢复粉丝)

    抖音移除粉丝后会取消对方对我的关注吗(抖音移除粉丝后怎么恢复粉丝)

  • 手机不支持64位应用怎么办

    手机不支持64位应用怎么办

  • 淘宝禁止下单七天(淘宝账号禁止下单解除)

    淘宝禁止下单七天(淘宝账号禁止下单解除)

  • 配对后蓝牙耳机没有声音为什么(配对后蓝牙耳机怎么配对)

    配对后蓝牙耳机没有声音为什么(配对后蓝牙耳机怎么配对)

  • 七天无理由退款理由要运费吗(七天无理由退款会不会影响信誉)

    七天无理由退款理由要运费吗(七天无理由退款会不会影响信誉)

  • 鼠标电池能用多长时间(鼠标电池用多久没电)

    鼠标电池能用多长时间(鼠标电池用多久没电)

  • vivoz1和z1i的区别(vivoz1和z1x的区别)

    vivoz1和z1i的区别(vivoz1和z1x的区别)

  • qq文件接收会有提示吗(qq文件接收会有提醒吗)

    qq文件接收会有提示吗(qq文件接收会有提醒吗)

  • 华为手机如何找回删除的照片(华为手机如何找回卸载的软件)

    华为手机如何找回删除的照片(华为手机如何找回卸载的软件)

  • 8p跑分多少算正常

    8p跑分多少算正常

  • 听筒模式是干嘛用的

    听筒模式是干嘛用的

  • 充电宝总是自动断电(充电宝总是自动关机)

    充电宝总是自动断电(充电宝总是自动关机)

  • 微信不能用流量上网是什么问题(微信不能用流量上网,怎么设置)

    微信不能用流量上网是什么问题(微信不能用流量上网,怎么设置)

  • ppt中的首行缩进在哪(ppt中的首行缩进在哪里)

    ppt中的首行缩进在哪(ppt中的首行缩进在哪里)

  • ai可以转成psd格式吗(ai转换成psd格式)

    ai可以转成psd格式吗(ai转换成psd格式)

  • 华为手机四个摄像头是什么型号(华为手机四个摄像头手机有哪几款)

    华为手机四个摄像头是什么型号(华为手机四个摄像头手机有哪几款)

  • 戴尔怎么u盘装系统(戴尔电脑如何用u盘安装启动电脑)

    戴尔怎么u盘装系统(戴尔电脑如何用u盘安装启动电脑)

  • 手机hd怎么开(手机hd怎么开启)

    手机hd怎么开(手机hd怎么开启)

  • 电脑1080p是什么意思(电脑1080i)

    电脑1080p是什么意思(电脑1080i)

  • pr视频剪辑吃显卡吗(pr视频剪辑吃显卡还是cpu)

    pr视频剪辑吃显卡吗(pr视频剪辑吃显卡还是cpu)

  • 微信消息没有提示音怎么办(微信消息没有提示音也没震动,也没显示是怎么回事)

    微信消息没有提示音怎么办(微信消息没有提示音也没震动,也没显示是怎么回事)

  • 蓝牙和有线音质差别(蓝牙和有线音质有差别吗)

    蓝牙和有线音质差别(蓝牙和有线音质有差别吗)

  • 小米手机里的照片怎么转移到U盘(小米手机里的照片怎么导入新手机)

    小米手机里的照片怎么转移到U盘(小米手机里的照片怎么导入新手机)

  • 华为手机怎么截取长图(华为手机怎么截图长屏幕截图)

    华为手机怎么截取长图(华为手机怎么截图长屏幕截图)

  • 剪卡器怎么用(剪卡器卡住了怎么办)

    剪卡器怎么用(剪卡器卡住了怎么办)

  • ps卸载不干净无法安装(ps卸载没反应)

    ps卸载不干净无法安装(ps卸载没反应)

  • 前端周刊第十四期(前端日报)

    前端周刊第十四期(前端日报)

  • 石油税费是多少
  • 税务网上清卡流程
  • 所得税优惠政策最新2022
  • 收客户刷卡手续费时客户不愿意缴费,如何处理
  • 个体户季报网上怎么报税
  • 净资产包含哪些方面
  • 发票校验码被章盖住了
  • 会计凭证辅助项
  • 银行承兑汇票背书可以拆分
  • 企业卫生费是指什么
  • 个人所得税筹划节税
  • 装饰费是否计算缴纳土地增值税
  • 全年累积盈利交所得税吗?
  • 半成品成本核算 一般企业怎么核算
  • 以前年度损益调整科目怎么用
  • 银行收到理财资金怎么做账
  • 管理费用月末怎么结账
  • 利息算增值税吗
  • 增值税普通发票怎么开
  • 运输行业税负率一般控制在多少?
  • 差额征税怎么交税
  • 公司收到纸质承兑不开票行吗
  • 库存周转天数计算实例
  • 零申报的企业年末的利润表可以为零吗?
  • 资源税可能计入
  • 电信增值税发票怎么抵扣
  • 厂房装修费用计入制造费用吗
  • 设计服务交文化建设税吗
  • 少计提增值税0.01计入营业外
  • 员工给公司代垫的款项分录
  • 事业单位收入需要缴纳所得税吗
  • 广告费发票内容是什么
  • 收不回的应收账款分录
  • 一头公牛和一头母牛,答五个字
  • php采集系统
  • 政府会计制度下财务会计包含几要素
  • sap abap入门
  • uni-app ——使用uploadFile上传多张图片
  • springboot -d
  • 跨年发票可以作为税前扣除的时限
  • 企业的对公账户怎么办理
  • 企业的管理费用占比
  • 企业的固定资产因自然灾害产生的净损失计入
  • js中typeof用法
  • 新政府会计制度下,属于资产类科目的是
  • 可转债可以不卖吗
  • 一般纳税人可以转小规模纳税人吗
  • sqlserver2005属于
  • 农业发展公司有没有库存商品的
  • 利润减负债
  • 公司进项抵税
  • 公司年度汇算清缴费用多少
  • 什么是公允价值变动收益
  • 其他业务收入如何填写申报表
  • 置换房产流程
  • 收不回来的账怎么处理
  • 在建工程转长期待摊费用是什么意思
  • 递延收益的影响
  • 出口退税怎么回事
  • 企业支付的技术转让费计入管理费用吗
  • 民营企业固定资产管理规定
  • 多种不同的 MySQL 的 SSL 配置
  • centos7基本环境选哪个
  • Fedora 21顶栏日期显示不全的解决方法
  • 主板升级bios失败怎么办
  • windowsxp忘了登录密码
  • Linux操作系统软链接和硬链接的联系与区别
  • windows 10 mobile--移动版
  • win8系统远程桌面在哪里
  • android获取位置信息
  • vue插件使用
  • js获取时间精确到毫秒
  • 详细解读了
  • python操作数据库语句
  • javascript怎么写
  • jquery添加属性的方法
  • 国税新人什么时候入职
  • 应纳税额减征额账务处理
  • 税控盘开的电子票怎么发送给人
  • 税务总局转变税收征管方式
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设