位置: IT常识 - 正文

Python统计学11——分位数回归(python 统计学包)

编辑:rootadmin
Python统计学11——分位数回归

推荐整理分享Python统计学11——分位数回归(python 统计学包),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:python中的统计函数,python基本统计值计算解析,python 统计学,python 统计学包,python统计图教程,python中的统计函数,用python动手学统计学,python 统计学,内容如对您有帮助,希望把文章链接给更多的朋友!

分位数回归也是数理统计里面经典的模型,他相对于在最小二乘模型上进行了改进,虽然本身还是线性的参数模型,但对损失函数进行了改进。我们都知道最小二乘的损失函数是均方误差最小,分位数的损失函数是:

可以看到分位数损失函数会对高估的值和低估的值给予一个不同的权重,这样就可以做到‘’分位‘’。

该模型对于存在异方差的数据有很好的的效果。能准确计算出5%~95%的置信区间

具体看代码理解:

导入包,加载自带的案例数据

import numpy as npimport pandas as pdimport statsmodels.api as smimport statsmodels.formula.api as smfimport matplotlib.pyplot as pltdata = sm.datasets.engel.load_pandas().datadata.head()

 

 X是收入,y是食物支出,很经典的发散数据,因为不同收入区间的家庭的食物支出比例不一样,随着X增大,Y的波动也增大。存在异方差。

q=0.5时候的分位数回归

mod = smf.quantreg("foodexp ~ income", data)res = mod.fit(q=0.5)print(res.summary())

Python统计学11——分位数回归(python 统计学包)

 当q不一样是回归出来的系数是不一样的。我们计算0.05,0.15,0.25.....0.95分位数出来的回归系数,还有最小二乘的回归系数。

quantiles = np.arange(0.05, 0.96, 0.1)def fit_model(q): res = mod.fit(q=q) return [q, res.params["Intercept"], res.params["income"]] + res.conf_int().loc["income"].tolist()models = [fit_model(x) for x in quantiles]models = pd.DataFrame(models, columns=["q", "a", "b", "lb", "ub"])ols = smf.ols("foodexp ~ income", data).fit()ols_ci = ols.conf_int().loc["income"].tolist()ols = dict(a=ols.params["Intercept"], b=ols.params["income"], lb=ols_ci[0], ub=ols_ci[1])print(models)print(ols)

画图对比x = np.arange(data.income.min(), data.income.max(), 50)get_y = lambda a, b: a + b * xfig, ax = plt.subplots(figsize=(6, 4))for i in range(models.shape[0]): y = get_y(models.a[i], models.b[i]) ax.plot(x, y, linestyle="dotted", color="grey")y = get_y(ols["a"], ols["b"])ax.plot(x, y, color="red", label="OLS")ax.scatter(data.income, data.foodexp, alpha=0.2)ax.set_xlim((200, 3000))ax.set_ylim((200, 2000))legend = ax.legend()ax.set_xlabel("Income", fontsize=16)ax.set_ylabel("Food expenditure", fontsize=16)

 透明蓝色散点为样本点。蓝色虚线为不同分位数上的回归方程。

可以看出的几个结论:

'''粮食支出随着收入的增加而增加

粮食支出的分散度随着收入的增加而增加

最小二乘估计值与低收入观测值的拟合度相当差(即OLS线越过大多数低收入家庭)'''

而且5%~95%的回归方程区间涵盖了所有的真实样本点,置信区间很准确。

 画出回归系数随着分位数的变化图

n = models.shape[0]plt.plot(models.q, models.b, color="black", label="Quantile Reg.")plt.plot(models.q, models.ub, linestyle="dotted", color="black")plt.plot(models.q, models.lb, linestyle="dotted", color="black")plt.plot(models.q, [ols["b"]] * n, color="red", label="OLS")plt.plot(models.q, [ols["lb"]] * n, linestyle="dotted", color="red")plt.plot(models.q, [ols["ub"]] * n, linestyle="dotted", color="red")plt.ylabel(r"$\beta_{income}$")plt.xlabel("Quantiles of the conditional food expenditure distribution")plt.legend()plt.show()

 

#上图画出了回归系数随着分位数的变化而变化,OLS系数是恒定的,分位数回归的系数随着分位数变大而变大

#在大多数情况下,分位数回归点估计值位于OLS置信区间之外,这表明收入对食品支出的影响在整个分布区间内可能不是恒定的

本文链接地址:https://www.jiuchutong.com/zhishi/299819.html 转载请保留说明!

上一篇:前端项目性能优化方案有哪些(前端项目性能优势怎么写)

下一篇:第四季新星计划即将开启,博客之星取消拉票你怎么看?(新星计划片头好可爱啊)

  • 撤销增值税申报流程
  • 一般纳税人的认定时间
  • 哪些东西要征收消费税
  • 耕地占用税退税政策
  • 个人所得税手续费奖励是否交个税
  • 六种无形资产有什么
  • 农民工工资专户管理暂行办法
  • 单独计价作为固定资产入账的土地为什么不计提折旧
  • 融资租赁设备增值税怎样抵扣
  • 车辆报废补贴多久到账
  • 电梯安装费支付方式
  • 预提费用 会计准则
  • 结算本月应付职工薪酬,其中生产工人工资为18000
  • 衍生金融资产的核算
  • 企业所得税成本确认原则
  • 开进来的发票冲红怎么处理?
  • 税负原则
  • 营改增实施过程中的难点
  • 建筑业简易计税分包差额申报
  • 印花税计入股票成本吗
  • 资本公积可以怎么处理掉
  • 质押贷款属于什么贷款
  • 企业出售已使用过的固定资产税率
  • 失业保险退保怎么返
  • 房地产企业预付账款为负数
  • 过桥过闸 增值税
  • linux虚拟机在哪里输入命令
  • 成本核算的一般步骤
  • 公司收到发票怎么做账
  • phpunicode
  • 转让土地使用权的条件是什么
  • 房屋租金应缴纳多少
  • 若依名字的含义是什么意思
  • phpinfo页面
  • 期末增值税结转账务处理
  • 持有待售资产是流动还是非流动
  • vue3响应式对象数组
  • oc底层原理
  • php简单检测网址是什么
  • 记账凭证的主要作用有
  • 发票边缘有孔的可以撕掉吗
  • 应交增值税一般是多少
  • 什么叫做关税完税证明呢
  • 应收账款收不回来
  • mongodb聚合统计数量
  • 个人所得税年底退税 可以退多少
  • 商誉在资产负债表中如何体现
  • 维修费发票应必须开具吗
  • 金蝶专业版仓库管理怎么结账
  • sqlserver并发怎么处理
  • mysql常用命令有哪些
  • 注册资本在十年后怎么办
  • 公司与个人可以合伙吗
  • 积分换物品是真的吗
  • 社保应该如何缴纳
  • 申报抵扣
  • 企业解散清算程序
  • 同一客户有应收应付可以相互抵消吗
  • 融资开票是什么意思
  • 汇算清缴工资调减怎么做账
  • 专票的发票金额是价税总额吗
  • 外汇申报填写什么最简单
  • 工商银行代收是什么意思
  • 新注册公司工商如何做印章确认
  • fedora os
  • win7系统分辨率调错了黑屏
  • windows10预览
  • 常用的linux发行版本有哪些
  • cocos2dx4.0教程
  • 图像unit8
  • jq获取单选框的值
  • 全面解析日本失去的十年
  • python中deque
  • unity的shader在哪儿
  • animate怎么整个图层移动
  • 江苏国税电子税局
  • 进口肉的税率是多少
  • 河南商丘联通宽带最低多少钱
  • 北京税务局公众平台官网
  • 税务系统个人业务自传
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设