位置: IT常识 - 正文

Python统计学11——分位数回归(python 统计学包)

编辑:rootadmin
Python统计学11——分位数回归

推荐整理分享Python统计学11——分位数回归(python 统计学包),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:python中的统计函数,python基本统计值计算解析,python 统计学,python 统计学包,python统计图教程,python中的统计函数,用python动手学统计学,python 统计学,内容如对您有帮助,希望把文章链接给更多的朋友!

分位数回归也是数理统计里面经典的模型,他相对于在最小二乘模型上进行了改进,虽然本身还是线性的参数模型,但对损失函数进行了改进。我们都知道最小二乘的损失函数是均方误差最小,分位数的损失函数是:

可以看到分位数损失函数会对高估的值和低估的值给予一个不同的权重,这样就可以做到‘’分位‘’。

该模型对于存在异方差的数据有很好的的效果。能准确计算出5%~95%的置信区间

具体看代码理解:

导入包,加载自带的案例数据

import numpy as npimport pandas as pdimport statsmodels.api as smimport statsmodels.formula.api as smfimport matplotlib.pyplot as pltdata = sm.datasets.engel.load_pandas().datadata.head()

 

 X是收入,y是食物支出,很经典的发散数据,因为不同收入区间的家庭的食物支出比例不一样,随着X增大,Y的波动也增大。存在异方差。

q=0.5时候的分位数回归

mod = smf.quantreg("foodexp ~ income", data)res = mod.fit(q=0.5)print(res.summary())

Python统计学11——分位数回归(python 统计学包)

 当q不一样是回归出来的系数是不一样的。我们计算0.05,0.15,0.25.....0.95分位数出来的回归系数,还有最小二乘的回归系数。

quantiles = np.arange(0.05, 0.96, 0.1)def fit_model(q): res = mod.fit(q=q) return [q, res.params["Intercept"], res.params["income"]] + res.conf_int().loc["income"].tolist()models = [fit_model(x) for x in quantiles]models = pd.DataFrame(models, columns=["q", "a", "b", "lb", "ub"])ols = smf.ols("foodexp ~ income", data).fit()ols_ci = ols.conf_int().loc["income"].tolist()ols = dict(a=ols.params["Intercept"], b=ols.params["income"], lb=ols_ci[0], ub=ols_ci[1])print(models)print(ols)

画图对比x = np.arange(data.income.min(), data.income.max(), 50)get_y = lambda a, b: a + b * xfig, ax = plt.subplots(figsize=(6, 4))for i in range(models.shape[0]): y = get_y(models.a[i], models.b[i]) ax.plot(x, y, linestyle="dotted", color="grey")y = get_y(ols["a"], ols["b"])ax.plot(x, y, color="red", label="OLS")ax.scatter(data.income, data.foodexp, alpha=0.2)ax.set_xlim((200, 3000))ax.set_ylim((200, 2000))legend = ax.legend()ax.set_xlabel("Income", fontsize=16)ax.set_ylabel("Food expenditure", fontsize=16)

 透明蓝色散点为样本点。蓝色虚线为不同分位数上的回归方程。

可以看出的几个结论:

'''粮食支出随着收入的增加而增加

粮食支出的分散度随着收入的增加而增加

最小二乘估计值与低收入观测值的拟合度相当差(即OLS线越过大多数低收入家庭)'''

而且5%~95%的回归方程区间涵盖了所有的真实样本点,置信区间很准确。

 画出回归系数随着分位数的变化图

n = models.shape[0]plt.plot(models.q, models.b, color="black", label="Quantile Reg.")plt.plot(models.q, models.ub, linestyle="dotted", color="black")plt.plot(models.q, models.lb, linestyle="dotted", color="black")plt.plot(models.q, [ols["b"]] * n, color="red", label="OLS")plt.plot(models.q, [ols["lb"]] * n, linestyle="dotted", color="red")plt.plot(models.q, [ols["ub"]] * n, linestyle="dotted", color="red")plt.ylabel(r"$\beta_{income}$")plt.xlabel("Quantiles of the conditional food expenditure distribution")plt.legend()plt.show()

 

#上图画出了回归系数随着分位数的变化而变化,OLS系数是恒定的,分位数回归的系数随着分位数变大而变大

#在大多数情况下,分位数回归点估计值位于OLS置信区间之外,这表明收入对食品支出的影响在整个分布区间内可能不是恒定的

本文链接地址:https://www.jiuchutong.com/zhishi/299819.html 转载请保留说明!

上一篇:前端项目性能优化方案有哪些(前端项目性能优势怎么写)

下一篇:第四季新星计划即将开启,博客之星取消拉票你怎么看?(新星计划片头好可爱啊)

  • iphone怎么群发短信(iphone手机怎么群发短信)

    iphone怎么群发短信(iphone手机怎么群发短信)

  • 华为nova5怎么卸载不用的应用(华为nova5怎么卸载自带软件)

    华为nova5怎么卸载不用的应用(华为nova5怎么卸载自带软件)

  • 抖音怎么让别人看不到送出音浪(抖音怎么让别人看不到评论内容)

    抖音怎么让别人看不到送出音浪(抖音怎么让别人看不到评论内容)

  • iphone11颜色怎么选(苹果11的颜色怎么调)

    iphone11颜色怎么选(苹果11的颜色怎么调)

  • 笔记本电脑返回键是哪个(笔记本电脑返回上一步)

    笔记本电脑返回键是哪个(笔记本电脑返回上一步)

  • clrtc是什么接口(cl1-8d512是什么接口)

    clrtc是什么接口(cl1-8d512是什么接口)

  • a1332是苹果几(苹果a1332是几个g的?)

    a1332是苹果几(苹果a1332是几个g的?)

  • vivos6对比荣耀30s(vivos6对比荣耀x10)

    vivos6对比荣耀30s(vivos6对比荣耀x10)

  • 关联的qq号为什么突然不能接到信息(关联的qq号为什么无法登录)

    关联的qq号为什么突然不能接到信息(关联的qq号为什么无法登录)

  • vivo哪款手机支持nfc功能(vivo哪款手机支持nfc)

    vivo哪款手机支持nfc功能(vivo哪款手机支持nfc)

  • 有的软件卸载不了怎么办(有的软件为啥卸载不了)

    有的软件卸载不了怎么办(有的软件为啥卸载不了)

  • word开始选项卡在哪(Word开始选项卡中有什么)

    word开始选项卡在哪(Word开始选项卡中有什么)

  • 手机内存16g有多大(手机内存16g有多少)

    手机内存16g有多大(手机内存16g有多少)

  • 手机有划痕用什么去除(手机划痕能去掉吗)

    手机有划痕用什么去除(手机划痕能去掉吗)

  • ipone微信缓存图片在哪(苹果手机微信缓存图片)

    ipone微信缓存图片在哪(苹果手机微信缓存图片)

  • led灯关了还微亮费电吗(LED灯关了还微亮怎么解决)

    led灯关了还微亮费电吗(LED灯关了还微亮怎么解决)

  • 蓝牙耳机r和l怎么同时连接(蓝牙耳机r和l怎么区别)

    蓝牙耳机r和l怎么同时连接(蓝牙耳机r和l怎么区别)

  • vivox27相机功能介绍(vivox27pro照相功能)

    vivox27相机功能介绍(vivox27pro照相功能)

  • 苹果手机怎么设置关机时间(苹果手机怎么设置手写)

    苹果手机怎么设置关机时间(苹果手机怎么设置手写)

  • 详解Linux中监控CPU与虚拟内存运行信息的命令用法(linux监控系统命令)

    详解Linux中监控CPU与虚拟内存运行信息的命令用法(linux监控系统命令)

  • Windows11播放视频怎么节能? win11节省电池的五种方法(windows11播放视频不清晰)

    Windows11播放视频怎么节能? win11节省电池的五种方法(windows11播放视频不清晰)

  • win7系统禁用usb存储设备的方法(win7系统禁用u盘)

    win7系统禁用usb存储设备的方法(win7系统禁用u盘)

  • 前端Vue中实现超炫酷动态背景(全屏背景+自定义banner+登录/注册页)(vue前端开发规范)

    前端Vue中实现超炫酷动态背景(全屏背景+自定义banner+登录/注册页)(vue前端开发规范)

  • 企业所得税汇算清缴退税怎么做账
  • 完税证明是可以抵扣吗
  • 进口货物的会计科目
  • 供电车间工人薪酬计入什么科目
  • 个税app抵扣多少钱怎么查询
  • 购房契税应该交给谁
  • 预算外资金收入政府会计
  • 作业成本管理的作用
  • 会计科目的设置
  • 采暖费报销发票
  • 未收到发票暂估入库的进项税额可以暂估进原料成本吗
  • 一般纳税人销售二手车增值税税率
  • 应交增值税最后到哪了
  • 个人无偿受赠房屋 个人所得税 张英泉
  • 个税纳税期数如何规定的 怎么选择
  • 土地增值税允许扣除的评估价
  • 设定受益计划资产上限
  • 存货变卖残值取得的收益计入哪个科目
  • 网络唤醒的原理
  • 上市公司发行股票会计分录
  • 企业自建自用房的规定
  • 差额征税的项目 按差额记账还是全额倒算销项税
  • 融资租赁与经营租赁的区别主要是
  • 代开专用发票的流程资料要求
  • nvm使用教程
  • 旅行社小规模纳税人差额征税
  • 期末余额跟年初余额是什么意思
  • php二维数组的遍历
  • matlab进行图像处理
  • php实现文件上传的函数
  • 异地预缴印花税怎么做账
  • mysql的where语句优化
  • mongodb 统计
  • 法人不在公司任职可以吗
  • 企业所得税的营业收入包括营业外收入吗
  • sqlserver连接到服务器登录名
  • 电脑访问另一台电脑访问权限
  • 月未转出未交增值税
  • 土地免缴土地使用税
  • 物业公司收的停车费做什么科目
  • 无形资产账面价值和账面余额的区别
  • 主营业务收入的计算公式
  • 税控系统设备可以全额抵扣吗
  • 材料的什么加上什么构成了材料的实际采购成本
  • 报表主营业务收入计算公式
  • 产品销售费用是什么科目
  • 公司购买的打印机附赠给客户进项税可以抵扣吗
  • 外贸内销业务哪个部门管
  • 会计借方和贷方有哪些科目
  • 请创建一个die类
  • sql命令语句
  • win8开机启动项怎么设置方法
  • win10如何恢复
  • 中国主要省份和城市
  • Win10 Mobile 10549预览版增DPI缩放 瞬间手机变电脑
  • winxp安卓
  • win7音频服务未响应
  • mac系统快速入门
  • win10 20h2 v2
  • 2021年win10累积更新
  • neoCapture.exe - neoCapture是什么进程 有什么用
  • win10系统访问不了
  • win10激活突然失效
  • win8系统电脑
  • vi 技巧
  • ,linux
  • opengl文档窗口是什么
  • opengl光照设置
  • bootstrap表单模板
  • android环境搭建教程
  • 在dos中文件是以什么目录结构
  • cocos2d::Vector
  • opengl点的绘制
  • 一起学写字的宣传文案
  • 巧用dos命令合并图层
  • python咋写
  • NGUI之UITab Bar的不能将Sprite与SelectedSprite设置成相同的精灵
  • node.js的理解
  • 国有企业租赁经营 河北省
  • 广东广电网络投诉电话
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设