位置: IT常识 - 正文

Python统计学11——分位数回归(python 统计学包)

编辑:rootadmin
Python统计学11——分位数回归

推荐整理分享Python统计学11——分位数回归(python 统计学包),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:python中的统计函数,python基本统计值计算解析,python 统计学,python 统计学包,python统计图教程,python中的统计函数,用python动手学统计学,python 统计学,内容如对您有帮助,希望把文章链接给更多的朋友!

分位数回归也是数理统计里面经典的模型,他相对于在最小二乘模型上进行了改进,虽然本身还是线性的参数模型,但对损失函数进行了改进。我们都知道最小二乘的损失函数是均方误差最小,分位数的损失函数是:

可以看到分位数损失函数会对高估的值和低估的值给予一个不同的权重,这样就可以做到‘’分位‘’。

该模型对于存在异方差的数据有很好的的效果。能准确计算出5%~95%的置信区间

具体看代码理解:

导入包,加载自带的案例数据

import numpy as npimport pandas as pdimport statsmodels.api as smimport statsmodels.formula.api as smfimport matplotlib.pyplot as pltdata = sm.datasets.engel.load_pandas().datadata.head()

 

 X是收入,y是食物支出,很经典的发散数据,因为不同收入区间的家庭的食物支出比例不一样,随着X增大,Y的波动也增大。存在异方差。

q=0.5时候的分位数回归

mod = smf.quantreg("foodexp ~ income", data)res = mod.fit(q=0.5)print(res.summary())

Python统计学11——分位数回归(python 统计学包)

 当q不一样是回归出来的系数是不一样的。我们计算0.05,0.15,0.25.....0.95分位数出来的回归系数,还有最小二乘的回归系数。

quantiles = np.arange(0.05, 0.96, 0.1)def fit_model(q): res = mod.fit(q=q) return [q, res.params["Intercept"], res.params["income"]] + res.conf_int().loc["income"].tolist()models = [fit_model(x) for x in quantiles]models = pd.DataFrame(models, columns=["q", "a", "b", "lb", "ub"])ols = smf.ols("foodexp ~ income", data).fit()ols_ci = ols.conf_int().loc["income"].tolist()ols = dict(a=ols.params["Intercept"], b=ols.params["income"], lb=ols_ci[0], ub=ols_ci[1])print(models)print(ols)

画图对比x = np.arange(data.income.min(), data.income.max(), 50)get_y = lambda a, b: a + b * xfig, ax = plt.subplots(figsize=(6, 4))for i in range(models.shape[0]): y = get_y(models.a[i], models.b[i]) ax.plot(x, y, linestyle="dotted", color="grey")y = get_y(ols["a"], ols["b"])ax.plot(x, y, color="red", label="OLS")ax.scatter(data.income, data.foodexp, alpha=0.2)ax.set_xlim((200, 3000))ax.set_ylim((200, 2000))legend = ax.legend()ax.set_xlabel("Income", fontsize=16)ax.set_ylabel("Food expenditure", fontsize=16)

 透明蓝色散点为样本点。蓝色虚线为不同分位数上的回归方程。

可以看出的几个结论:

'''粮食支出随着收入的增加而增加

粮食支出的分散度随着收入的增加而增加

最小二乘估计值与低收入观测值的拟合度相当差(即OLS线越过大多数低收入家庭)'''

而且5%~95%的回归方程区间涵盖了所有的真实样本点,置信区间很准确。

 画出回归系数随着分位数的变化图

n = models.shape[0]plt.plot(models.q, models.b, color="black", label="Quantile Reg.")plt.plot(models.q, models.ub, linestyle="dotted", color="black")plt.plot(models.q, models.lb, linestyle="dotted", color="black")plt.plot(models.q, [ols["b"]] * n, color="red", label="OLS")plt.plot(models.q, [ols["lb"]] * n, linestyle="dotted", color="red")plt.plot(models.q, [ols["ub"]] * n, linestyle="dotted", color="red")plt.ylabel(r"$\beta_{income}$")plt.xlabel("Quantiles of the conditional food expenditure distribution")plt.legend()plt.show()

 

#上图画出了回归系数随着分位数的变化而变化,OLS系数是恒定的,分位数回归的系数随着分位数变大而变大

#在大多数情况下,分位数回归点估计值位于OLS置信区间之外,这表明收入对食品支出的影响在整个分布区间内可能不是恒定的

本文链接地址:https://www.jiuchutong.com/zhishi/299819.html 转载请保留说明!

上一篇:前端项目性能优化方案有哪些(前端项目性能优势怎么写)

下一篇:第四季新星计划即将开启,博客之星取消拉票你怎么看?(新星计划片头好可爱啊)

  • 华为平板网易云音乐怎么横屏全屏(华为平板网易云音乐怎么弄成满屏)

    华为平板网易云音乐怎么横屏全屏(华为平板网易云音乐怎么弄成满屏)

  • 华为荣耀10青春版屏幕多高(华为荣耀10青春版有nfc功能吗)

    华为荣耀10青春版屏幕多高(华为荣耀10青春版有nfc功能吗)

  • 苹果11支不支持nfc功能(苹果11支不支持双卡双待)

    苹果11支不支持nfc功能(苹果11支不支持双卡双待)

  • 华为手机照片如何永久删除(华为手机照片如何添加日期水印)

    华为手机照片如何永久删除(华为手机照片如何添加日期水印)

  • 表格连续选择按什么键(表格中连续选择快捷键)

    表格连续选择按什么键(表格中连续选择快捷键)

  • ebg-an10是什么型号(ebgan10是什么型号手机)

    ebg-an10是什么型号(ebgan10是什么型号手机)

  • qq电话和微信电话能同时打吗(qq电话和微信电话哪个省流量)

    qq电话和微信电话能同时打吗(qq电话和微信电话哪个省流量)

  • 微信长按图片翻译怎么开启(微信长按图片翻译没了)

    微信长按图片翻译怎么开启(微信长按图片翻译没了)

  • 美国除了苹果还有什么手机品牌(美国除了苹果还有其他手机品牌吗)

    美国除了苹果还有什么手机品牌(美国除了苹果还有其他手机品牌吗)

  • 苹果发邮件不能添加附件(iphone邮件不能发送)

    苹果发邮件不能添加附件(iphone邮件不能发送)

  • 性能测试怎样测(性能测试怎样测量)

    性能测试怎样测(性能测试怎样测量)

  • 怎么给视频加片头(怎么给视频加片段)

    怎么给视频加片头(怎么给视频加片段)

  • 怎样从网页上下载视频(怎样从网页上下载图片)

    怎样从网页上下载视频(怎样从网页上下载图片)

  • word序号不让自动排序(如何让word序号不连续)

    word序号不让自动排序(如何让word序号不连续)

  • 淘宝里怎么改生日(淘宝怎么修改生日)

    淘宝里怎么改生日(淘宝怎么修改生日)

  • win10怎么连接蓝牙音箱(win10怎么连接蓝牙鼠标)

    win10怎么连接蓝牙音箱(win10怎么连接蓝牙鼠标)

  • 苹果手机接入点在哪里(苹果手机接入点apn在哪)

    苹果手机接入点在哪里(苹果手机接入点apn在哪)

  • 淘宝台湾买家怎么处理(淘宝台湾订单)

    淘宝台湾买家怎么处理(淘宝台湾订单)

  • 快手被屏蔽了多久能好(快手被屏蔽了多久能恢复)

    快手被屏蔽了多久能好(快手被屏蔽了多久能恢复)

  • 余额宝笔笔攒怎么取消(余额宝笔笔攒怎么冻结)

    余额宝笔笔攒怎么取消(余额宝笔笔攒怎么冻结)

  • 微信可以发多长时间的视频(微信可以发多长时间的音频)

    微信可以发多长时间的视频(微信可以发多长时间的音频)

  • 武侯祠内红墙和竹林掩映下的小巷,中国成都 (© Eastimages/Getty Images)(武侯祠红墙在哪个门)

    武侯祠内红墙和竹林掩映下的小巷,中国成都 (© Eastimages/Getty Images)(武侯祠红墙在哪个门)

  • Docker:常用的指令集(docker的常用命令汇总)

    Docker:常用的指令集(docker的常用命令汇总)

  • 研发辅助账科目设置
  • 增值税现代服务业6大行业
  • 发票替代票
  • 个体户免税金额现在是多少
  • 公司举办年会的要求有哪些
  • 已发货未收钱会计分录
  • 个人独资企业可以投资有限公司吗
  • 带息承兑汇票的利息收入要缴纳增值税吗
  • 证券公司清算交收
  • 房地产增值税怎么算举例说明
  • 一般纳税人无票收入会计分录
  • 结汇收益怎么算
  • 红字冲销增值税专用发票怎么写
  • 公司承担了个人社保如何入账
  • 公司怎么申请开票资格?
  • 单位聘请临时工工资怎么报税
  • 快递费需要计提吗
  • 购销合同印花税优惠政策
  • 办理金税盘需要多少钱
  • 租赁收入账务处理
  • 餐费发票怎么开
  • 接管财务要对接哪些内容?
  • 美团收入怎么处理的?
  • 企业取得的利息收入 用什么科目
  • 公司之间借款怎么操作
  • mac怎么把通知栏固定
  • 其他综合收益属于什么类
  • 个人投资额是什么意思
  • 建筑企业挂靠违法吗
  • 调制解调器的作用包括
  • 会计核算的实训目的
  • java date类型
  • framework启动
  • laravel ajax
  • 承兑汇票到期超过10天怎么办
  • 公司费用报销包括哪些
  • 资产总额怎么计算公式
  • node l
  • 港口公司属于什么性质的单位
  • 员工体检费发票可以抵扣进项吗
  • 用友t3固定资产清理怎么操作
  • 苹果cms仿站教程
  • mysql内存使用详解
  • 深圳税务2021
  • 一条sql更新多条记录
  • 企业所得税免征和不征税区别
  • 接受捐赠的增值税计入会计利润吗
  • 会员代金券模板
  • 积分购物骗局
  • 仓库盘点后的数据怎么处理
  • 股东以固定资产投资要交增值税?
  • 发票失控进项转出所得税
  • 采购的样品没有发票怎么入账
  • 短期借款计提利息计入什么科目
  • 摊销本月的广告费合理吗
  • 企业付的快递费怎么做账
  • 电汇凭证需要盖什么章
  • 路由怎么配
  • vista server
  • ubuntu桌面右键
  • ubuntu14.4安装教程
  • linux下xhost命令报错:unable to open display的解决办法
  • 进程lsass.exe
  • kcleaner.exe是什么
  • imac 5k屏幕参数
  • linux mount -o remount
  • 进程rundll32停止工作
  • win8系统怎么设置密码
  • Win7系统打开D盘文件后怎么没有后退箭头
  • shell linux命令详解
  • unity移动方法
  • nodejs yield
  • .material design
  • 在浏览器中打开是什么意思
  • 湖北电子网上税务怎么交
  • 江苏省官网
  • 房屋出租到哪里挂出去
  • 发票勾选后必须抵扣吗
  • 内蒙古总工会工会经费
  • 残疾人的房产可以买卖吗
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设