位置: IT常识 - 正文

【时序列】时序列数据如何一步步分解成趋势(trend)季节性(seasonality)和误差(residual)- 详细理解python sm.tsa.seasonal_decompose(时序21-21-21-47)

编辑:rootadmin
【时序列】时序列数据如何一步步分解成趋势(trend)季节性(seasonality)和误差(residual)- 详细理解python sm.tsa.seasonal_decompose 【时序列】时序列数据如何一步步分解成趋势(trend)季节性(seasonality)和误差(residual)- 理解python sm.tsa.seasonal_decompose

推荐整理分享【时序列】时序列数据如何一步步分解成趋势(trend)季节性(seasonality)和误差(residual)- 详细理解python sm.tsa.seasonal_decompose(时序21-21-21-47),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:时序17,时序还是时序,时序gan,时序gan,时序 序时,时序17,时序 序时,时序 序时,内容如对您有帮助,希望把文章链接给更多的朋友!

在做时序列分析的时候,好多教程都告诉你要把时序列分解成趋势,季节性,残差,然后画图看一下有没有趋势变化,有没有季节性。像这样:

import statsmodels.api as smdecomposition = sm.tsa.seasonal_decompose(train['Count'] ,model='addictive', period=7)decomposition.plot()

相信大家都很熟悉python的这个包和命令,但是具体是如何分解的却不是特别清楚。今天就来详细理解一下一个时序列是如何一步一步被分解的。

举个例子理解概念

首先我们默认每个时序列在某个时间点i的数值,都可以分解成三部分,分别是趋势,季节性和残差,以此来解释时序列的变化。

比如,某列车2021年2月的总乘客人数1000人,这1000人如何理解,为什么是1000人? 2018年2月还是100人,2021年1月还是300人,为啥到2021年2月就1000人了?

首先,可能因为列车开通后乘车人数有逐年上升的趋势,每年增加100人,2018年到2021年的3年之间增加了300人,只考虑趋势原因的话2021年2月应该是:100+300=400人

然后,和2021年1月分相比,2021年2月是春节,每年的2月乘客都1月多200人,只考虑春节这个季节性原因的话2021年2月应该是:300+200=500人

把季节性和趋势原因都考虑进去应该是:400+500=900人,但2021年2月是1000人,剩下的100人如何解释呢?暂时解释不了, 我们就把它作为残差(误差)

理解了例子公式就简单了

就是下面这个公式: y_i = t_i + s_i + n_i

【时序列】时序列数据如何一步步分解成趋势(trend)季节性(seasonality)和误差(residual)- 详细理解python sm.tsa.seasonal_decompose(时序21-21-21-47)

y_i :在i时间点的数值(乘客人数,销量等等) t_i :在i时间点的趋势 s_i :在i时间点的季节性 n_i:在i时间点的残差

当然在上面这个例子里,我们假设这个y(乘客人数),是线性增长的,所以我们用加法把每个要素加起来,来解释y的变化。 如果y不是线性增长,而是比如指数增长的,那就不能用加法,需要用乘法,即: y_i = t_i * s_i * n_i

decomposition = sm.tsa.seasonal_decompose(train[‘Count’], model=‘addictive’, period=7)

那么,上面这句代码里的model就应该从‘addictive’, 改成‘multiplicative’

一步步分解趋势,季节性,残差

所以趋势,季节性,残差都是咋分出来的呢。计算方法貌似有很多,我们理解一个最基本的。 五步走: 1: 确定季节性变化的期间 2: 分离 趋势 3: 分离 季节性+残差 4: 分离 季节性 5: 分离 残差

1: 确定季节变化的期间

这个期间就是decompose命令里面的period。看一下你的数据图。我手头的数据是日次的,看起来以周为单位有一个先升高再下降的循环。所以我把period定为7(7天的意思)

2: 分离 趋势

7这个期间定好之后,我们用移动平均的方法分离趋势。为了方便解释,我都用excel做示例。

计算的时候,以7的中心为开始计算移动平均。所以时序列最开始的3个三个数和最后的3个数是没有值的。 个人理解,如果季节性以周次出现,那么以7为单位计算的时候,比如每周六日数值都很高,这个因素就每个cycle(周)里面都有,平均下来的数值,就可以看作是摒弃了季节性的趋势的影响。 可以看到计算结果和python的decompose是一样的

3: 分离 季节性+残差

分离好趋势之后,如果你选的是model=‘addictive’,根据公式y_i = t_i + s_i + n_i, 我们只要用数值减去趋势那部分,就能得到季节性+残差的部分了。如果是multiplicative,那就是除以趋势。 结果如下,季节性+残差

4,5: 分离 季节性 残差

接下来就从季节性+残差里面把季节性分出来。比如,如果时序列是周次季节性,那么周一的数值,就减去所有周一的数值的平均,周二的数值就减去所有周二的平均,以此类推,剩下的就是残差了。当然这只举了一个分离季节性的超简单逻辑。python里面decompose貌似用了更复杂的计算方法来计算季节性,由于篇幅过大暂且省略。

验证以下python的结果

看一下用python的seasonal_decompose算完,季节性,趋势,残差,加起来是不是真的等于原来的数值。 代码如下

decomposition = sm.tsa.seasonal_decompose(train['Count'],model='addictive', period=7) #Additivetrend = decomposition.trendseasonal = decomposition.seasonal residual = decomposition.residtrain['trend']=trendtrain['seasonal']= seasonaltrain['residual']= residualtrain['add'] = train['trend']+train['seasonal'+*train['residual']

结果如下,Count果然和三个加起来的数值是一样的。 前三行的trend是没有值的。这是因为以7为中心算移动平均的时候,中心点位置是第四行,前3行没有值也就可以理解了。 就写到这里。欢迎大家指导讨论!

【参考文献】 https://timeseriesreasoning.com/contents/time-series-decomposition/

本文链接地址:https://www.jiuchutong.com/zhishi/295152.html 转载请保留说明!

上一篇:在暴风雪中畅游的鸬鹚,德国黑森州 (© Wilfried Martin/Getty Images)(在暴风雪中求生)

下一篇:元素点击报错:element click intercepted(元素鼠标失灵了怎么办)

  • 一般纳税人的增值税税率有哪些
  • 出租房屋转为投资房屋
  • 个体定期定额怎么征税2023
  • 应付销货方代垫运费计入什么科目
  • 税务局如何认定虚开
  • 如何从对公账户的资金情况来确定案件,发现犯罪嫌疑人?
  • 处置固定资产需要税务局备案吗
  • 企业劳务外包员工有五险一金吗
  • 分公司是独立核算还是非独立核算
  • 红字发票票据怎么处理
  • 财产租赁个人所得税
  • 房地产限购过程是什么
  • 环评费用包括哪些
  • 利息收入红冲怎么做
  • 代扣代缴个人所得税手续费返还 增值税
  • 公司交增值税的好处
  • 个体户增值税怎么算
  • 进项税使报表应交税费负数如何处理?
  • 营改增后停车费税率
  • 物业公司一般纳税人怎么抵扣
  • 劳务派遣实缴资本
  • 支付青苗补偿费怎么做账
  • 小规模企业增值税税率是多少
  • 4s店上牌费用怎么给
  • 个人所得税跨年度能退吗
  • 一个公户从农业银行开户
  • 增值税专用发票有几联?
  • wordpress portfolio
  • php模块
  • 吸收合并会计处理举例
  • 补提固定资产折旧和汇算清缴有关系吗
  • 华为2022年资产负债表数据
  • wordpress使用
  • 净资产现金回收率说明什么
  • php常用的魔术方法有哪些
  • joomla模板制作教程
  • YII视图整合kindeditor扩展的方法
  • 参展费会计分录
  • 稽查查补的税款由谁追征
  • 报表怎么报送
  • 未开票收入缴纳增值税怎么冲减补开发票
  • 影响无形资产的营业利润怎么算
  • 三栏式明细账的借或贷怎么写
  • 房租付了没有及时取得发票怎么入账
  • 税务评估价多久更新一次
  • 个体户为员工缴纳社保
  • 公司股权作价转让会计分录案例
  • 不需要计提折旧的情况
  • 商标 入账
  • 零星采购多少不需要发票
  • 工资条上为什么不显示生育险
  • 各单位应当根据需要设立专职或者兼职
  • sqlserver的分页语句
  • sql语句的优化方式
  • mysql 5.7.13 winx64安装配置教程
  • windowsxp电脑开机
  • ubuntu安装软件教程
  • win8系统升级到win 10
  • windows8文件夹怎么加密
  • 重装系统前 病毒怎么办
  • 怎么通过mac连接wifi
  • 惠普笔记本重装系统后没有无线连接
  • Win7出现系统恢复选项怎么办
  • win8系统中向日葵软件造成的屏幕亮度无法调节怎么办?
  • 开发环境配置是干嘛
  • Android性能优化 武汉招聘
  • webpack 构建流程
  • 基于javascript数独游戏论文参考文献
  • ExtJS 2.0实用简明教程 之获得ExtJS
  • ghost参数设置
  • cocos2d教程
  • 什么是自然数
  • 关于Air端与android端的通信实现
  • javascript详细介绍
  • jq easyui
  • 两个fragment之间传值
  • python tonny
  • 出租车票真伪查询官网
  • 辽宁省电子税务局电话
  • 增值税税率有哪些规定
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设