statmodels库分解时间序列（趋势、周期性、季节性、残差）

2023-10-30

 import pandas as pd
 import matplotlib.pyplot as plt
 from statsmodels.tsa.seasonal import STL
 
 df = pd.read_csv("time-series-data.csv")
 
 decomposition = STL(df['x'], period=12).fit()

fig, (ax1, ax2, ax3, ax4) = plt.subplots(nrows=4, ncols=1, sharex=True,figsize=(10,8))
 
 ax1.plot(decomposition.observed)
 ax1.set_ylabel('Observed')
 
 ax2.plot(decomposition.trend)
 ax2.set_ylabel('Trend')
 
 ax3.plot(decomposition.seasonal)
 ax3.set_ylabel('Seasonal')
 
 ax4.plot(decomposition.resid)
 ax4.set_ylabel('Residuals')
 
 plt.tight_layout()

代码部分逐行的解释：

1. `import pandas as pd`: 导入Pandas库并将其命名为pd

2. `import matplotlib.pyplot as plt`: 导入matplotlib库中的pyplot模块并将其命名为plt

3. `from statsmodels.tsa.seasonal import STL`: 导入statsmodels库中的tsa模块下的seasonal模块中的STL函数，用于对时间序列数据进行分解

4. `df = pd.read_csv("time-series-data.csv")`: 从csv文件中读取数据并将其赋值给名为df的Pandas DataFrame。

5. `decomposition = STL(df['x'], period=12).fit()`: 对DataFrame中名为'x'的列执行STL分解，并将结果赋值给变量decomposition。该分解的周期为12，这意味着每年有12个月，每个月都被视为一个季节。

最后，使用fit()方法来拟合分解并获得分解对象的结果。

请注意，在以上代码中，我们假设数据已经被正确加载到Pandas DataFrame对象中。 STl分解可以分解时间序列的趋势、季节性和残差组件，请确保提供的时间序列数据集具有明显的周期性特征，这样才能使用STL方法进行分解，否则得出的结果可能不太可靠。

？问题来了：如何判断一个时间序列有没有明显的周期性特征，然后进行分解？

判断一个时间序列是否具有明显的周期性特征可以通过以下方法：

1. 观察时间序列的图形：绘制时间序列的折线图或散点图，观察是否存在明显的周期性波动。如果存在周期性波动，可以进一步观察波动的周期、幅度和形态等特征。

2. 应用傅里叶变换：傅里叶变换可以将时间序列转换为频域信号，通过观察频域信号的频谱图，可以判断时间序列是否存在明显的周期性特征。

3. 应用自相关函数：自相关函数可以衡量时间序列在不同时间点上的相关性，通过观察自相关函数的图形，可以判断时间序列是否存在明显的周期性特征。

4. 应用周期图谱：周期图谱可以将时间序列分解为不同频率的周期成分，通过观察周期图谱的图形，可以判断时间序列是否存在明显的周期性特征。

需要注意的是，判断时间序列是否具有周期性特征并不是一件简单的事情，需要结合多种方法进行综合分析。同时，周期性特征的存在并不意味着一定存在周期性因素，也可能是由于其他因素导致的波动。

另一个文章实例：http://t.csdn.cn/IvAgw

我们使用statsmodels的STL方法对航空公司乘客数据进行分解并获取各个分量的结果：

这段代码的作用是对一个时间序列进行STL分解，并将分解后的趋势、季节和残差部分保存到原始数据框中。

具体解释如下：

1. `from statsmodels.tsa.seasonal import STL`：导入STL分解函数。

2. `plt.rc("figure", figsize=(10, 6))`：设置图形的大小为10*6。

3. `df=pd.read_csv("airline_Passengers.csv")`：读取一个名为"airline_Passengers.csv"的csv文件，并将其存储到名为df的数据框中。

4. `df['Period']=pd.to_datetime(df['Period'])`：将df数据框中的"Period"列转换为日期时间格式。

5. `df.set_index('Period',inplace=True)`：将df数据框中的"Period"列设置为索引。

6. `res = STL(df).fit()`：对df数据框进行STL分解，并将分解结果存储到名为res的变量中。

7. `res.plot()`：绘制STL分解结果的图形。

8. `df['trend']=res.trend`：将STL分解结果中的趋势部分存储到df数据框中的"trend"列中。

9. `df['seasonal']=res.seasonal`：将STL分解结果中的季节部分存储到df数据框中的"seasonal"列中。

10. `df['resid']=res.resid`：将STL分解结果中的残差部分存储到df数据框中的"resid"列中。

总的来说，这段代码的作用是对一个时间序列进行STL分解，并将分解后的趋势、季节和残差部分保存到原始数据框中，以便后续的分析和建模。

STL时间序列分解在数据预测中有什么作用？

STL（Seasonal and Trend decomposition using Loess）时间序列分解是一种常用的时间序列分析方法，它可以将时间序列分解为趋势、季节性和残差三个部分，从而更好地理解和预测时间序列的变化趋势。

在数据预测中，STL时间序列分解可以帮助我们更好地理解时间序列的趋势和季节性变化，从而更准确地预测未来的数据。具体来说，STL时间序列分解可以帮助我们：

1. 消除季节性影响：通过将时间序列分解为趋势、季节性和残差三个部分，可以更好地消除季节性影响，从而更准确地预测未来的数据。

2. 检测趋势：STL时间序列分解可以帮助我们检测时间序列的趋势，从而更好地预测未来的数据。

3. 预测残差：STL时间序列分解可以将时间序列的残差部分提取出来，从而可以更好地预测未来的残差，进而更准确地预测未来的数据。

总之，STL时间序列分解在数据预测中具有重要的作用，可以帮助我们更好地理解时间序列的变化趋势，从而更准确地预测未来的数据。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

statmodels库分解时间序列（趋势、周期性、季节性、残差）的相关文章

不能在jinja2宏中使用current_user？

我使用 Flask Login 它提供了current user模板中的对象我想编写一个宏来显示评论表单或登录链接具体取决于用户是否登录如果我直接在模板中使用此代码它会起作用 if current user is authentic
无法使用 beautifulsoup 模块 python 从 HTML 检索温度值

我正在使用 BeautifulSoup4 来解析此 HTML 查看源代码 https weather com en IN weather today l 17 39 78 49 https weather com en IN weather
Ubuntu Python shebang 线不工作

无法让 shebang 线在 Ubuntu 中为 python 脚本工作我每次只收到命令未找到错误 test py usr bin env python print Ran which python usr bin python 在 sh
为什么具有复杂无穷大的 NumPy 运算会导致有趣的结果？

我注意到复杂的无穷大的有趣结果 In 1 import numpy as np In 2 np isinf 1j np inf Out 2 True In 3 np isinf 1 1j np inf Out 3 True In 4 np
预处理 csv 文件以与 tflearn 一起使用

我的问题是关于在将 csv 文件输入神经网络之前对其进行预处理我想使用 python 3 中的 tflearn 为著名的 iris 数据集构建一个深度神经网络数据集 http archive ics uci edu ml machine
熊猫 style.background_gradient 忽略 NaN

我有以下代码来转储数据帧results到 HTML 表格中这样的列TIME FRAMES根据seaborn 的颜色图进行着色 import seaborn as sns TIME FRAMES 24h 7d 30d 1y Set CSS
Pythoncom - 将相同的 COM 对象传递给多个线程

你好对于 COM 对象我是一个完全的初学者非常感谢任何帮助我正在开发一个Python程序该程序应该以客户端服务器的方式读取传入的MS Word文档即客户端发送一个请求一个或多个MS Word文档服务器使用pythoncom
使用 Twisted Python 的 UDP 客户端和服务器

我想创建一个服务器和客户端使用 Twisted 从网络发送和接收 UDP 数据包我已经用 Python 中的套接字编写了此代码但想利用 Twisted 的回调和线程功能然而我需要 Twisted 设计方面的帮助我想接收多种类型的
如何使用lxml和python更新xml文件？
PyCharm 输出错误消息散布在控制台输出中。如何解决这个问题？

我正在运行 PyCharm 社区版 4 0 4 有谁知道为什么控制台输出后不显示错误消息 Thanks C Python27 python exe F Google Drive code python scripts leetcode lc
RuntimeError：模型类 django_messages.models.Message 未声明显式 app_label 并且不在 INSTALLED_APPS 中的应用程序中

我正在尝试使用https github com arneb django messages https github com arneb django messages打包我的消息传递内容并尝试了以下操作 pip install git h
Python：如何使用生成器来避免 sql 内存问题

我有以下方法来访问 mysql 数据库并且查询在服务器中执行我无权更改有关增加内存的任何内容我对生成器很陌生并开始阅读更多有关它的内容并认为我可以将其转换为使用生成器 def getUNames self globalUserQu
在 Django 中翻译文件时的 Git 命令

我在 Django 中有一个现有的应用程序我想在页面上添加翻译在页面上我有 trans Projects 在 po 文件中我添加了 templates staff site html 200 msgid Projects msgid P
找到图像特征宽度的正确方法和Python包

输入是一个在黑色背景上带有彩色抱歉垂直线的光谱给定该带的近似 x 坐标用 X 标记我想找到该带的宽度我对图像处理不熟悉请引导我前往正确的方法图像处理和Python图像处理package也能起到同样的作用我认为 PIL Ope
Numba jitclass 不适用于 python 列表

我在用python 3 6 and numba 0 36 这个问题有一个sister https stackoverflow com questions 48159360 numba custom stack class and pop f
如何在 Flask 中获取 POSTed JSON？

我正在尝试使用 Flask 构建一个简单的 API 现在我想在其中读取一些 POSTed JSON 我使用 Postman Chrome 扩展进行 POST 我 POST 的 JSON 很简单 text lalala 我尝试使用以下方法读取
检测计算机何时解锁 Windows

我用过这个优秀的方法 https stackoverflow com questions 20733441 lock windows workstation using python 20733443锁定 Windows 计算机那部分工作
Tensorboard——High-level节点的计算时间与其子节点计算时间的总和不同

继tutorial https www tensorflow org programmers guide graph viz在 TensorFlow 上我试图使用张量板来理解运行时统计数据我发现代表名称范围的高级节点的计算时间不等于其子
使用 Tweepy 获取推文时出错

我有一个用于获取推文的 Python 脚本在脚本中我使用该库 Tweepy 我使用有效的身份验证参数运行此脚本后一些推文存储在我的 MongoDB 中有些则被 if 语句拒绝但我仍然收到错误 requests packages u
Pymongo 批量插入

我正在尝试批量插入文档但批量插入时不会插入超过 84 个文档给我这个错误 in insert pymongo errors InvalidOperation cannot do an empty bulk insert 是否可以批量插入

随机推荐

深度学习结合非局部均值滤波的图像去噪算法

其实这是半年之前完成的内容一直懒着没有总结今天看了看代码发觉再不总结自己以后都看不懂了故整理如下非局部均值是一种基于块匹配来确定滤波权值的即先确定一个块的大小例如7x7 然后在确定一个搜索区域例如15x15 在15x15这个
hexo提交报错 unable to access ‘https://github.com/*/*.github.io.git/‘: Couldn‘t resolve host ‘github.com

title gt hexo提交报错 unable to access https github com github io git Couldn t resolve host github com date 2016 10 08 19 08
算法题十之无向连接图的深度拷贝

题目无向连接图的深度拷贝图的表示方式用数组表示与当前节点连接的节点如下面的代码 class Node public int val public List
mac下安装brew遇到的问题总结

网上的例子大多数给的下载地址已经过期了 github上的地址也已经变了执行的ruby命令需要去http brew sh 官网上看 usr bin ruby e curl fsSL https raw githubusercontent c
Openssl 签名证书学习笔记

环境 win10 64位安装版的OpenSSL Win64 openssl 1 1 0f x509证书环境变量配置openssl 的path 操作在命令窗口完成第一类自签名证书自签名证书比一般过程 1 生成密钥 2 生成请求 3
Unity RawImage加载Image到底在什么时候用哪一种方法

先看看 RawImage加载Image的区别 RawImage核心代码比Image少很多 Raw Image不支持交互可用于显示任何图片而不仅仅是Sprite 一般用在背景图标上支持UV Rect 用来设置只显示图片的某一部分而Im
亚马逊云科技：你要的并不是ChatGPT，而是强大和经济的算力

2022年12月 AI创业公司OpenAI推出了聊天机器人ChatGPT 作为生成式AI在文本领域的实际应用之一 ChatGPT的问世距今不过百天而已却已经火爆了全球一时间大量的企业投入到生成式AI领域大有任彼桑田变沧海一丸丹药
用STM32F030F4的SPI总线获取BMP280的气压和温度

1 用STM32Cube MX生成SPI总线的初始化函数 static void BMP280 SPI Init void LL SPI InitTypeDef SPI InitStruct 0 LL GPIO InitTypeDef GP
洛谷 P1914 小书童——凯撒密码

题目链接 https www luogu com cn problem P1914 include
全局变量和局部变量在堆和栈的区别

全局变量和局部变量在堆和栈的区别主要体现在它们的存储位置和生命周期上存储位置全局变量存储在静态存储区也就是程序的全局数据区或者称为全局内存这个区域在程序运行期间一直存在并且在整个程序中都可以被访问到局部变量存储在栈 stack
asp and javascript: sql server export data to csv and to xls
SnailApp---数据流的控制（一）

SnailApp 数据流的控制一一简介搭建Flux框架及其辅助框架二技术应用 1 Flux 插件安装 npm install flux save homepage https github com facebook flux 作
android中服务的生命周期示例

如何在android中建立一个服务使用androidstudio新建一个继承自Service的MyService类并在Android manifest xml文件中注册在MyService类中需要实现onBind这个类但是启动一个服
如何更改vue项目窗口的标题title和图标icon

Vue CLI创建的项目窗口的标题默认是打包后的项目名称默认图标是Vue的图标favicon ico 解决方法修改图标直接将新图标导入public文件夹然后将favicon ico替换为新图标的名字即可此处可以不用ico文件但是
重排序架构行人重识别代码复现

参考教程 https blog csdn net Layumi1993 article details 84849506 https zhuanlan zhihu com p 50387521 一需要安装的软件包 1 Python 3 6
看门狗电路通俗理解

视频讲解李想STM32初级教程哔哩哔哩 bilibili 看门狗通俗理解转自 STC89C5X单片机看门狗原理详解电子工程世界很多人初次接触不太理解怎么用书上也讲的含含糊糊故意说的很复杂很玄妙可能是现在写书人的通病生怕
MindManager2022Mac版本支持导入XMind、FreeMind文件格式

Mindjet MindManager 2022 Win macOS版思维导图软件由coco玛吉多整理 MindManager 是一个强大的思维导图软件它可以让你定制发现隐藏的潜力与人合并信息释放生产力更快地完成好工作它作为
Spring的控制反转与依赖注入

学习过Spring的都知道Spring有三大核心的概念分别是控制反转 IOC 依赖注入 DI 和面向切面编程 AOP 今天就来聊聊我对控制反转和依赖注入的了解至于面向切面编程放到后面讲解一控制反转 Ioc 控制反转 Inversio
分别用Eigen和C++(OpenCV)实现图像(矩阵)转置

1 标量 scalar 一个标量就是一个单独的数 2 向量 vector 一个向量是一列数这些数是有序排列的通过次序中的索引可以确定每个单独的数 3 矩阵 matrix 矩阵是一个二维数组其中的每一个元素被两个索引而非一个所确定 4
statmodels库分解时间序列（趋势、周期性、季节性、残差）

import pandas as pd import matplotlib pyplot as plt from statsmodels tsa seasonal import STL df pd read csv time series

statmodels库分解时间序列（趋势、周期性、季节性、残差）

statmodels库分解时间序列（趋势、周期性、季节性、残差） 的相关文章

随机推荐

热门标签

statmodels库分解时间序列（趋势、周期性、季节性、残差）的相关文章