对相似的时间序列进行聚类？

2024-02-21

我有 10-20k 个不同的时间序列（24 维数据——一天中每个小时的一列），并且我对表现出大致相同活动模式的时间序列进行聚类感兴趣。

我最初开始实施动态时间扭曲（DTW）是因为：

并非我所有的时间序列都完全一致
出于我的目的，两个稍微偏移的时间序列应该被认为是相似的
形状相同但尺度不同的两个时间序列应被视为相似

我在 DTW 中遇到的唯一问题是它的扩展性似乎不太好——fastdtw在 500x500 距离矩阵上大约需要 30 分钟。

还有哪些其他方法可以帮助我满足条件 2 和 3？

如果将时间序列分解为趋势、季节性和残差，ARIMA 就可以完成这项工作。之后，使用 K 最近邻算法。然而，计算成本可能会很昂贵，这主要是由于 ARIMA。

在 ARIMA 中：

from statsmodels.tsa.arima_model import ARIMA

model0 = ARIMA(X, dates=None,order=(2,1,0))
model1 = model0.fit(disp=1)

decomposition = seasonal_decompose(np.array(X).reshape(len(X),),freq=100)
### insert your data seasonality in 'freq'

trend = decomposition.trend
seasonal = decomposition.seasonal
residual = decomposition.resid

作为对 @Sushant 评论的补充，您可以分解时间序列，并可以检查 4 个图中的一个或全部的相似性：数据、季节性、趋势和残差。

然后是数据示例：

import numpy as np
import matplotlib.pyplot as plt
sin1=[np.sin(x)+x/7 for x in np.linspace(0,30*3,14*2,1)]
sin2=[np.sin(0.8*x)+x/5 for x in np.linspace(0,30*3,14*2,1)]
sin3=[np.sin(1.3*x)+x/5 for x in np.linspace(0,30*3,14*2,1)]
plt.plot(sin1,label='sin1')
plt.plot(sin2,label='sin2')
plt.plot(sin3,label='sin3')
plt.legend(loc=2)
plt.show()

X=np.array([sin1,sin2,sin3])

from sklearn.neighbors import NearestNeighbors
nbrs = NearestNeighbors(n_neighbors=2, algorithm='ball_tree').fit(X)
distances, indices = nbrs.kneighbors(X)
distances

你会得到相似度：

array([[ 0.        , 16.39833107],
       [ 0.        ,  5.2312092 ],
       [ 0.        ,  5.2312092 ]])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

machinelearning

TimeSeries

clusteranalysis

DTW

对相似的时间序列进行聚类？的相关文章

如何查看Databricks中的所有数据库和表

我想列出 Azure Databricks 中每个数据库中的所有表所以我希望输出看起来像这样 Database Table name Database1 Table 1 Database1 Table 2 Database1 Table
没有名为 crypto.cipher 的模块

我现在正在尝试加密一段时间我最近得到了这个基于 python 的密码器名为PythonCrypter https github com jbertman PythonCrypter 我对 Python 相当陌生当我尝试通过终端打开 C
Django 代理模型的继承和多态性

我正在开发一个我没有启动的 Django 项目我面临着一个问题遗产我有一个大模型在示例中简化称为MyModel这应该代表不同种类的物品的所有实例对象MyModel应该具有相同的字段但方法的行为根据项目类型的不同而有很大差异到目
通过 Scrapy 抓取 Google Analytics

我一直在尝试使用 Scrapy 从 Google Analytics 获取一些数据尽管我是一个完全的 Python 新手但我已经取得了一些进展我现在可以通过 Scrapy 登录 Google Analytics 但我需要发出 AJAX
将数据从 python pandas 数据框导出或写入 MS Access 表

我正在尝试将数据从 python pandas 数据框导出到现有的 MS Access 表我想用已更新的数据替换 MS Access 表在 python 中我尝试使用 pandas to sql 但收到错误消息我觉得很奇怪使用 p
将 Matplotlib 误差线放置在不位于条形中心的位置

我正在 Matplotlib 中生成带有错误栏的堆积条形图不幸的是某些层相对较小且数据多样因此多个层的错误条可能重叠从而使它们难以或无法读取 Example 有没有办法设置每个误差条的位置即沿 x 轴移动它以便重叠的线显示在彼此
为 Anaconda Python 安装 psycopg2

我有 Anaconda Python 3 4 但是每当我运行旧代码时我都会通过输入 source activate python2 切换到 Anaconda Python 2 7 我的问题是我为 Anaconda Python 3 4 安
通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
如何在 Python 中检索 for 循环中的剩余项目？

我有一个简单的 for 循环迭代项目列表在某些时候我知道它会破裂我该如何退回剩余的物品 for i in a b c d e f g try some func i except return remaining items if s
如何使用 Ansible playbook 中的 service_facts 模块检查服务是否存在且未安装在服务器中？

我用过service facts检查服务是否正在运行并启用在某些服务器中未安装特定的软件包现在我如何知道这个特定的软件包没有安装在该特定的服务器上service facts module 在 Ansible 剧本中它显示以下错误
是否可以忽略一行的pyright检查？

我需要忽略一行的pyright 检查有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
SQLALchemy .query：类“Car”的未解析属性引用“query”

我有一个这里已经提到的问题https youtrack jetbrains com issue PY 44557 https youtrack jetbrains com issue PY 44557 但我还没有找到解决方案我使用 Pyt
如何使用 OpencV 从 Firebase 读取图像？

有没有使用 OpenCV 从 Firebase 读取图像的想法或者我必须先下载图片然后从本地文件夹执行 cv imread 功能有什么办法我可以使用cv imread link of picture from firebase 您可以
Python 的“zip”内置函数的 Ruby 等价物是什么？

Ruby 是否有与 Python 内置函数等效的东西zip功能如果不是做同样事情的简洁方法是什么一些背景信息当我试图找到一种干净的方法来进行涉及两个数组的检查时出现了这个问题如果我有zip 我可以写这样的东西 zip a b a
无法在 Python 3 中导入 cProfile

我试图将 cProfile 模块导入 Python 3 3 0 但出现以下错误 Traceback most recent call last File
使用 \r 并打印一些文本后如何清除控制台中的一行？

对于我当前的项目有一些代码很慢并且我无法使其更快为了获得一些关于已完成必须完成多少的反馈我创建了一个进度片段您可以在下面看到当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
如何计算 pandas 数据帧上的连续有序值

我试图从给定的数据帧中获取连续 0 值的最大计数其中包含来自 pandas 数据帧的 id date value 列如下所示 id date value 354 2019 03 01 0 354 2019 03 02 0 354 201
使用其构造函数初始化 OrderedDict 以便保留初始数据的顺序的正确方法？

初始化有序字典 OD 以使其保留初始数据的顺序的正确方法是什么 from collections import OrderedDict Obviously wrong because regular dict loses order d O
发送用户注册密码，django-allauth

我在 django 应用程序上使用 django alluth 进行身份验证注册我需要创建一个自定义注册表单其中只有一个字段电子邮件密码将在服务器上生成这是我创建的表格 from django import forms from
Rocket UniData/UniVerse：ODBC 无法分配足够的内存

每当我尝试使用pyodbc连接到 Rocket UniData UniVerse 数据时我不断遇到错误 pyodbc Error 00000 00000 Rocket U2 U2ODBC 0302810 Unable to allocate

随机推荐

r 中的翻译（重新编码）错误

这是一个小例子 X1 lt c AC AC AC CA TA AT CC CC X2 lt c AC AC AC CA AT CA AC TC X3 lt c AC AC AC AC AA AT CC CA mydf1 lt data fr
具有复杂数据输入字段的 ASP.NET MVC UpdateModel

我如何使用 ASP NET MVC UpdateModel 执行以下操作我正在尝试将空格分隔的文本框数据与新的 StackOverflow 问题中的 TAGS 文本框完全相同例如这个读入模型中 eg
如何在 Julia 1.0 中进行记忆化或记忆化

我一直在尝试用 Julia 来记忆斐波那契函数这就是我想出来的原始未修改的代码用于控制目的 function fib x if x lt 3 return 1 else return fib x 2 fib x 1 end end 这
当我到达页面顶部时，如何启动 JavaScript 或 jQuery 事件？

我有一个简单的问题但我找不到解决方案我只想在向上滚动页面并触摸其顶部时启动一个事件执行一个方法我在我的页面中使用 JavaScript 和 jQuery 提前致谢您应该为此目的使用滚动事件 window scroll func
将文本环绕在右侧浮动列周围，其中左侧列首先出现在 html 中

h1 tab1 tab2 tab3 text text photo text text photo text text photo text text photo text text photo text text text text te
JT400.jar 禁用登录屏幕

谁能帮我吗我有一个小型实用程序应用程序它使用 Jt400 6 7 jar 连接到 AS400 服务器请看下面的代码 private Connection buildConnection String url String userNa
为什么我的代码只写最后一行？

我正在向文件写入一个列表但它只写入最后一行这是我的代码我使用的是Python 2 7 server os listdir contents of the current directory for files in server pu
如何将 C# 哈希字节数组转换为字符串以传递给 API？

我有许多值必须组合成 SHA256 哈希才能传递到 Web 服务使用 Encoding ASCII GetBytes allparametershere 将这些值组合成字节数组然后通过 myHashMethod ComputeHash
sql左连接返回

我正在尝试在 2 个表上运行左连接我没有分组依据我唯一的条件是在第二张桌子上但是返回的行数少于第一个表左连接不是应该从第一个表中获取所有数据吗这是我的 SQL select from tbl a A left join tbl
如何在 Haskell 中编写 Ctrl-C 处理程序？

我尝试了以下方法 import System Exit import System Posix Signals import Control Concurrent threadDelay main IO main do installHan
为什么在 JS 中使用 NULL 和逻辑运算符会抛出错误

这是我正在测试的代码工作正常 document write 1 undefined prints undefined document write 1 3 prints 3 document write 1 true prints tru
假装客户端无法拨打电话 - Kubernetes

我已经在 Windows 的 docker desktop 上部署了微服务并且 feign 无法调用另一个服务个人MS通过假装呼叫组织MS 我可以在 person pod 的日志中看到 2019 11 10 12 58 34 000 I
如何使用从字符串到 float64 的类型转换来解码 JSON

我需要使用浮点数解码 JSON 字符串例如 name Galaxy Nexus price 3460 00 我使用下面的 Golang 代码 package main import encoding json fmt type Produ
如何防止将 Windows 临时删除关闭文件上打开的内存映射刷新到磁盘

更新 2 TL DR 有没有办法防止窗口脏页FILE FLAG DELETE ON CLOSE临时文件是否会因关闭在这些文件上打开的内存映射而被刷新 Yes 如果您在初始创建后不需要对文件本身执行任何操作并且您实现了一些命名约定则可以通
抽象工厂与工厂方法（范围）

工厂方法是类设计模式抽象工厂使用了许多工厂方法为什么抽象工厂是对象设计模式而不是类设计模式抽象工厂将实例化推迟到哪个对象抽象工厂模式将产品对象的创建推迟到 ConcreteFactory 子类由于客户端期望 Factory 类
如何在Android中删除SIM卡中的联系人

我执行了以下代码来从 SIM 卡中删除选定的联系人但它不会删除也不会抛出任何错误 protected void DeleteContacts ArrayList
闪亮仪表板的选项卡框 CSS

我正在尝试更改选项卡样式tabBox in shinydashboard 我能够更改未选择的选项卡的背景但无法更改所选选项卡的背景或每个选项卡中显示的文本这是我添加到 custom css 文件中以更改未选择的选项卡背景的内容 nav
module.export和export有什么区别

有什么区别module export and export 如果 module export 对象中有一些属性怎么办将要export xx那么无效吗首先它是exports and module exports并不是export and
在Python中自动下载所需模块的最简单方法？

我想发布一个我编写的 python 模块它依赖于几个包最简单的方法是什么以便以编程方式下载这些软件包以防它们在正在运行的系统上不可用大多数这些模块应该可以通过 easy install 或 pip 或类似的东西获得我只是想避免用
对相似的时间序列进行聚类？

我有 10 20k 个不同的时间序列 24 维数据一天中每个小时的一列并且我对表现出大致相同活动模式的时间序列进行聚类感兴趣我最初开始实施动态时间扭曲 DTW 是因为并非我所有的时间序列都完全一致出于我的目的两个稍微偏移的时间序

对相似的时间序列进行聚类？

对相似的时间序列进行聚类？ 的相关文章

随机推荐

热门标签

对相似的时间序列进行聚类？的相关文章