使用 Javascript 和 Mongodb 对时间序列数据重新采样

2024-05-12

时间序列数据的数据集需要从具有不规则时间间隔的数据集转换为规则时间序列，可能使用插值和重采样。

蟒蛇的pandas.Dataframe.resample http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.resample.html是一个可以执行此操作的函数。 JavaScript 可以做同样的事情吗？时间序列数据集存储在Mongodb中。

这是有可能的。请记住，Pandas 是一个专门为此类任务构建的库，并且非常擅长，而 MongoDB 则旨在成为一个数据库。但是，如果忽略您可能需要使用插值，以下内容很可能会满足您的需求：

假设您有以下数据存储在名为的 MongoDB 集合中devices

/* 0 */
{
    "_id" : ObjectId("543fc08ccf1e8c06c0288802"),
    "t" : ISODate("2014-10-20T14:56:44.097+02:00"),
    "a" : "192.168.0.16",
    "i" : 0,
    "o" : 32
}

/* 1 */
{
    "_id" : ObjectId("543fc08ccf1e8c06c0288803"),
    "t" : ISODate("2014-10-20T14:56:59.107+02:00"),
    "a" : "192.168.0.16",
    "i" : 14243,
    "o" : 8430
}

and so on...

在本例中，大约每 15 秒采样一次，但也可以不规则。如果您想在某一天将其重新采样到 5 分钟边界，那么您应该执行以下操作：

var low = ISODate("2014-10-23T00:00:00.000+02:00")
var high = ISODate("2014-10-24T00:00:00.000+02:00")
var interval = 5*60*1000;
db.devices.aggregate([
  {$match: {t:{$gte: low, $lt: high}, a:"192.168.0.16"}},
  {$group: {
     _id:{
       $subtract: ["$t", {
         $mod: [{
           $subtract: ["$t", low]
         }, interval]
       }]
     },
     total: {$sum: 1},
     incoming: {$sum: "$i"},
     outgoing: {$sum: "$o"},
    }
  },
  {
    $project: {
      total: true,
      incoming: true,
      outgoing: true,
      incoming_avg: {$divide: ["$incoming", "$total"]},
      outgoing_avg: {$divide: ["$outgoing", "$total"]},
    },
  },
  {$sort: {_id : 1}}
])

这会导致类似这样的结果

{
    "result" : [ 
        {
            "_id" : ISODate("2014-10-23T07:25:00.000+02:00"),
            "total" : 8,
            "incoming" : 11039108,
            "outgoing" : 404983,
            "incoming_avg" : 1379888.5,
            "outgoing_avg" : 50622.875
        }, 
        {
            "_id" : ISODate("2014-10-23T07:30:00.000+02:00"),
            "total" : 19,
            "incoming" : 187241,
            "outgoing" : 239912,
            "incoming_avg" : 9854.78947368421,
            "outgoing_avg" : 12626.94736842105
        }, 
        {
            "_id" : ISODate("2014-10-23T07:35:00.000+02:00"),
            "total" : 17,
            "incoming" : 22420099,
            "outgoing" : 1018766,
            "incoming_avg" : 1318829.352941176,
            "outgoing_avg" : 59927.41176470588
        },
        ...

如果您想丢弃总传入量，则只需在 $project 阶段保留该行即可。传入_average只是一个如何计算平均值的示例，以防您存储的数据类似于rrdtool命名的仪表（温度、CPU、传感器数据）。如果您仅在该时间间隔内聚合的总和（即传入和传出字段）之后，那么您可以将整个 $project 阶段排除在外。它仅用于计算时间间隔的平均值。

See Mongo 将 ISODate 聚合为 45 分钟的块 https://stackoverflow.com/questions/26411949/mongo-aggregation-of-isodate-into-45-minute-chunks

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 Javascript 和 Mongodb 对时间序列数据重新采样的相关文章

如何在react-native中获取Text组件的onPress值

我是一名新的 React Native 开发人员我想使用 onPress 获取 Text 组件的值并将其传递给函数
如何使输入字段和提交按钮变灰

我想变灰这两件事 http doorsplit heroku com 歌曲输入字段和提交按钮直到用户输入艺术家有没有一种简单的方法可以通过 JQuery 来做到这一点艺术家输入字段的id是 request artist 你可以这样做
python的shutil.move()在linux上是原子的吗？

我想知道python的shutil move在linux上是否是原子的如果源文件和目标文件位于两个不同的分区上行为是否不同或者与它们存在于同一分区上时的行为相同吗我更关心的是如果源文件和目标文件位于同一分区上 shutil move
提交表单并重定向页面

我在 SO 上看到了很多与此相关的其他问题但没有一个对我有用我正在尝试提交POST表单然后将用户重定向到另一个页面但我无法同时实现这两种情况我可以获取重定向或帖子但不能同时获取两者这是我现在所拥有的
Django 视图中的“请求”是什么

在 Django 第一个应用程序的 Django 教程中我们有 from django http import HttpResponse def index request return HttpResponse Hello world
Pandas 组合不同索引的数据帧

我有两个数据框df 1 and df 2具有不同的索引和列但是有一些索引和列重叠我创建了一个数据框df索引和列的并集因此不存在重复的索引或列我想填写数据框df通过以下方式 for x in df index for y in df
Python GTK+ 画布

我目前正在通过 PyGobject 学习 GTK 需要画布之类的东西我已经搜索了文档发现两个小部件似乎可以完成这项工作 GtkDrawingArea 和 GtkLayout 我需要一些基本函数如 fillrect 或 drawline
为 illustrator 导出脚本以保存为 web jpg

任何人都可以帮我为 illustrator CC2017 编写一个脚本将文件以 JPG 格式导出到网络旧版然后保存文件并关闭我有 700 个文件每个文件有 2 个画板单击文件 gt 导出 gt 另存为 Web 旧版然后右键文
Protobuf 如何编码 oneof 消息结构

对于这个 python 程序在编码时运行 protobuf 编码会给出以下输出 0a 10 08 7f8a 0104 08 02 10 0392 0104 08 02 10 03 18 01 我不明白的是为什么8a后面有一个01 为什么9
有没有办法阻止 prettier / prettier-now 将函数参数分解为新行

当使用 prettier prettier now 在保存时进行格式化时当一个函数包装另一个函数时它会中断到一个新行我想知道是否有办法阻止这种行为例如期望的输出 app get campgrounds id catchAsync
Javascript转换时区问题

我在转换当前时区的日期时间时遇到问题我从服务器收到此日期字符串格式为 2015 10 09T08 00 00 这是中部时间但是当我使用 GMT 5 中的 new Date strDate 转换此日期时间时它返回给我的信息如下这是不
Python：Goslate 翻译请求返回“503：服务不可用”[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我们不允许提出寻求书籍工具软件库等推荐的问题您可以编辑问题以便用事实和引文来回答这个问题似乎不是关于主要由程序员使用的特定编程问
Safari 支持 JavaScript window.onerror 吗？

我有一个附加到 window onerror 的函数 window onerror function errorMsg url line window alert asdf 这在 firefox chrome 和 IE 中工作正常但在 s
如何更改此 jquery 插件的时区/时间戳？

我正在使用这个名为 timeago 的插件在这里找到 timeago yarp com 它工作得很好只是它在似乎不同的时区运行我住在美国东部费城时区当我将准确的 EST 时间放入 timeago 插件时比如 2011 05 28
JQuery 图像上传不适用于未来的活动

我希望我的用户可以通过帖子上传图像因此每个回复表单都有一个上传表单用户可以通过单击上传按钮上传图像然后单击提交来提交帖子现在我的上传表单可以上传第一个回复的图像但第二个回复的上传不起作用我的提交过程 Ajax 在 php 提交
将索引与值交换的最快方法

考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并
Mongoose - 查询从多个集合中获取数据

我想要获取猫鼬的查询在 Node js 应用程序中如下所述输出 user js comment js 和 post js 是我使用的模型文件 user js var mongoose require mongoose var Schema
使用 Ajax 请求作为源数据的 Jquery 自动完成搜索

我想做的事我想使用 jquery 自动完成函数创建一个输入文本字段该函数从跨域curl 请求获取源数据结果应该与此示例完全相同 CSS 在这里并不重要 http abload de img jquerydblf5 png http a
pymongo MongoClient 连接到 ReplicaSet

我采用 pymongo 的 MongoClient 类来连接到具有三个节点 1 个主节点 2 个辅助节点的副本集代码片段如下 c MongoClient secondary1 hostname secondary2 hostname r
NLTK：查找单词大小为 2k 的上下文

我有一个语料库我有一个词对于语料库中该单词的每次出现我想获取一个包含该单词之前的 k 个单词和该单词之后的 k 个单词的列表我在算法上做得很好见下文但我想知道 NLTK 是否提供了一些我错过的功能来满足我的需求 def size

随机推荐

Delphi XE5 REST/Android 客户端“会话已过期”

我有一个REST Server与Android Client 都在Deplhi Xe5 Android客户端成功连接Rest服务器在我的服务器中我有一个TDSHttpWebDispatcher with SessionTimeout 12
在 Akka/Scala 中使用带有 future 的 mapTo

我最近开始使用 Akka Scala 编码遇到了以下问题通过范围内的隐式转换例如 implicit def convertTypeAtoTypeX a TypeA TypeX TypeX just some kinda convers
如果部署目标 < 基础 sdk，如何检查是否使用了不可用的方法？

我想知道当部署目标低于基础 SDK 时您如何检查代码是否不调用不可用的方法可以在 SDK 等于部署目标的设备上运行应用程序但我搜索一种更自动的方式任何想法问候昆汀最简单的方法是使用 IPHONE OS VERSION MA
为什么我的 Cordova/PhoneGap iOS 应用程序在设备旋转时不旋转？

我正在尝试做一个仅横向应用程序 https stackoverflow com questions 10996676 phonegap page has wrong rotation shows as portrait in landsca
Angular 7通过调用两次服务订阅方法进行通信

我正在使用角度尝试与非父子组件进行通信所以我通过服务来传达它服务 ts Istoggle false Output change EventEmitter lt boolean gt new EventEmitter toggle t
如何在 LINQ 中执行 String.Replace？

这是我正在尝试做的事情但没有成功我想打电话from x in list1 and join y in list2 where regex Match x Value Success 完成这些步骤后我需要打电话String Replace
AVAudioRecorder 标准化音量

我有一个可以录制音频的应用程序我想知道如何才能增加增益有没有办法标准化音频或以某种方式放大它谢谢豪伊看来我找到了解决方案根据文档 AVAudioPlayer 音量可以在 0 0 到 1 0 之间显然它可以设置为大于1 0的值
C 或 C++ 中未初始化的指针有用途吗？

在其中一篇评论中这个问题 https stackoverflow com questions 1910832 c why arent pointers initialized with null by default 有人指出默认初始化 C
Kafka：隔离级别的影响

我有一个用例我需要 Kafka 分区中的 100 可靠性幂等性无重复消息以及顺序保留我正在尝试使用事务 API 来建立概念验证来实现这一目标有一个名为 isolation level 的设置我很难理解 In this arti
为什么要使用除 div 以外的任何东西？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
我想创建处理程序来捕获 Tomcat 上 Web 应用程序的所有日志，并且

我想创建处理程序来捕获 Tomcat 上 Web 应用程序的所有日志我创建了我的 Handler 类编译它并安装 CATALINA HOME lib and common loader有这个目录之后我修改了logging proper
使用 AngularFire 从 Firestore 过滤数据

我正在尝试使用 Angularfire 的查询集合从 Firestore 过滤数据 https github com angular angularfire2 blob master docs firestore querying coll
Android ListView数组索引过滤后越界

我认为这是专家的问题我接到电话getView with positon 出界来自ListView数据列表当我使用适配器过滤器时会发生这种情况过滤器publishResults 方法使用小于原始列表的过滤列表填充数据当新的过滤列表时似
Django 管理中的自定义验证

我有一个非常简单的 Django 应用程序用于记录同事的讲座由于它非常初级所以我使用 Django 管理本身这是我的 models py models py from django db import models class Le
使用 JavaScript 动态创建复选框？

我正在尝试使用以下 HTML JavaScript 动态创建一个复选框有什么想法为什么它不起作用吗 div div
SSIS：如何将项目连接管理器移动到包中

我有一个 2012 SSIS 项目其中在项目级别定义了许多连接管理器该项目还包括许多引用这些连接管理器的包现在我想将我的项目转换为部署模型但向导指定我需要删除项目中的连接管理器这意味着将连接管理器移动到包中如何将项目级连接管理器
Docker 容器在 systemd 启动后关闭

由于某种原因当使用 systemd 单元文件时我的 docker 容器会启动但会立即关闭我尝试查找日志但看不到任何有关发生这种情况的原因的指示有没有人知道如何解决这个问题找到显示正在发生的情况的日志注意当使用 docker
为什么 webkit 径向渐变在 Safari 中不起作用？

这在 Chrome 中有效但在 Safari 中无效 background webkit radial gradient center ellipse cover fdfdfd d3d3d3 我该如何修复 Safari 的问题它甚至在
Bash - 在 perl 正则表达式中使用变量以及匹配组

这是我在 stackoverflow 上的第一篇文章如果我错过了一些重要的内容请原谅我我目前遇到以下问题目标是根据我准备的文件列表动态替换端口号find 这些文件中的所有端口均以数字 4 开头有 5 位数字现在是棘手的部分我只
使用 Javascript 和 Mongodb 对时间序列数据重新采样

时间序列数据的数据集需要从具有不规则时间间隔的数据集转换为规则时间序列可能使用插值和重采样蟒蛇的pandas Dataframe resample http pandas pydata org pandas docs stable ge

使用 Javascript 和 Mongodb 对时间序列数据重新采样

使用 Javascript 和 Mongodb 对时间序列数据重新采样 的相关文章

随机推荐

热门标签

使用 Javascript 和 Mongodb 对时间序列数据重新采样的相关文章