将价格数据聚合到 R data.table 中的不同时间范围

2023-12-21

您好，我希望将 data.table 中的每分钟数据汇总到 5 分钟（或 10 分钟）范围内。我知道通过使用 xts 和 to.mines5 函数可以轻松完成此操作，但我不喜欢在这种情况下使用 xts，因为数据集相当大。有没有一种简单的方法可以在 data.table 中执行此操作？

数据示例：在此示例中，21.30 到 21.34（含）之间的时间段只有一行，其中 t = 21.30、开盘价 = 0.88703、最高价 = 0.88799、最低价 = 0.88702、收盘价 = 0.88798、交易量 = 43（请注意数据来自21.35 本身被忽略）。

                      t    open    high     low   close volume
 1: 2010-01-03 21:27:00 0.88685 0.88688 0.88685 0.88688      2
 2: 2010-01-03 21:28:00 0.88688 0.88688 0.88686 0.88688      5
 3: 2010-01-03 21:29:00 0.88688 0.88704 0.88687 0.88703      7
 4: 2010-01-03 21:30:00 0.88703 0.88795 0.88702 0.88795     10
 5: 2010-01-03 21:31:00 0.88795 0.88795 0.88774 0.88778      7
 6: 2010-01-03 21:32:00 0.88778 0.88778 0.88753 0.88760      8
 7: 2010-01-03 21:33:00 0.88760 0.88781 0.88760 0.88775     11
 8: 2010-01-03 21:34:00 0.88775 0.88799 0.88775 0.88798      7
 9: 2010-01-03 21:35:00 0.88798 0.88803 0.88743 0.88782      8
10: 2010-01-03 21:36:00 0.88782 0.88782 0.88770 0.88778      6

根据 GSee 的要求从 dput(head(myData)) 输出。我想使用 data.table 来存储一些基于此原始数据的更多派生字段。因此，即使我确实使用 xts 来汇总这些价格条，我也必须以某种方式将它们放入数据表中，因此我很感激有关使用 xts 项目保存 data.table 的正确方法的任何提示。

structure(list(t = structure(c(1241136000, 1241136060, 1241136120, 
1241136180, 1241136240, 1241136300), class = c("POSIXct", "POSIXt"
), tzone = "Europe/London"), open = c(0.89467, 0.89467, 0.89472, 
0.89473, 0.89504, 0.895), high = c(0.89481, 0.89475, 0.89473, 
0.89506, 0.8951, 0.895), low = c(0.89457, 0.89465, 0.89462, 0.89473, 
0.89486, 0.89486), close = c(0.89467, 0.89472, 0.89473, 0.89504, 
0.895, 0.89488), volume = c(96L, 14L, 123L, 49L, 121L, 36L)), .Names = c("t", 
"open", "high", "low", "close", "volume"), class = c("data.table", 
"data.frame"), row.names = c(NA, -6L), .internal.selfref = <pointer: 0x0000000000100788>)

您可以使用endpoints函数（用 C 语言编写）来自xts on POSIXt向量。endpoints查找特定时间段内最后一个元素的位置。按照惯例，1:05 不会与 1:00 包含在同一小节中。所以，您提供的数据dputfor（与上面打印的数据不同）将有 2 个条。

假设dt是你的data.table:

library(data.table)
library(xts)

setkey(dt, t)  # make sure the data.table is sorted by time.
ep <- endpoints(dt$t, "minutes", 5)[-1] # remove the first value, which is 0
dt[ep, grp:=seq_along(ep)]              # create a column to group by
dt[, grp:=na.locf(grp, fromLast=TRUE)]  # fill in NAs

dt[, list(t=last(t), open=open[1], high=max(high), low=min(low), 
          close=last(close), volume=sum(volume)), by=grp]

   grp                   t    open   high     low   close volume
1:   1 2009-05-01 01:04:00 0.89467 0.8951 0.89457 0.89500    403
2:   2 2009-05-01 01:05:00 0.89500 0.8950 0.89486 0.89488     36

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将价格数据聚合到 R data.table 中的不同时间范围的相关文章

R中的一元加/减是什么？

来自 R 的详细信息部分Syntax http stat ethz ch R manual R patched library base html Syntax html帮助页面定义了以下一元和二元运算符他们被列出在优先级组中从最高
如何删除箱线图上的刻度线

我试图从箱线图中删除 x 轴刻度线但保留与刻度线关联的标签这在基础 R 中可能吗 colors lt c lightskyblue3 gray78 gold1 wheat1 boxplot avgscore module data mi
我无法下载 R 中的 reshape2 包 [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我在尝试安装 R 包时收到此响应 gt installed packages reshape2 Package LibPath V
通过间接引用列来修改数据框中的某些值

我正在整理一些数据我们将失败的数据分类到垃圾箱中并按批次计算每个分类箱的有限产量我有一个描述排序箱的元表这些行按升序测试顺序排列一些排序标签带有非语法名称 sort tbl lt tibble tribble weight lab
将数据框中的每个 x 个字符拆分为字符串

我知道这里有一些关于每隔一段时间分割一个字符串的答案nth字符例如this one https stackoverflow com questions 23208490 split each character in r and this
如何使用 usmap 标记数字而不是名称？

我知道 usmap 有一个选项label in plot usmap 我想标记一些数字而不是状态名称我想 usmap 中应该有与州质心坐标相关的数据但我不知道如何找到它如果我能得到坐标然后我可以用它来标记数字geom text 这
Dendextend：关于如何根据定义的组为树状图的标签着色

我正在尝试使用一个名为 dendextend 的很棒的 R 包来绘制树状图并根据一组先前定义的组为其分支和标签着色我已阅读您在 Stack Overflow 中的答案以及 dendextend vignette 的常见问题解答但我仍然不
从命令行运行 R 代码 (Windows)

我在名为 analysis r 的文件中有一些 R 代码我希望能够从命令行 CMD 运行该文件中的代码而无需通过 R 终端并且我还希望能够传递参数并在我的代码中使用这些参数例如就像下面的伪代码 C gt execute r scri
R独特的列或行与NA无可比拟

有谁知道如果incomparables的论证unique or duplicated 曾经被实施过incomparables FALSE 也许我不明白它应该如何工作无论如何我正在寻找一个巧妙的解决方案以仅保留与另一列相同的唯一列或行
朴素贝叶斯分类器仅基于先验概率做出决策

我试图根据推文的情绪将推文分为三类买入持有卖出我正在使用 R 和包 e1071 我有两个数据框一个训练集和一组需要预测情绪的新推文训练集数据框 text sentiment this stock is a good buy Bu
将数据框中重叠的范围合并到唯一的组中

我有一个 n 行 3 的数据框 df lt data frame start c 178 400 983 1932 33653 end c 5025 5025 5535 6918 38197 group c 1 1 2 2 3 df sta
ddply 和aggregate 之间的区别

有人可以通过以下示例帮助我了解聚合和 ddply 之间的区别数据框 mydat lt data frame first rpois 10 10 second rpois 10 10 third rpois 10 10 group c re
将阴影区域添加到五分位数之间的直方图中

All 我有一个包含 2 个直方图的图表其中我还绘制了代表第 20 40 60 和 80 个百分位数的线条下面的代码使用虚拟数据重现了类似的图表 data lt rbind data frame x rnorm 1000 0 1 g o
在 r 中的 group_by 之后建模后取消列表列的嵌套

我想对所有组进行线性回归group by 将模型系数保存在列表列中然后使用 unnest 扩展列表列这里我用的是mtcars以数据集为例注我想用do here becausebroom tidy 不适用于所有型号 mtcars gt
如何获得所有大于x且有位置的数字？

V lt c 1 3 2 4 2 3 1 X lt 3 pos lt V V X pos is 3 3 我需要的是所有 3 个的位置 I need 2 and 6 哪些职位是3 in V Use which pos lt which V 3
计算 R 中各列的唯一值

我正在尝试创建一个新变量其中包含来自两个不同列的字符串值的唯一计数所以我有这样的东西例如 A tibble 4 x 2 names partners
所有 x 轴标签未以 45 度显示

I m having the code as like below But I m not getting all the x axis labels and it is not displaying in 45 degree when I
使用 ggmap 截断密度多边形

我在使用 R ggmap 绘制密度图时遇到问题我的数据如下所示 gt head W date lat lon dist 1 2010 01 01 31 942 86 659 292 415 2 2010 01 10 32 970 84 1
如何在将两根柱子保持在一起的同时熔化柱子？

我有这种宽格式的数据我想将其转换为长格式 Cond Construct Line Plant Tube shoot weight shoot Tube root weight root 1 Standard NA NA 2 199 95
如何将plot中的单变量列表图表转换为ggplot2格式？

我正在搜索但仍然找不到一个非常简单的问题的答案我们如何使用 R 中的 ggplot2 生成一个变量的简单线图我正在分析时间序列数据并且想要对图表进行更复杂的操作我认为如果我使用 ggplot2 代替会更好plot It works

随机推荐

复制粘贴到 Python 交互式解释器和缩进中

这段代码文件test py if 1 print foo print bar 可以成功执行execfile test py or python test py 但是当尝试将其复制粘贴到 Python 解释器中时 File
指定的任务可执行位置“...\packages\Microsoft.Net.Compilers.1.3.2\build\..\tools\csc.exe”无效

我将代码从 TFS 下载到了 C 上的一个新文件夹但编译器似乎遇到了问题我删除了 suo 文件但仍然有同样的问题和 68 个警告因为我从未遇到过这样的问题所以我不知道需要在此处发布哪些信息来解决它这就是我在错误列表中看到的内容
MSVC：显式模板实例化失败，而隐式实例化成功

我刚刚遇到了 MSVC 版本 12 更新 5 的问题如果模板函数具有通过 SFINAE 禁用的重载则显式实例化模板函数会失败但是调用该函数从而隐式实例化它是有效的示例代码 include
如何使用Postman将对象上传到Firebase Storage进行测试？

如何使用 postman 将图像上传到 Firebase 云存储以进行测试在这里我们将尝试使用以下命令将图像上传到 Firebase Storage 简单上传请求在谷歌云存储 JSON API 1 您需要在 FireBase 控制台创建
PHP 简单 HTML DOM 解析器的字符编码问题

我正在使用 PHP 简单 HTML DOM 解析器http simplehtmldom sourceforge net 从其他域获取页面标题元描述和元标签等数据然后将其插入数据库但我在编码方面遇到了一些问题问题是我没有从那些非英语网
scala 组合器解析器没有像我想象的那样回溯......

我一直在盲目地盯着自己的这个问题我想这可能是一个真正愚蠢的问题但我必须放下我的骄傲我有这个组合器解析器它不会像我想象的那样回溯我已将其简化为一个小示例但没有完全删除上下文感觉就像 foobar 示例更难阅读我来啦 RunWi
为什么尽管签名中有返回类型，但该方法仍保持动态返回？

因此激活器返回的类型此处未显示只是我创建的 POCO 没什么特别的但尽管如此返回类型GetWrapper or GetWrapper
F# 中的“考虑程序集的 app.config 重新映射...”警告

安装VS11后我开始收到以下错误考虑从版本 2 0 0 0 C Program Files x86 Reference Assemblies Microsoft FSharp 2 0 Runtime v2 0 开始重新映射程序集 FSh
可以在代码中访问身份标签的值吗？

我在界面生成器中有许多标签它们都有自己的身份标签集 Identity inspector gt Identity gt Label 我现在想在我的代码中访问这些标签这通常是可能的还是仅存在于界面生成器中无法访问每个标签Identity
在 Internet Explorer 9 和 Opera 下，在画布中加载图像失败
Hibernate Criteria：区分实体然后限制

我有一个返回应用程序所需的所有数据的标准基本上 Criteria criteria session createCriteria Client class criteria createAlias address address crit
如何为作为 FormData 上传的 Blob 指定文件名？

我目前正在使用以下代码上传从剪贴板粘贴的图像 Turns out getAsFile will return a blob not a file var blob event clipboardData items 0 getAsFile
htmlspecialchars 不允许换行吗？

我在 mysql 字段中出现了与此完全相同的以下内容 Hello there world 当我使用以下代码格式化上述内容时 echo htmlspecialchars thestring 它输出这个 Hello there br br wo
如何进一步增加我的PHP“高级”知识？（快速）[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案 Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的答案或互动
无法测试 should follow_to，Rails 上缺少 id 外键

你好我一直在寻找一种测试模型关系的方法并偶然发现应该宝石 https github com thoughtbot shoulda 应该 3 5 0 应该上下文 1 2 1 应该匹配器 2 8 0 不幸的是我试图用 rspec 测试一个简单
如何在同一项目中定位netcoreapp2.0和net461

我有一个项目想要使用 net core 2 0 我认为它是netcoreapp2 0 它还使用使用 net 4 6 1 创建的 nuget 包我可以控制这个 nuget 包并且可以根据需要更改其中的某些内容它确实将 netstanda
GWT 2.1 地点/活动技术故障：确认导航之前 URL 发生变化

我正在阅读这个谷歌指南 http code google com webtoolkit doc latest DevGuideMvpActivitiesAndPlaces html Views并使用此示例代码由谷歌提供 http code
打开时刷新谷歌表单项列表

我有一个谷歌表单其中包含所有员工的项目列表我从 MySQL 表填充此列表每次打开谷歌表单时我都试图用更新的员工列表刷新表单我有一个打开事件触发器但由于某种原因该列表没有更新请告诉我 function onOpen var fo
C 中 void 和 static void 函数有什么区别？

我有一个两C files file1 c int main func return 0 file2 c static void func void puts func called 但是如果我用命令编译上面的代码cc file2 c fi
将价格数据聚合到 R data.table 中的不同时间范围

您好我希望将 data table 中的每分钟数据汇总到 5 分钟或 10 分钟范围内我知道通过使用 xts 和 to mines5 函数可以轻松完成此操作但我不喜欢在这种情况下使用 xts 因为数据集相当大有没有一种简单的方法

将价格数据聚合到 R data.table 中的不同时间范围

将价格数据聚合到 R data.table 中的不同时间范围 的相关文章

随机推荐

热门标签

将价格数据聚合到 R data.table 中的不同时间范围的相关文章