基于时间间隔 + 或 - 日期列表的子集 data.frame

2023-12-21

我有一个大型（20,000 个 obs）data.frame，其中包含每小时值并按唯一 id 分组。我还有一个日期列表（每个日期都出现在 data.frame 中）。我试图将日期与 data.frame 匹配，然后从匹配日期中提取 + 或 – 某个时间间隔之间的日期时间。例如，在以下 data.frame 中：

 setAs("character","myDate", function(from) as.POSIXct(from, "%m/%e/%Y    %H:%M", tz="UTC")) 
# previous function formats date input as UTC 
   df <- read.table(textConnection("datetimeUTC id  value
                             '5/1/2013 5:00'    153 0.53
                            '5/1/2013 6:00'     153 0.46
                            '5/1/2013 7:00'     153 0.53
                            '5/1/2013 8:00'     153 0.46
                            '5/1/2013 9:00'     153 0.44
                            '5/1/2013 10:00'    153 0.48
                            '5/1/2013 11:00'    153 0.49
                            '5/1/2013 12:00'    153 0.49
                            '5/1/2013 13:00'    153 0.51
                            '5/1/2013 14:00'    153 0.53
                            '11/24/2013 9:00'   154 0.45
                            '11/24/2013 10:00'  154 0.46
                            '11/24/2013 11:00'  154 0.49
                            '11/24/2013 12:00'  154 0.55
                            '11/24/2013 13:00'  154 0.61
                            '11/24/2013 14:00'  154 0.7
                            '11/24/2013 15:00'  154 0.74
                            '11/24/2013 16:00'  154 0.78
                            '11/24/2013 17:00'  154 0.77
                            '11/24/2013 18:00'  154 0.79
                            '8/2/2015 1:00'     240 0.2
                            '8/2/2015 2:00'     240 0.2
                            '8/2/2015 3:00'     240 0.2
                            '8/2/2015 4:00'     240 0.22
                            '8/2/2015 5:00'     240 0.22
                            '8/2/2015 6:00'     240 0.27
                            '8/2/2015 7:00'     240 0.23
                            '8/2/2015 8:00'     240 0.21
                            '8/2/2015 9:00'     240 0.22
                            '8/2/2015 10:00'    240 0.22
                            '8/2/2015 11:00'    240 0.21
                            '8/2/2015 12:00'    240 0.21
                            '8/2/2015 13:00'    240 0.21
                            '8/2/2015 14:00'    240 0.22
                            '8/2/2015 15:00'    240 0.24
                            '8/2/2015 16:00'    240 0.25
                            '8/2/2015 17:00'    240 0.12
                            '8/2/2015 18:00'    240 0.32
                            "), header=TRUE, colClasses=c("myDate", "character", "numeric"))

我想为每个 id 提取该键中匹配日期时间之前或之后 2 小时的所有观察结果：

  key <-read.table(textConnection("
     datetimeUTC        id
    '5/1/2013 9:00'     153
    '11/24/2013 14:00'  154
    '8/2/2015 5:00'     240
    '8/2/2015 15:00'        240"), header=TRUE, colClasses=c("myDate",  "character"))

期望的结果如下：

  result <- read.table(textConnection("datetimeUTC  id  value
                            '5/1/2013 7:00'     153 0.53
                            '5/1/2013 8:00'     153 0.46
                            '5/1/2013 9:00'     153 0.44
                            '5/1/2013 10:00'    153 0.48
                            '5/1/2013 11:00'    153 0.49
                            '11/24/2013 12:00'  154 0.55
                            '11/24/2013 13:00'  154 0.61
                            '11/24/2013 14:00'  154 0.7
                            '11/24/2013 15:00'  154 0.74
                            '11/24/2013 16:00'  154 0.78
                            '8/2/2015 3:00'     240 0.2
                            '8/2/2015 4:00'     240 0.22
                            '8/2/2015 5:00'     240 0.22
                            '8/2/2015 6:00'     240 0.27
                            '8/2/2015 7:00'     240 0.23
                            '8/2/2015 13:00'    240 0.21
                            '8/2/2015 14:00'    240 0.22
                            '8/2/2015 15:00'    240 0.24
                            '8/2/2015 16:00'    240 0.25
                            '8/2/2015 17:00'    240 0.12
                            "), header=TRUE, colClasses=c("myDate", "character", "numeric"))

似乎是一个简单的任务，但我似乎无法得到我想要的。我尝试过的一些事情。

result <-df[which(df$id == key$id &(df$datetimeUTC >= key$datetimeUTC -2*60*60 |df$datetimeUTC <= key$datetimeUTC + 2*60*60 )),]

 library(data.table)
  dt <- setDT(df)
  dt[dt$datetimeUTC %between% c(dt$datetimeUTC - 2*60*60,dt$datetimeUTC +   2*60*60) ]

几个data.table为您提供解决方案

1.笛卡尔连接

将它们全部连接在一起，然后过滤掉您不想要的

library(data.table)
dt <- as.data.table(df)
dt_key <- as.data.table(key)

dt_join <- dt[ dt_key, on="id", allow.cartesian=T][difftime(i.datetimeUTC, datetimeUTC, units="hours") <= 2 & difftime(i.datetimeUTC, datetimeUTC, units="hours") >= -2]

 #          datetimeUTC  id value       i.datetimeUTC
 #1: 2013-05-01 07:00:00 153  0.53 2013-05-01 09:00:00
 #2: 2013-05-01 08:00:00 153  0.46 2013-05-01 09:00:00
 #3: 2013-05-01 09:00:00 153  0.44 2013-05-01 09:00:00
 #4: 2013-05-01 10:00:00 153  0.48 2013-05-01 09:00:00
   ... etc

2. 每个 I 的条件

利用一个答案 https://stackoverflow.com/a/32011937/4002530对于我之前的问题之一，请指定条件j that EACHI必须在加入中见面。

dt[ dt_key, 
        { idx = difftime(i.datetimeUTC, datetimeUTC, units="hours") <= 2 & difftime(i.datetimeUTC, datetimeUTC, units="hours") >= -2
        .(datetime = datetimeUTC[idx],
            value = value[idx])
            },
        on=c("id"),
        by=.EACHI]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dataTable

基于时间间隔 + 或 - 日期列表的子集 data.frame 的相关文章

可以明确声明包依赖项的版本吗？

我倾向于对我编写的代码进行明确而不是隐含的描述因此在成功创建自己的包之后我立即想到的下一件事是如何最好地确保代码的健壮性和可靠性其中一部分与我的包所依赖的包有关实际问题在这方面是否可以明确声明需要期望哪个版本的包依赖项我正
如何使用 r 中的 caret 包在最佳调整超参数的 10 倍交叉验证中获得每次折叠的预测？

我试图使用 R 中的插入符包使用 10 倍交叉验证和 3 次重复来运行 SVM 模型我想使用最佳调整的超参数获得每次折叠的预测结果我正在使用以下代码 Load packages library mlbench library caret
将summary()写入as.data.frame以在ggplot / R中使用

请查找 af 数据样本t below 我正在使用以下方法进行竞争风险分析etmCIF来自etm package 产生以下结果这很好但需要更好的图形曾经有一个ggtrans etm函数将数据导入ggplot 然而这个功能显然被删除了
R 中的 NA 替换函数

我正在尝试替换矩阵中的 NA mat 零我在用着mat is na mat lt 0 当我有 18946 个变量的 94531 个观察值或更小的矩阵时效果很好但我在 22752 个变量的 112039 个观察值的矩阵上尝试它 R 显示
将值替换为其各自列的名称

我有一个数据框 Code 401k CVS 101A true 231N true FD54 true 99JB 85F4 true 我试图用相应的列名称例如 401k 替换 true 字符值这是我想要的输出 Code 401k CVS
C# 优化：向数据库插入 2 亿行

我有以下简化的代码我想优化速度 long inputLen 50000000 50 million DataTable dataTable new DataTable DataRow dataRow object objectRow
限制数据框中所有单元格的字符串长度？

您好有没有一种方法可以限制 data frame 中所有列的字符串文本大小而不必循环遍历每一列并一次使用 str trunc 之类的东西例如下面的数据框我可以将所有文本大小限制为仅 5 个字符而不必一次只执行一列吗如果有 50
如何获得属于五分位数的x？

我正在大学学习使用 R 进行计量经济学项目所以请原谅我的笨拙基本上使用并给出一个矩阵股票价格行天列公司股票价格另一个矩阵市值行天列公司市值我必须收集第三个矩阵每天观察的属于市值分布第一五分位数的股票价格然后
从 R 环境中删除对象

我正在阅读 Hadley 的 Advanced R 在第 8 章中他说我们可以使用以下方法从环境中删除对象 rm 但是移除该物体后我仍然可以看到该物体这是我的代码 e lt new env e a lt 1 e b lt 2 e a
如何更改 Shiny 中 navbarPage 折叠的断点

我想用shiny navbarPage collapsible TRUE 当在小屏幕上查看我的 Shiny 应用程序时将导航元素折叠到菜单中默认情况下当浏览器宽度小于 940 像素时会触发折叠有什么方法可以改变这一点以便在稍大的浏
R 更改小数位且不四舍五入

gt signif 1 89 digits 2 1 1 9 我想要1 8 这有点笨拙但它会起作用并保持所有数字 x lt 1 829380 trunc dec lt function x n floor x 10 n 10 n Resul
解析，用三点参数替换

让我们考虑一个典型的deparse substitute R call f1 lt function u x y print deparse substitute x varU vu varX vx varY vy f1 u varU x
如何按 data.table 中的十分位数组计算统计数据

我有一个 data table 想按组计算统计数据 R set seed 1 R DT data table a rnorm 100 b rnorm 100 这些组应该定义为 R quantile DT a probs seq 1 9 1
C# 问题：加载 .MDB 文件、对其进行更改并将更改保存回原始文件的最简单方法是什么？

我正在进行的项目即将完成我正在加载一个 MDB 文件在 DataGrid 上显示内容并尝试在 DataGrid 上获取这些更改并将它们保存回 MDB 文件中我还将创建一个函数允许我从一个 MDB 文件中获取表并将其保存到另一个 M
R：表格格式

我有一个包含以下列的 Excel 文件 Column1 Column2 Column3 ab bb 0 5 ab bc 0 1 ab cd 0 7 ab dd 0 8 ac bb 0 2 ac bg 0 8 ac ee 0 8 ac dd
R 中的字符串作为函数参数

数据框chocolates列出了糖果的类型以及每种糖果的一组评级 ID sweetness filling crash snickers 0 67 0 55 0 40 milky way 0 81 0 53 0 56 我正在编写一个函数它
r 中的 5 维图

我正在尝试在 R 中绘制 5 维图我目前正在使用rgl包以 4 个维度绘制数据使用 3 个变量作为 x y z 坐标另一个变量作为颜色我想知道是否可以使用这个包添加第五个变量例如空间中点的大小或形状这是我的数据和当前代码的示例
带 R 的多彩标题

我想添加颜色某些词在我的图表标题中我已经能够在这里找到一些先例 http blog revolutionanalytics com 2009 01 multicolor text in r html 具体来说我希望用撇号括起来的文本在
表单提交时出现 rvest 错误

我想从以下网页中抓取数据 https swgoh gg u zozo collection 180 emperor palpatine https swgoh gg u zozo collection 180 emperor palpati
使用 dplyr::filter 的整洁方式是什么？

使用下面的函数调用foo c b 输出以内联方式显示正确的写作方式是什么df gt filter x gt x 我已经包含了一个使用的示例mutate以整洁的风格与之对比filter foo lt function variables x

随机推荐

无法导入名称 izip [重复]

这个问题在这里已经有答案了我正在尝试使用以下代码从 csv 文件转置矩阵 import csv from itertools import izip a izip csv reader open TDM csv rb csv writer
InAppBrowser 仅在我的域已打开时允许导航

我知道有一千个线程在谈论这个话题但事实是真正阅读它们并执行它们所说的内容我找不到关键而且我已经阅读并尝试了很多我的问题如下我正在使用 InAppBrowser 模块 InAppBrowser from ionic native
无法使用 Visual Studio 2010 Express 配置 CMake

有人可以帮助我吗我正在尝试使用 Visual Studio 2010 Express 配置 CMake 但失败了整个错误消息如下 C 编译器标识为 MSVC 16 0 30319 1 CXX 编译器标识是 MSVC 16 0 3031
ExpressJS 中的路由处理程序和中间件函数有什么区别？

我的理解是中间件函数是一个路由处理程序但它可以调用下一个函数参数以将控制权传递给堆栈上的中间件函数这是标准路由处理程序和中间件函数之间的唯一区别吗你所说的大部分内容都是语义在 ExpressJS 中中间件可以是路由处理程序或者
防止脚本在页面刷新时重新执行操作

我正在构建自己的php cart在过去的一周里我陷入了一些问题我成功在购物车中添加了新商品 URL 如下所示 http blah blah com order index php action add id 84 问题很简单如何防止在
雅虎财经有数据请求上限吗？有替代方案或解决方法吗？

你好呀我已扫描此网站和 Google 以获取有关从雅虎财经下载股票信息的最新更新我没有取得太大的成功当我测试我的应用程序时我使用以下 C 代码片段遇到了 404 服务器未找到异常 string urlTemplate http ic
如何打开文件浏览器？（安卓SDK）

如何使用 Android SDK 打开文件浏览器如文件管理器是否有某种意图或其他目的不幸的是没有内置的方法可以做到这一点您可以尝试使用OI 文件管理器 http openintents org en filemanager 它非常
xmllint：非根 xml 元素上的 xmlns？

xmllint xpath project test xml fails on
JDK 对实体扩展的限制

我在转换大型 XML 文档期间收到此错误消息 JAXP00010001 解析器在本文档中遇到了超过 64000 个实体扩展这是 JDK 施加的限制 Googled and learned about limits http docs or
如何在 Maven 中启动单个目标/执行

目前我正在调试 Android 应用程序的签名如果我可以执行这个唯一的插件这会容易得多
Java openCV - 将位图转换为 Mat 时出错

我正在使用 Java openCV 我尝试加载一张照片并对其运行模板匹配模板匹配方法处理Mat对象所以我需要加载图像并将它们转换为Mat 我这样做的方法是 Bitmap i BitmapFactory decodeFile sdcard
将 JSplitPane 与 AWT 组件结合使用

我有一个 AWT 画布无法将其转换为 Swing 组件它来自VTK http www vtk org 我希望在 JSplitPane 中显示其中一些画布我读过有关在 Java 中混合重型和轻型组件的内容并且知道这是一件令人痛苦的事情
Google Apps 脚本在 Javascript 中获取 iFrame 的父 URL

我搜索了很多论坛并且非常有信心这将是否但我想我会将其向社区开放以防万一我的任务是在 Google 协作平台页面上创建一个工具用于记录员工访问页面后的访问时间它有助于确认文档访问和活动日志的合规性如果 iFrame 与其托管页
Bitbucket 服务器：在推送修改特定文件夹内文件的提交时发送电子邮件

当有人推送一个或多个修改文件夹内文件的提交时有什么方法可以发送电子邮件吗我有一个文件夹其中包含的文件包含在大多数提交中不应更改的通用代码但是如果有人对这些文件进行更改我想触发电子邮件松弛通知可以用BitBucket服务器来做
这在xsl中代表什么？匹配=“@*|节点（）”

谁能解释一下这在xsl中意味着什么每个表达式到底代表什么
你能通过javascript检测PC上是否启用了Cleartype吗？

一些 font face字体在非cleartype设置下效果不佳边缘变得非常不稳定有没有办法通过 javascript 检测到这一点以便我可以在清除类型关闭的情况下向正文添加现代化风格的类以便我可以在 CSS 中使用它在 IE 6
无法在 Firebase 中注册用户错误不变违规：“new NativeEventEmitter()”需要非空参数。，js 引擎：hermes

我正在尝试构建一个使用 React Native 创建的应用程序并且我使用了 react native firebase app 17 5 0 react native firebase auth 17 5 0 react native
在 Python 3 中导入 .dat 文件

我想导入一个 dat文件包括 lines header numbers lines 像这个例子 start using data to calculate something x y z g h 1 4 6 8 3 4 5 6 8 9 2
Chrome 中“transform-origin”无效？

我的 Chrome 控制台返回Invalid CSS property name to a transform origin站点加载时的 CCS 属性即使它可以工作并且我有一个 webkit 带前缀的版本目标 CSS 如下所示 webk
基于时间间隔 + 或 - 日期列表的子集 data.frame

我有一个大型 20 000 个 obs data frame 其中包含每小时值并按唯一 id 分组我还有一个日期列表每个日期都出现在 data frame 中我试图将日期与 data frame 匹配然后从匹配日期中提取或某个时

基于时间间隔 + 或 - 日期列表的子集 data.frame

基于时间间隔 + 或 - 日期列表的子集 data.frame 的相关文章

随机推荐

热门标签