如何在R中通过ID计算日期之间的平均差异

2023-12-14

我有如下数据集,我想计算每个唯一 id 的平均时间差

data:
   membership_id created_date 
1       12000000 2015-01-20   
2       12000001 2012-11-19   
3       12000001 2013-10-07   
4       12000001 2014-03-06   
5       12000001 2015-01-14   
6       12000003 2013-02-08   
7       12000003 2014-03-06
8       12000000 2014-02-05
9       12000000 2012-01-06

从上面的数据集中,我想计算每个唯一 ID 的日期之间的平均时间差

TRIED:

 library(plyr)
 data =data[order(data$membership_id,data$created_date),]
 result = ddply(data,.(membership_id),summarize, avg =  as.numeric(mean(diff(created_date))))

当我应用小数据时,上面的代码工作正常,但我的数据集有 500 万行,并且花费了大量时间,而且仍然从过去 6 小时开始运行

预期输出:

  membership_id  avg_time_diff
 1 12000000       76 days
 2 12000001       56 days
 3 12000003       54 days

来自(哪里plyr,你可能可以很容易地过渡到dplyr。它不会像数据表那么快,但它会much比...快ddply.

dat %>% group_by(membership_id) %>%
    arrange(created_date) %>%
    summarize(avg = as.numeric(mean(diff(created_date))))
# Source: local data frame [3 x 2]
#
#   membership_id   avg
#           (int) (dbl)
# 1      12000000   555
# 2      12000001   262
# 3      12000003   391

无需任何更多的实际努力,您可以通过转换为更快的速度data.table对象但仍然使用dplyr命令。纯的data.table仍然会更快。

(使用此数据)

dat = structure(list(membership_id = c(12000000L, 12000001L, 12000001L, 
12000001L, 12000001L, 12000003L, 12000003L, 12000000L, 12000000L
), created_date = structure(c(16455, 15663, 15985, 16135, 16449, 
15744, 16135, 16106, 15345), class = "Date")), .Names = c("membership_id", 
"created_date"), row.names = c("1", "2", "3", "4", "5", "6", 
"7", "8", "9"), class = "data.frame")
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何在R中通过ID计算日期之间的平均差异 的相关文章

  • 在 ifelse() 语句内部和外部运行一行时的不同输出

    我正在尝试运行一个简单的命令 但不知道为什么在内部和外部运行它时输出不同ifelse 功能 函数条件评估为FALSE 所以输出应该完全相同 但是 单独运行时 输出为0 0 1 1 0 1 0 1 NA 根据需要 但是从ifelse 函数 输
  • 麦当劳 omega:R 中的警告

    我正在计算几种不同尺度的欧米茄 并在 R 中使用不同的 omega 函数获取不同比例的不同警告消息 我的问题是如何解释这些警告以及报告检索到的 omega 统计数据是否安全 当我使用 从 alpha 到 omega 内部一致性估计普遍问题的
  • 在 R 中绘制逻辑回归的两条曲线

    我正在 R glm 中运行逻辑回归 然后我设法绘制结果 我的代码如下 temperature glm glm Response Temperature data mydata family binomial plot mydata Temp
  • 什么时候在“strsplit”中设置“perl=TRUE”不起作用(按预期或根本不起作用)?

    我只是在尝试优化一些代码时做了一些基准测试并观察到strsplit with perl TRUE is faster比跑步strsplit with perl FALSE 例如 set seed 1 ff lt function paste
  • Rstudio 中的 Sweave — pdf 中没有显示任何图

    这里是 Sweave Latex 新手 我在生成常规函数输出时没有问题 但绘图没有显示 这是一个基本示例 documentclass article begin document SweaveOpts concordance TRUE lt
  • R:大向量的高效迭代子集和过滤

    我想更快地执行以下操作 Logic 我有一个向量big共 4 个元素1 2 3 4 我还有一个相同长度的阈值向量1 1 3 1 4 1 5 1 我希望每个元素找到第一个元素的索引next元素高于相应的阈值 在这种情况下 我的预期输出是 2
  • 查找嵌套列表中元素的索引?

    我有一个类似的列表 mylist lt list a 1 b list A 1 B 2 c list C 1 D 3 是否有一种 无循环 方法来识别元素的位置 例如如果我想用 5 替换 C 的值 并且在哪里找到元素 C 并不重要 我可以这样
  • 可以明确声明包依赖项的版本吗?

    我倾向于对我编写的代码进行明确而不是隐含的描述 因此 在成功创建自己的包之后 我立即想到的下一件事是如何最好地确保代码的健壮性和可靠性 其中一部分与我的包所依赖的包有关 实际问题 在这方面 是否可以明确声明需要 期望哪个版本的包依赖项 我正
  • 如果“testthat”测试在“R”中失败,则打印自定义诊断信息

    I use a testthat单元测试来检查是否data frame函数返回的结果与我期望它返回的结果相同 如果测试失败 testthat打印一些诊断信息 例如 MyFunction df orig is not identical to
  • 如何生成向量的所有组合[重复]

    这个问题在这里已经有答案了 假设我有 3 个绿球 2 个橙球和 8 个黄球 我想订购它们 鉴于所有相同颜色的球都是相同的 如何生成所有可能的序列 在 R 中 使用gregmisc 我可以 balls lt c orange orange g
  • 分离并重新附加“tools:rstudio”

    又名玩火 以下不起作用 rstd obj lt as environment tools rstudio detach tools rstudio attach rstd obj name tools rstudio 好吧 它似乎有效 但随
  • 将 JSON URL 转换为 R 数据帧

    我在将 JSON 文件 从 API 转换为 R 中的数据帧时遇到问题 例如 URL 我尝试了 S O 的一些不同建议 包括将json数据转换为R中的数据框 https stackoverflow com questions 28683769
  • R-了解 akima::interp 结果中的 NA 值

    我有以下数据框 ref dat k Intensity Slope 1 0 021467214 33 16 2 0 012444759 33 8 3 0 006079156 33 4 4 0 003792025 33 2 5 0 02276
  • 将值替换为其各自列的名称

    我有一个数据框 Code 401k CVS 101A true 231N true FD54 true 99JB 85F4 true 我试图用相应的列名称 例如 401k 替换 true 字符值 这是我想要的输出 Code 401k CVS
  • 如何使用 R 中带引号的字符值内的序列读取 CSV?

    这是一个包含两个字符列的 CSV 文件 key value a 所有字符值都用双引号引起来 并且有一个顺序 在值之一内 转义引号加分隔符 我无法通过 read csv readr 中的 read csv 或 data table 中的 fr
  • 在函数内部调用 clusterApply 时,性能会下降

    我遇到了一个奇怪的问题clusterApply 我已经能够尽可能地隔离它 如下所示 首先 我从全局环境运行以下代码 require parallel cl lt makeCluster rep localhost 20 SOCK xl lt
  • R 中的发散积分可在 Wolfram 中求解

    我知道我以前问过同样的问题 但由于我是新来的 这个问题问得不好而且不可重现 因此我在这里尝试做得更好 如果我只编辑旧的 可能没有人会读它 我有一个想要积分的二重积分 ff lt function g t exp 16 g exp 8 t t
  • 错误:“rjags”的包或命名空间加载失败

    在终端的 conda 环境之一中 我能够成功安装包 rjags 但是 当我在该环境中运行 R 并运行库 rjags 时 出现以下错误 加载所需的包 coda 错误 rjags 的包或命名空间加载失败 rjags 的 loadNamespac
  • 根据另一列中的键累积一列中的值时出现问题

    我有一个看起来像这样的数据框 我需要使用 PROJ ID 列中的字符串创建一个新的值列 并形成 PROJ NAME 列中的值字符串 这里提供的解决方案 根据 r 中另一列的键累积一列中的值 https stackoverflow com q
  • 如何更改 Shiny 中 navbarPage 折叠的断点

    我想用shiny navbarPage collapsible TRUE 当在小屏幕上查看我的 Shiny 应用程序时 将导航元素折叠到菜单中 默认情况下 当浏览器宽度小于 940 像素时会触发折叠 有什么方法可以改变这一点 以便在稍大的浏

随机推荐

  • 字符串值到字节数组而不进行转换

    我试图将字符串的值放入字节数组中而不更改字符 这是因为字符串实际上是数据的字节表示 目标是将输入字符串移动到字节数组中 然后使用以下方法转换字节数组 string result System Text Encoding UTF8 GetSt
  • 方法重载是否被视为多态? [关闭]

    Closed 这个问题是基于意见的 目前不接受答案 方法重载是否被视为多态性的一部分 多态性有不同类型 重载多态性 也称为临时多态性 压倒一切的多态性 所以是的 它是多态性的一部分
  • 使用 Java 对 LPT 端口进行编程。真的吗?

    状况 OS is Windows XP have LPT port LED 灯泡连接到LPT port 必要的 使用Java使灯泡闪烁 是否可以 对真实 经过验证的解决方案感兴趣 有人这样做过吗 我有几个选择 使用javax comm an
  • Android 无法在外部存储上创建文件

    我想创建一个 txt 文件并将其存储在 Android 手机的外部存储中 我将权限添加到我的 Android 清单中 当我运行代码时 它不会给我任何错误 但文件从未创建 不确定我做错了什么 public void createExterna
  • Rails 3 路由约束和正则表达式

    我正在寻找匹配的模式state city在路径中 除非状态变量等于 auth match state city gt cities index as gt state cities constraints gt state gt auth
  • GCC 的 -Wmaybe-uninitialized 是否会针对基于枚举的 switch 语句使用 -O1 生成虚假警告?

    我有一段以下形式的代码 typedef enum A 1 B EnumType int foo EnumType x int r switch x case A r 1 break case B r 2 break default r 1
  • JDBC总是测试MySQL表的最后一行?

    我有一个 Manager 类 它将数据保存在 SQL 表中 并从 SQL 表中获取结果并测试这些数据 当我运行程序时 将显示一个框架 用于获取 ID 和密码 如果它们正确 则另一个框架将显示但我不知道为什么它只测试 SQL 表的最后一行 我
  • 当我删除标记所在的行时让vim保留标记

    当我删除标记所在的行时 如何让 vim 保留标记 即自动将标记移动到标记行的上方或下方的行 也许最简单的方法是当您不想删除它们时使用大写字母标记 如果标记所在的行被删除 它将移至下一行 另一种选择是lockmarks命令 lockmarks
  • python中同一类的实例之间共享变量

    我有一个我需要的课程 第一个实例必须接收一个参数 以下所有实例的此参数都是可选的 如果没有通过那么我将使用之前对象init的参数 为此 我需要在对象之间共享一个变量 所有对象都属于具有相同父级的类 例如 class MyClass shar
  • 如何在 open gl 纹理的 alpha 中编码发射或镜面反射信息

    我有一个带有 UV 贴图的 OpenGL 纹理 我读过有关使用 alpha 通道来存储其他一些值的信息 这样就无需从某处加载额外的地图 例如 您可以在 Alpha 中存储镜面反射信息 光泽度 或发射贴图 因为您只需要一个浮点数 并且不使用
  • PHP函数的范围[重复]

    这个问题在这里已经有答案了 我有一个文件 将我的可重用函数集中到一个文件中 functions php It s include once 在每个需要它的页面上 当我的自定义函数尝试访问其自身范围之外的 MySQL 连接时 我收到错误 来源
  • 带有函数应用的类型化抽象语法树

    我正在尝试编写一个可以表示的类型化抽象语法树数据类型 功能应用 到目前为止我已经 type Expr lt a gt Constant of a Application of Expr lt b gt a gt Expr lt b gt e
  • Appcompat actionbar v21 应用程序图标未显示

    出于材料设计目的 我升级到了 avtionbar app compat v21 但我观察到 与旧的应用程序兼容库相比 它在操作栏中不显示应用程序图标 导航菜单和后退按钮占用了更多空间 有人遇到过这个问题吗 我搜索了很多 但没有发现任何有用的
  • 无法使用 FastAPI 访问或打印任何请求数据

    我有一个简单的 FastAPI 端点 我想在其中接收字符串值 在本例中 我尝试使用 JSON 正文 但基本上不需要是 JSON 我真的只需要一个简单的字符串来将请求彼此分开 不幸的是 我无法使用以下命令访问任何请求参数GET方法 我也尝试过
  • 如何将 Excel 电子表格配置为 javax.sql.DataSource?

    我有一个 Spring Boot 1 3 0 Java 8 应用程序 需要使用 Excel 作为数据源 由于 Excel 文件类型的原因 POI 和 JXL 不起作用 应用程序需要在 unix 环境中运行 我将应用程序配置为通过 yml 文
  • 在 web.config 中保留敏感信息

    将用户名或密码存储在中是否安全web config作为其他参数 例如超时时间在ASP NET MVC应用程序 如果不是 是否可以使这些参数变得安全 以便它们不能被编码在web config文件在发布的服务器上 另一方面 您是否建议将用户名
  • 将 ImageView 保存到 Android 模拟器库

    我想将图像保存到 Android Gallery 这是我当前的代码 image setDrawingCacheEnabled true image buildDrawingCache true Bitmap b image getDrawi
  • 必须声明标量变量

    首先 我创建了一个包含一列的内存表 并使用这些列值与另一个表进行内部联接 这样做时我收到此错误 必须声明标量变量 暂时的 谁能解释一下我哪里出了问题 DECLARE ID INT Declare Temporary Table Accoun
  • fortran 代码中 Rectilinear_grid 的二进制 vtk 无法通过 paraview [重复]

    这个问题在这里已经有答案了 我使用了 stackoverflow 发布的代码并将其修改为 program VTKBinary implicit none real 4 x 2 0 1 real 4 y 2 0 1 real 4 z 2 0
  • 如何在R中通过ID计算日期之间的平均差异

    我有如下数据集 我想计算每个唯一 id 的平均时间差 data membership id created date 1 12000000 2015 01 20 2 12000001 2012 11 19 3 12000001 2013 1