查找多对矢量化日期之间的日期是否重叠

2024-01-08

我试图找出数据集中多对日期之间是否存在日期 - 我在这里给出的长度只是一个示例，最终的数字可能更大或更小。不确定这是否是最明智的选择，但纵向工作似乎不起作用，这也是在 SPSS 中处理重叠日期和日期对的一种非常常见的方法，其中您可以对多个变量进行数字化，因为日期在这里并且它通过每个编号的“集合”来给您一个响应。

这是一个示例数据集：

  person   key_date 1_end_date 2_end_date 3_end_date 4_end_date 1_start_date 2_start_date 3_start_date 4_start_date
1      1 2019-09-30 2019-05-23 2019-09-30 2016-07-22       <NA>   2019-05-23   2019-09-30   2016-07-22         <NA>
2      2 2019-06-07 2019-05-16 2019-06-07       <NA>       <NA>   2019-05-16         <NA>         <NA>         <NA>
3      3 2020-03-09 2016-06-02 2019-08-09 2020-05-27 2020-02-12   2016-06-02   2019-08-09   2020-05-27   2020-03-09

test <- structure(list(person = 1:3, key_date = structure(c(18169, 18054,18330), class = "Date"), `1_end_date` = structure(c(18039, 18032,16954), class = "Date"), `2_end_date` = structure(c(18169, 18054,18117), class = "Date"), `3_end_date` = structure(c(17004, NA,18409), class = "Date"), `4_end_date` = structure(c(NA, NA, 18304), class = "Date"), `1_start_date` = structure(c(18039, 18032,16954), class = "Date"), `2_start_date` = structure(c(18169,NA, 18117), class = "Date"), `3_start_date` = structure(c(17004,NA, 18409), class = "Date"), `4_start_date` = structure(c(NA,NA, 18330), class = "Date")), row.names = c(NA, 3L), class = "data.frame")

预期的输出只是一个二进制标志来指示key_date存在于任意一对之间start_date and end_date。在给出的例子中，这意味着person1 和 3. 有什么想法如何做到这一点吗？这真的是低效吗？

tidyverse方法

library(tidyverse)
result <- test %>% mutate(across(ends_with("end_date"), ~ 
                         key_date <= . & key_date >= get(str_replace(cur_column(), "end", "start")),
                       .names = '{.col}_flag')) %>%
  rowwise() %>%
  mutate(Flag1 = sum(c_across(ends_with("flag")), na.rm = T)) %>%
  ungroup() %>%
  select(-ends_with("flag"))

> result$Flag1
[1] 1 0 0

完整的输出看起来像

> result
# A tibble: 3 x 11
  person key_date   `1_end_date` `2_end_date` `3_end_date` `4_end_date` `1_start_date` `2_start_date` `3_start_date` `4_start_date` Flag1
   <int> <date>     <date>       <date>       <date>       <date>       <date>         <date>         <date>         <date>         <dbl>
1      1 2019-09-30 2019-05-23   2019-09-30   2016-07-22   NA           2019-05-23     2019-09-30     2016-07-22     NA                 1
2      2 2019-06-07 2019-05-16   2019-06-07   NA           NA           2019-05-16     NA             NA             NA                 0
3      3 2020-03-09 2016-06-02   2019-08-09   2020-05-27   2020-02-12   2016-06-02     2019-08-09     2020-05-27     2020-03-09         0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

查找多对矢量化日期之间的日期是否重叠的相关文章

如何减少 geom_text 重叠

我的数据集包含超过 500 个对各个运动员在不同地点进行的比赛活动的观察结果并在足球比赛期间进行记录下面是我的数据集的示例其中每个符号都指一个匹配活动例如 KE踢有效在 1 分钟时记录Defense Example data df
将逗号类分配给数据框中的多个列

我有一个data frame有几个数字列我要就像分配逗号类一样这是需要的因为我有一个中央数据框我使用 Openxlsx 包过滤并保存到 Excel 并且需要comma类以便数据在excel中显示为逗号格式这是数据框 set
在 R 中打印具有长字符串的数据帧

让我们有一列包含长字符串的数据框 df lt data frame short rnorm 10 0 1 long replicate 10 paste rep sample letters runif 1 5 8 collapse 如何打
在javascript中，如何从日期字符串“yyyy-mm-dd”或时间戳中提取月份？

我有一个数据库其中包含某些以 json 对象形式记录的事件每个事件都有自己的 JS 毫秒时间戳格式为 yyyy mm dd 的日期字符串以及分钟条目我想使用时间戳或日期字符串以更容易的为准作为算法的输入该算法将计算给定月份输入
rvest如何通过id选择特定的css节点

我正在尝试使用 rvest 包从网页中抓取数据简单来说 html 代码如下所示 div class style div
将数字提高到非整数幂时出现奇怪的 NaN [重复]

这个问题在这里已经有答案了我执行了以下代码 tau lt 0 25 h lt 0 6 n 1 5 4 5 dnorm qnorm tau 4 qnorm tau 2 qnorm tau 2 1 2 1 5 R 继续生产NaN 然而 R 实
为什么 statsmodels 和 R 的逻辑回归结果不同？

我正在尝试比较 python 的 statsmodels 和 R 中的逻辑回归实现 Python版本 import statsmodels api as sm import pandas as pd import pylab as pl i
R：大向量的高效迭代子集和过滤

我想更快地执行以下操作 Logic 我有一个向量big共 4 个元素1 2 3 4 我还有一个相同长度的阈值向量1 1 3 1 4 1 5 1 我希望每个元素找到第一个元素的索引next元素高于相应的阈值在这种情况下我的预期输出是 2
dplyr / left_join 中的嵌套管链

在尝试获取分组滞后变量的过程中仅使用这是不可能的 lag 建议的解决方案是将数据拉出滞后不同的行然后重新加入它我更喜欢在不创建中间对象的情况下执行此操作并且希望在链中间执行此操作然而它似乎没有像我预期的那样工作问题似乎是使用
grep() 搜索数据框的列名

有没有更清晰更简单更直接更短的方法来做到这一点其中 df1 是数据框 names df1 grep Yield names df1 我想返回任何包含单词 yield 的列名称 Thanks grep has a value应该适用于
R - 在浏览器中获取帮助而不是内置的 R 帮助程序

我见过 R help 的两种不同行为当你输入 density例如帮助已在您的默认浏览器中打开帮助在内置 R 帮助程序中打开 R 中的窗口我目前有第二种行为但我想在浏览器中打开帮助我可以轻松地在这两种行为之间切换吗无需重新安装
从网络源获取 R 中的数据作为数据框

我正在尝试使用 RCurl 包将一些空气污染背景数据作为 data frame 直接加载到 R 中该网站有 3 个下拉框用于在下载 csv 文件之前选择选项如下图所示我试图从下拉框中选择 3 个值并使用下载 CSV 按钮将数据作
R从列表中提取数据框，列名中没有前缀

我在列表中放置了一个数据框然后当尝试将其提取回来时我得到了该数据帧的所有以列表键为前缀的列名称有没有办法完全按照最初传递的方式提取数据帧 cols lt c column1 Column2 Column3 df1 lt data f
用于清除工作空间和转储存储的 R 全局函数

我希望创建一个全局函数来清除我的工作区并转储我的内存我将我的函数称为 cleaner 并希望它执行以下代码 remove list ls gc 我尝试在全局环境中创建该函数但是当我运行它时控制台仅打印该函数的文本在我要获取的函数文件
分离并重新附加“tools:rstudio”

又名玩火以下不起作用 rstd obj lt as environment tools rstudio detach tools rstudio attach rstd obj name tools rstudio 好吧它似乎有效但随
将 JSON URL 转换为 R 数据帧

我在将 JSON 文件从 API 转换为 R 中的数据帧时遇到问题例如 URL 我尝试了 S O 的一些不同建议包括将json数据转换为R中的数据框 https stackoverflow com questions 28683769
R-了解 akima::interp 结果中的 NA 值

我有以下数据框 ref dat k Intensity Slope 1 0 021467214 33 16 2 0 012444759 33 8 3 0 006079156 33 4 4 0 003792025 33 2 5 0 02276
使用 R 的 flextable 包时，有没有办法将传递给 add_header_lines() 的字符串部分加粗

我正在使用我喜欢的 flextable 包为 Word 文档创建几个表格但是我在将表格标题中的部分文本加粗时遇到了一些麻烦例如我希望标题为 Table 1 我的表格标题的其余部分而不是表 1 我的表格标题的其余部分 I 找到这个
R：将 readRDS 应用于 .Rds 文件名的列表对象

我有几个包含数据帧对象的 Rds 文件我想对每个文件应用一个函数并将数据帧绑定到单个数据帧中但是当我尝试从文件名列表中读取多个 Rds 文件时我收到错误 FUN X i 中的错误从连接读取时出错 readRDS 不适用于列表吗 R
当每个记录都是一个段落并且某些记录有 4 个字段而其他记录有 6 个字段时，如何将文本文件读入 R

如何读取文本文件其中每条记录都是一个段落每个换行符表示单独的字段复杂的是有些记录有 4 行有些记录有 6 行当字段数量的差异为 1 时 DWin 解决了我的问题但当字段数量差异为 2 时一切都崩溃了你可以有一个在这里看看他

随机推荐

在Python中对嵌套列表数据进行排序

我正在尝试对 python 3 8 5 中的嵌套列表进行排序我有一个清单例如 1 A 2 5 45 10 2 B 8 15 65 20 3 C 32 35 25 140 4 D 82 305 75 90 5 E 39 43 89 55
如何添加图像以以编程方式查看？

假设你有一个UIImage image and a UIView v 如何以编程方式在视图顶部显示图像如果你只是想将 UIImage 添加到 UIView 中那么你需要在 UIView 和 UIImage 之间添加一个 UIImageV
Symfony2：仅更新一个供应商包

有没有一种方法可以只更新一个包而不更新 deps 文件中的每个包我目前正在使用 php供应商安装来安装所有供应商捆绑包并且不知道有任何命令一次只更新一个捆绑包 1 只需打开你的 deps 文件 deps 2 删除除要更新的包之外的所有
如何使用 python 在文本文件中添加新行而不使用 \n

我有一个包含文件列表的文件但它添加了 n最后我怎样才能让python只在新行上写下我需要的信息而不得到 n这样我的信息就会被调用X acc not x acc n 这是我写入文件的代码 def add x nl n acc acc xy
队列管理器和消息代理之间的区别

Websphere Message Broker 和队列管理器之间有什么区别我猜队列管理器将消息放入队列从队列中取出消息将消息移动到回退队列等那么代理的工作是什么它位于发布者和队列管理器之间还是消费者和队列管理器之间 Websph
无法单步执行或中断 Linq 查询/表达式内调用的方法

我在尝试进入从 Linq 查询中调用的方法时遇到了一个奇怪的问题尽管我在使用 Linq 表达式时也遇到了这个问题代码可以编译并且看起来可以工作我得到了我期望的结果 IEnumerable
在 WooCommerce 中使 +/- 加号和减号数量按钮以 12 为增量递增

我一直在尝试解决我认为可能很容易解决的问题但我似乎无法在任何地方找到任何信息我的问题是这样的我正在使用 WooCommerce 建立一个批发商店并带有最小最大数量和批发商店插件我想展示一个简单的产品及其单一单价没问题但由于商
如何从 3 个不同的整数（1 个 Oracle Long、1 个日期字段、1 个 Short）创建唯一的整数

问题是第一个数字已经是 ORACLE LONG 第二个是日期 SQL DATE 没有额外的时间戳信息最后一个是 1000 100 000 范围内的 Short 值如何以最佳方式创建每个组合唯一的哈希值字符串连接并稍后转换为例如我
使用 .htaccess 从 Apache 上的 CakePHP 2.x 中删除或添加尾部斜杠

我正在尝试使用位于 htaccess 内的以下内容强制删除或添加尾随斜杠到我的 CakePHP 2 x 应用程序 app webroot
用于包含 Jars 的 Jars 中的类的替换系统类加载器

到目前为止我看到的自定义 ClassLoader 的示例涉及对 URLClassLoader 进行子类化并使用该特定实例来加载资源中的类我徒劳地尝试寻找替代方法来替换 SystemClassLoader 以便可以在我的 ClassLo
访问 R 中的嵌套列表

我为一些数据创建了双层嵌套结构我如何访问第 2 级或第 n 级的数据 library gapminder library purrr library tidyr gapminder nest data lt gapminder gt
元内容位于 MVC 中的什么位置？

我一直在考虑 MVC 中的元内容特别是页面标题和元描述这对于指导 Google 在搜索结果上显示的片段很有用不过我无法就它应该住在哪里做出明确的决定它周围通常有一些逻辑具体取决于对于 UGC 应用程序读者如何与内容交互我无
模仿 Markdown 中的换行符

我有一个 HTML 文本输入
C语言编译后生成的可执行文件可以在任何不同的操作系统（UNIX）上复制并运行吗？

我是一名 java 程序员但我在 C 中要做的事情很少因此我从一个简单的示例开始如下所示如果我编译它并生成可执行文件 hello 我可以在没有原始文件 hello c 的任何unix平台上运行可执行文件 hello 吗还有一种方
是否有仅适用于第一个直接子级的 CSS 选择器？

我有以下html div class section div header div div contents div sub contents 1 div div sub contents 2 div div div 以及以下样式 DIV
android JSONException索引1超出范围[0..1]（在1个循环内解析2个json数组）

我有这样的代码其值jArrAnswer is answer Yes answer No answer maybe answer yrg 结果来自jArrAnswer length is 4 但为什么我收到错误 org json JSONE
Nd4j (Deeplearning4J) 是否太大而无法在 Android 移动应用程序中实际使用？

经过几周的开发我终于在 Android 应用程序中创建了一个 AI 该应用程序使用 Nd4j 库提供的矩阵操作 API 来工作这些都是用gradle导入到项目中的遵循本文档 https deeplearning4j konduit a
从 Django 1.7+ 删除模型时要做的事情

我想知道是否有人可以给出当我们想要从 Django 中删除模型时需要完成的事情的完整列表我知道有人问过类似的问题但这似乎是几年前的事了当时人们还在使用South来处理数据库所以我期待 Django 最新版本的答案我把我所知道的总结
如何在活动文档中加载图像？（Photoshop 脚本）

我是 Photoshop 脚本编写新手我想将图像图像从我的硬盘加载到活动文档中作为具有定位的新图层如何才能做到这一点有人可以分享一下代码吗 Thanks 您可以打开 Photoshop 文件对话框来搜索图像并将其添加到图层中 fi
查找多对矢量化日期之间的日期是否重叠

我试图找出数据集中多对日期之间是否存在日期我在这里给出的长度只是一个示例最终的数字可能更大或更小不确定这是否是最明智的选择但纵向工作似乎不起作用这也是在 SPSS 中处理重叠日期和日期对的一种非常常见的方法其中您可以对多个变量进

查找多对矢量化日期之间的日期是否重叠

查找多对矢量化日期之间的日期是否重叠 的相关文章

随机推荐

热门标签

查找多对矢量化日期之间的日期是否重叠的相关文章