如何检测一列中的更改并标记另一列中的更改

2023-12-24

我试图标记进程何时开始和结束。代码需要检测更改何时开始和何时结束，并在另一列中进行标记。

示例数据：

date  process 
2007     0            
2008     1
2009     1
2010     1
2011     1
2012     1
2013     0

Goal:

date  process        Status
2007     0             NA
2008     1        Process_START
2009     1             NA
2010     1             NA
2011     1             NA
2012     1        Process_END
2013     0             NA

也许通过计算diff并在两个方向上滞后：

dif <- diff(df1$process)
df1$Status <- factor(c(NA, dif) - 2 * c(dif, NA), levels = -3:3)
levels(df1$Status) <- c(rep(NA, 4), "Start", "End", "Start&End")
#   date process Status
# 1 2007       0   <NA>
# 2 2008       1  Start
# 3 2009       1   <NA>
# 4 2010       1   <NA>
# 5 2011       1   <NA>
# 6 2012       1    End
# 7 2013       0   <NA>

Update

不带因素的版本：

dif <- diff(df1$process)
df1$Status <- c(NA, dif) - 2 * c(dif, NA)
df1$Status <- c(rep(NA,4), "Start", "End", "Start&End")[df1$Status + 4]

请注意，如果是单年流程，则有“开始和结束”情况。

Update 2

如果系列以 process = 1 开始（或结束），则预期输出可能不是 NA，而是 Start（或 End）：

dif <- diff(df1$process)
df1$Status <- c(df1$process[1], dif) - 2 * c(dif, -tail(df1$process,1))
df1$Status <- c(rep(NA,4), "Start", "End", "Start&End")[df1$Status + 4]

更复杂的例子：

set.seed(4)
df1 <- data.frame(date = 2007:(2007+24), process = sample(c(0,1, 1), 25, TRUE))

最后一个版本产生：

#    date process    Status
# 1  2007       1 Start&End
# 2  2008       0      <NA>
# 3  2009       0      <NA>
# 4  2010       0      <NA>
# 5  2011       1 Start&End
# 6  2012       0      <NA>
# 7  2013       1     Start
# 8  2014       1      <NA>
# 9  2015       1       End
# 10 2016       0      <NA>
# 11 2017       1 Start&End
# 12 2018       0      <NA>
# 13 2019       0      <NA>
# 14 2020       1     Start
# 15 2021       1      <NA>
# 16 2022       1      <NA>
# 17 2023       1      <NA>
# 18 2024       1      <NA>
# 19 2025       1      <NA>
# 20 2026       1      <NA>
# 21 2027       1      <NA>
# 22 2028       1      <NA>
# 23 2029       1      <NA>
# 24 2030       1      <NA>
# 25 2031       1       End

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

datamanipulation

如何检测一列中的更改并标记另一列中的更改的相关文章

长变量名在 dplyr 中失败

长度超过 39 个字符的字符串在 dplyr 中失败返回错误错误索引超出范围我错过了什么还是这是一个错误 40 个字符不起作用 library dplyr names iris 5 lt vvv 5vvv10vvv15vvv20vv
查找嵌套列表中元素的索引？

我有一个类似的列表 mylist lt list a 1 b list A 1 B 2 c list C 1 D 3 是否有一种无循环方法来识别元素的位置例如如果我想用 5 替换 C 的值并且在哪里找到元素 C 并不重要我可以这样
简单的数据框重塑

我刚刚从长时间的写作中断中回到 R 并且在记住如何重塑数据方面遇到了一些实际问题我知道我想做的事情很容易但出于某种原因我今晚很愚蠢并且将自己与融化和重塑混淆了如果有人能快速指出我正确的方向我将不胜感激我有一个这样的数据框 pe
有没有办法在 RStudio 中调试 RScript 调用？

假设我从命令行运行 R 脚本如下所示 Rscript prog R x y z 我想检查某一行的代码目前我无法在 RStudio 中以交互方式调试它因为我不知道如何传递参数由于它设计为从命令行运行因此如何通过命令行 RStudi
如果“testthat”测试在“R”中失败，则打印自定义诊断信息

I use a testthat单元测试来检查是否data frame函数返回的结果与我期望它返回的结果相同如果测试失败 testthat打印一些诊断信息例如 MyFunction df orig is not identical to
如何调整ggplot直方图的时间刻度轴

我正在使用一个数据框其中一列包含POSIXct日期时间值我正在尝试使用绘制这些时间戳的直方图ggplot2但我有两个问题我不知道如何设置 binwidthgeom histogram 我想将每个垃圾箱设置为一天或一周我尝试提供 di
将 JSON URL 转换为 R 数据帧

我在将 JSON 文件从 API 转换为 R 中的数据帧时遇到问题例如 URL 我尝试了 S O 的一些不同建议包括将json数据转换为R中的数据框 https stackoverflow com questions 28683769
使用 R 的 flextable 包时，有没有办法将传递给 add_header_lines() 的字符串部分加粗

我正在使用我喜欢的 flextable 包为 Word 文档创建几个表格但是我在将表格标题中的部分文本加粗时遇到了一些麻烦例如我希望标题为 Table 1 我的表格标题的其余部分而不是表 1 我的表格标题的其余部分 I 找到这个
如何在不循环的情况下添加组ID？

我有数据框例如 productid ordernum p1 10 p2 20 p3 30 p4 5 p5 20 p6 8 我想添加另一列称为 groupid 它将产品按顺序分组在一起一旦 sum ordernum 达到 30 分配一个
如何更新条件公式？

让我直接进入示例考虑以下等式 frml lt formula y a b x z 使用这样的公式规范例如和AER ivreg 我想更新这个公式使其显示为 frml2 lt y a b c x z w 但是我不确定如何更新条件标志之前
从 R 环境中删除对象

我正在阅读 Hadley 的 Advanced R 在第 8 章中他说我们可以使用以下方法从环境中删除对象 rm 但是移除该物体后我仍然可以看到该物体这是我的代码 e lt new env e a lt 1 e b lt 2 e a
从 R 中的 HTTPS 连接逐行读取

当创建连接时open r 它允许逐行读取这对于批量处理大数据流非常有用例如这个脚本 https gist github com jeroenooms d33a24958d99bb969ac0通过一次读取 100 行来解析相当大的 gzi
将 VLMC 拟合到很长的序列

我正在尝试将 VLMC 拟合到最长序列为 296 个状态的数据集我这样做如下所示 Load libraries library PST library RCurl library TraMineR Load and transform d
使用 R 进行项目组织 [重复]

这个问题在这里已经有答案了可能的重复统计分析和报告撰写的工作流程 https stackoverflow com questions 1429907 workflow for statistical analysis and repor
为什么这些数字不相等？

下面的代码显然是错误的有什么问题 i lt 0 1 i lt i 0 05 i 1 0 15 if i 0 15 cat i equals 0 15 else cat i does not equal 0 15 i does not eq
使用 dplyr::filter 的整洁方式是什么？

使用下面的函数调用foo c b 输出以内联方式显示正确的写作方式是什么df gt filter x gt x 我已经包含了一个使用的示例mutate以整洁的风格与之对比filter foo lt function variables x
如何匹配 R 中的所有匹配项？

我有 1000 个名字的列表说A 我还有另外 5 个名字的清单说B 我想找出这5个名字出现在1000个号码列表中的第几行例如 Amy 在 A 中可以出现 25 次 B 里有艾米我想知道 Amy 出现在 A 中的哪些行我以前使用过
GGPLOT2：如何在 ggplot() 脚本中绘制特定选择

这是一个名为的大型数据集的峰值P 其中有 10 个优惠 CS 有不同的商店 SHP 具有多个数值数据集列出了按周排序的它们 WK 2 tm 52 它创建一个大文件仅前 6 行出现峰值 WK MND CS SHP RevCY RevLY
替换字符串/文本中“从第 n 次到最后一次”出现的单词

这个问题以前曾被问过但尚未得到令提问者满意的答案 https stackoverflow com questions 36368712 how to use stringrs replace all function to replace
非闪亮上下文中的反应式对象绑定

实际问题你怎样才能近似反应性环境行为 http shiny rstudio com tutorial lesson6 建立者shiny http shiny rstudio com函数或者甚至可能在一个函数中使用这些函数无光泽上下文以

随机推荐

经纬度转为时区

有谁知道是否有任何现有的解决方案可以从一个点经度纬度确定时区我可以对这个项目所需的一些内容进行硬编码但最好使用预先构建的解决方案 thanks 使用 Web 服务例如由geonames http www geonames org
在 RowSort 操作后执行操作

我有一个JTable and a TableRowSorter我想在排序完成后执行操作我一直在浏览网络但到目前为止我还没有什么运气最初我以为只是一个RowSorterListener可以解决这个问题但不幸的是它在排序完成后不会执行该
在 JAVA 中验证 JSON 字符串对象格式的最佳方法是什么

我想验证字符串对象是否是有效的 json 对象无论其数据正确性如何换句话说这个 json 字符串的格式正确吗例如我得到 abc 123 cba 233 该过程应返回格式异常 abc 123 cba 233 应该给予相同的您可能认
MSIL检查

我有一些字节格式的 MSIL 反射的 GetMethodBody 的结果我想对其进行一些分析我想在 MSIL 中找到使用 new 运算符创建的所有类关于如何以编程方式做到这一点有什么想法吗我最终在这里使用了 MSIL 解析器 htt
在Linux上编写多线程TCP服务器

在工作中我的任务是实现 TCP 服务器作为 Modbus 从设备的一部分我在堆栈交换和互联网上读了很多书包括优秀的http beej us guide bgnet http beej us guide bgnet 但我正在努力解决设计
如何通过 JavaScript 设置浏览器选项卡的锚点目标名称？

当从外部超链接调用我的网站时如果它已经打开它将在同一浏览器选项卡中重新打开这可以通过在超链接的 HTML 中指定适当的目标属性来实现 a href http my website org target self a 但是如果在未指定
ASP.NET Core 2.2（发布）产生错误并停止 w3wp

刚刚将我们的 ASP NET Core 2 1 5 项目之一升级到今天发布的 v 2 2 部署到生产服务器后它会失败并关闭工作进程项目在 Windows 10 1803 17134 441 上本地运行良好但在生产服务器上运行不佳 Wi
与 2013 年相比，initializer_list 中的双重删除

今天我的项目中遇到了内存问题其中一个类使用 c 11 初始化器列表系统发出内存问题信号 dbgdel cpp 中的表达式 BLOCK TYPE IS VALID pHead gt nBlockUse 我将代码简化为一个简单的示例它不
Angular 2 Web Worker - UI 未运行

我有一个 angular2 应用程序在网络工作者中运行从表面上看一切都按我的预期运行但 DOM 似乎没有发生任何事情例如我在应用程序加载时显示预加载器但它永远不会被实际应用程序 UI 替换
来自守护程序的错误响应：连接到网络失败，请确保您的网络选项正确并检查管理器日志：超出上下文期限

我正在尝试使用覆盖网络设置 docker swarm 我在 aws 上有一些主机而其他主机是运行 Ubuntu 的笔记本电脑与 aws 上相同每个节点都有一个静态公共IP 我创建了一个覆盖网络 docker network creat
为什么 Javascript 返回不正确的 UTC 月份值？

好吧首先让我说我已经这样做了一千次了我只是想在 JavaScript 中打印 utc 时间但是我得到的值是错误的 JavaScript 将在 8 月返回 8 而不是 9 月 9 因为今天是 2014 年 9 月 2 日 UTC 时
initState 中的 Flutter 提供程序

我目前正在尝试将 Provider 作为状态管理解决方案并且我知道它不能在 initState 函数内部使用我见过的所有示例都调用派生类中的方法ChangeNotifier根据用户操作例如用户单击按钮进行类但是如果我需要在初始化
如何使用查询性能计数器？

我最近决定需要将 Timer 类的使用毫秒改为微秒经过一番研究后我认为 QueryPerformanceCounter 可能是我最安全的选择警告Boost Posix它可能无法在 Win32 API 上运行这让我有点失望但是我不
在运行嵌套查询的嵌套对象上使用 firebase 云函数搜索数据时未指定索引

我正在使用 fire base 检索用户节点的嵌套数据在运行查询时我面临着从 fire base 数据库获取数据的问题考虑添加 indexOn userId users YJdwgRO08nOmC5HdEokr1NqcATx1 fol
如何从 type="button" 的表单元素获取值

我在表单中有以下代码
使用 Python 和报纸3k lib 进行网页抓取不返回数据

我已经安装了Newspapper3k我的 Mac 上的 Libsudo pip3 install Newspapper3k 我使用的是Python 3 我想返回 Article 对象支持的数据即 url 日期标题文本摘要和关键字但
短路是否会使程序的执行速度更快，并且分析将哪个语句放在条件语句中的第一位是否值得？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案例如假设我们正在谈论 C 如果这有区别的话在运算符中如果我知道一个语句更频繁地得到 0 有更高的机会那么我应该将另一个语句放在左侧另
使用 VHDL 实例化 FPGA 中的 RAM

我试图按照中的指导实现双端口 RAM这篇优秀的博文 http danstrother com 2010 09 11 inferring rams in fpgas 然而 ModelSim 在编译时给出以下警告 Warning fifo ra
如何对单引号进行编码

我想知道如何使用 htmlentities 039 for 在我的代码中如何转义单引号 https stackoverflow com questions 6058523 how to escape single quote hows a
如何检测一列中的更改并标记另一列中的更改

我试图标记进程何时开始和结束代码需要检测更改何时开始和何时结束并在另一列中进行标记示例数据 date process 2007 0 2008 1 2009 1 2010 1 2011 1 2012 1 2013 0 Goal date

如何检测一列中的更改并标记另一列中的更改

Update

Update 2

如何检测一列中的更改并标记另一列中的更改 的相关文章

随机推荐

热门标签

如何检测一列中的更改并标记另一列中的更改的相关文章