如果连续行之间的差异满足条件，则计算列的总和

2023-12-01

这是帖子中的一个持续问题如果第二行满足条件，则从每组中删除第一行

下面是一个示例数据集：

df <- data.frame(id=c("9","9","9","5","5","4","4","4","4","4","20","20"),
       Date=c("11/29/2018","11/29/2018","11/29/2018","2/13/2019","2/13/2019",
       "6/15/2018","6/20/2018","8/17/2018","8/20/2018","8/23/2018","12/25/2018","12/25/2018"), 
Buyer= c("John","John","John","Maria","Maria","Sandy","Sandy","Sandy","Sandy","Sandy","Paul","Paul"), 
Amount= c("959","1158","596","922","922","1849","4193","4256","65","100","313","99"), stringsAsFactors = F) %>% 
group_by(Buyer,id) %>% mutate(diffs = c(NA, diff(as.Date(Date, format = "%m/%d/%Y"))))

看起来像：

| id |    Date    | Buyer | diff | Amount |
|----|:----------:|------:|------|--------|
| 9  | 11/29/2018 |  John | NA   | 959    |
| 9  | 11/29/2018 |  John | 0    | 1158   |
| 9  | 11/29/2018 |  John | 0    | 596    |
| 5  | 2/13/2019  | Maria | 76   | 922    |
| 5  | 2/13/2019  | Maria | 0    | 922    |
| 4  | 6/15/2018  | Sandy | -243 | 1849   |
| 4  | 6/20/2018  | Sandy | 5    | 4193   |
| 4  | 8/17/2018  | Sandy | 58   | 4256   |
| 4  | 8/20/2018  | Sandy | 3    | 65     |
| 4  | 8/23/2018  | Sandy | 3    | 100    |
| 20 | 12/25/2018 | Paul  | 124  | 313    |
| 20 | 12/25/2018 | Paul  | 0    | 99     |

我需要根据每个买家和 ID 保留这些记录，如果两个连续行之间的差异 5000。因此，例如，ID 为“4”的买家“Sandy”在“6/15/2018”和“6/20/2018”在 5 天内有两笔交易 1849 和 4193，并且由于这些交易的总和两个金额>5000，输出就会有这些记录。然而，对于同一买家“Sandy”（ID 为“4”），在“8/17/2018”、“8/20/2018”和“8/23/2018”之间的间隙内又有 4256、65 和 100 笔交易每 3 天，但输出不会有这些记录，因为该金额的总和

| id |    Date   | Buyer | diff | Amount |
|----|:---------:|------:|------|--------|
| 4  | 6/15/2018 | Sandy | -243 | 1849   |
| 4  | 6/20/2018 | Sandy | 5    | 4193   |

df <- data.frame(id=c("9","9","9","5","5","4","4","4","4","4","20","20"),
                 Date=c("11/29/2018","11/29/2018","11/29/2018","2/13/2019","2/13/2019",
                        "6/15/2018","6/20/2018","8/17/2018","8/20/2018","8/23/2018","12/25/2018","12/25/2018"), 
                 Buyer= c("John","John","John","Maria","Maria","Sandy","Sandy","Sandy","Sandy","Sandy","Paul","Paul"), 
                 Amount= c("959","1158","596","922","922","1849","4193","4256","65","100","313","99"), stringsAsFactors = F) %>% 
  group_by(Buyer,id) %>% mutate(diffs = c(NA, diff(as.Date(Date, format = "%m/%d/%Y"))))

将日期从字符更改为日期并将金额从字符更改为数字：

df$Date<-as.Date(df$Date, '%m/%d/%y')
df$Amount<-as.numeric(df$Amount)

现在，我按 id 对数据集进行分组，用日期对其进行排列，并在每个 id 内创建一个排名（例如，Sandy 在她购物的 5 个不同天中将获得从 1 到 5 的排名），然后我定义一个名为 ConsecutiveSum 的新变量，它将每行的值添加到其前一行的值（滞后给出前一行）。如果前一行的值不存在，则 ifelse 语句会强制连续 sum 输出 0。下一步只是执行您的条件：

df %>%
  group_by(id) %>%
    arrange(Date) %>%
      mutate(rank=dense_rank(Date)) %>% 
        mutate(ConsecutiveSum = ifelse(is.na(lag(Amount)),0,Amount  + lag(Amount , default = 0)))%>%
         filter(diffs<=5 & ConsecutiveSum>=5000 | ConsecutiveSum==0 & lead(ConsecutiveSum)>=5000)


# id    Date      Buyer Amount diffs  rank ConsecutiveSum
#   <chr> <chr>     <chr>  <dbl> <dbl> <int>          <dbl>
# 1 4     6/15/2018 Sandy   1849    NA     1              0
# 2 4     6/20/2018 Sandy   4193     5     2           6042

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如果连续行之间的差异满足条件，则计算列的总和的相关文章

R - 正则表达式错误（PCRE 版本）

我正在尝试使用koRpus在 R 中在运行 RHEL6 的 Linux 服务器上进行词形还原上周当我安装了 MRO Microsoft R Open 3 2 3 时下面的代码效果很好 library koRpus lw c danci
指定 R 中 hist() 中的 bin 数量？

我尝试指定垃圾箱的数量hist R为10 如下 gt hist x breaks 10 但垃圾箱的数量并不完全是 10 我尝试了几个其他数量的垃圾箱结果发生了同样的情况 hist says breaks可以指定给出直方图单元格数量的单个
如何调整ggplot直方图的时间刻度轴

我正在使用一个数据框其中一列包含POSIXct日期时间值我正在尝试使用绘制这些时间戳的直方图ggplot2但我有两个问题我不知道如何设置 binwidthgeom histogram 我想将每个垃圾箱设置为一天或一周我尝试提供 di
如何使用 r 中的 caret 包在最佳调整超参数的 10 倍交叉验证中获得每次折叠的预测？

我试图使用 R 中的插入符包使用 10 倍交叉验证和 3 次重复来运行 SVM 模型我想使用最佳调整的超参数获得每次折叠的预测结果我正在使用以下代码 Load packages library mlbench library caret
R read_excel：libxls 错误：无法解析文件

我试图使用 readxl read excel 将 xls 文件读入 R 但它给出了以下错误 Error filepath data xls libxls error Unable to parse file 还尝试了 readxl exc
R 中的 NA 替换函数

我正在尝试替换矩阵中的 NA mat 零我在用着mat is na mat lt 0 当我有 18946 个变量的 94531 个观察值或更小的矩阵时效果很好但我在 22752 个变量的 112039 个观察值的矩阵上尝试它 R 显示
分离并重新附加“tools:rstudio”

又名玩火以下不起作用 rstd obj lt as environment tools rstudio detach tools rstudio attach rstd obj name tools rstudio 好吧它似乎有效但随
使用 dplyr:group_by 将数据帧分成多个子集？

有没有办法根据 group by 组使用 dplyr 将一个数据帧拆分为数据帧的子集 mtcars gt group by cyl gear gt codes 非常感谢好吧并不是你真的想要但你可以这样做tidyr 即nearly一样的
如何在 R 中为传单中的数值变量设置不对称颜色渐变

我想让传单调色板以零为中心红白绿发散我已经尝试过中所说的这个帖子 https stackoverflow com questions 29262824 r center color palette on 0 当我尝试手动创建颜色时我得
限制数据框中所有单元格的字符串长度？

您好有没有一种方法可以限制 data frame 中所有列的字符串文本大小而不必循环遍历每一列并一次使用 str trunc 之类的东西例如下面的数据框我可以将所有文本大小限制为仅 5 个字符而不必一次只执行一列吗如果有 50
R 中的发散积分可在 Wolfram 中求解

我知道我以前问过同样的问题但由于我是新来的这个问题问得不好而且不可重现因此我在这里尝试做得更好如果我只编辑旧的可能没有人会读它我有一个想要积分的二重积分 ff lt function g t exp 16 g exp 8 t t
R：将 readRDS 应用于 .Rds 文件名的列表对象

我有几个包含数据帧对象的 Rds 文件我想对每个文件应用一个函数并将数据帧绑定到单个数据帧中但是当我尝试从文件名列表中读取多个 Rds 文件时我收到错误 FUN X i 中的错误从连接读取时出错 readRDS 不适用于列表吗 R
当每个记录都是一个段落并且某些记录有 4 个字段而其他记录有 6 个字段时，如何将文本文件读入 R

如何读取文本文件其中每条记录都是一个段落每个换行符表示单独的字段复杂的是有些记录有 4 行有些记录有 6 行当字段数量的差异为 1 时 DWin 解决了我的问题但当字段数量差异为 2 时一切都崩溃了你可以有一个在这里看看他
将函数应用于 3d 数组的每一层，返回一个数组

假设您有一个包含行列和层的 3 维数组 A lt array 1 27 c 3 3 3 想象你有一个函数它接受一个矩阵作为输入并返回一个矩阵作为输出就像t 如何将该函数应用于数组的每一层返回与第一层大小相同的另一个数组我觉得我应该
fread 将空导入为 NA

我正在尝试导入带有空白的 csv 读取为不幸的是他们都读作 NA now 为了更好地演示问题我还展示了如何NA NA and 都映射到同一事物除了最底部的示例这将妨碍简单的解决方法dt is na dt lt gt write cs
R 中的字符串作为函数参数

数据框chocolates列出了糖果的类型以及每种糖果的一组评级 ID sweetness filling crash snickers 0 67 0 55 0 40 milky way 0 81 0 53 0 56 我正在编写一个函数它
R - 通过覆盖和递归合并列表

假设我有两个带有名字的列表 a list a 1 b 2 c list d 1 e 2 d list a 1 b 2 b list a 2 c list e 1 f 2 d 3 e 2 我想递归地合并这些列表如果第二个参数包含冲突的值则
在 R 中使用 Huggingface Transformer 模型

我正在尝试在 R 中使用不同的 Huggingface 模型这是通过 reticulate 导入 Transformer 包来实现的谢谢 https rpubs com eR ic transfoRmers https rpubs co
如何在R中同时对三个字段进行网络分析

如何在 R 中同时对三个字段进行网络分析下面是示例数据以及desired output在最后一栏中 df lt data frame stringsAsFactors FALSE id 1 c ABC ABC BCD CDE DEF EF
替换字符串/文本中“从第 n 次到最后一次”出现的单词

这个问题以前曾被问过但尚未得到令提问者满意的答案 https stackoverflow com questions 36368712 how to use stringrs replace all function to replace

随机推荐

为什么 NSUserDefaults 无法保存 NSMutableDictionary？

我正在尝试保存一个NSMutableDictionary with NSUserDefaults 我在 stackoverflow 上阅读了很多关于该主题的帖子我还发现了一个有效的选项但不幸的是它只工作了一次然后它开始只保存空有人
动态调整 QIcon 大小，无需调用 setSizeIcon()

我目前正在努力解决一个应该很容易解决的问题许多小部件都支持某种QSize策略这包括Q按钮就我而言我在网格布局中有多个按钮所有这些按钮都有各自的 QSizePolicy垂直和水平调整大小设置为扩大这导致按钮的大小根据网格布局所属的
VS2015 SP3远程调试路径中的非法字符

将 Visual Studio 2015 升级到 Update 3 后远程调试停止工作尝试调试时出现错误严重性代码说明项目文件行抑制状态错误 DEP4300 无法生成应用程序包 xxx VS Debug x86 xxx CN x
FragmentActivity 上未调用 onCreateOptionsMenu()

同事 MainActivity类源自FragmentActivity 并且由于某种原因活动的onCreateOptionsMenu 没有接到电话我有第一个断点onCreate 正在被触发第二个在onCreateOptionsMenu 这
由于与 google gms 服务版本冲突，FCMPlugin 构建失败

我在 Windows for Android 上将其与 ionic 2 一起使用当我添加 cordova plugin fcm 插件时我无法再构建项目这是我收到的错误 BUILD FAILED Total time 4 697 sec
Codeigniter图片上传mysql

我想知道如果我将 CodeIgniter 中的图像上传到数据库我的结果是什么 config upload path 我见过的所有示例都使用文件系统我在数据库中有文章并且也想在数据库中存储与文章相关的图像有人可以帮忙吗你可以阅读这篇
PHP 和 mssql 库可以从 varchar 列中选择超过 256 个字符吗？

是否有解决方法除了将列类型更改为文本字段之外使用 PHP 和 mssql 库选择大型 varchar 字段例如 varchar 500 PHP 真的将字符数限制为 255 吗还有比这更拉回来的方法吗从PHP页面来看问题似乎出在W
有没有什么方法可以只使用 CSS 来获得倾斜的盒子阴影？

我想要类似徽标的东西CSS 技巧但使用 CSS 而不是图像文件因此可以调整其大小这可能吗像这样的图片纯 CSS 带切角的倾斜阴影这花了一点时间来完善但现在横幅下有一个倾斜的阴影也有切角和多个边框所有效果包括背景徽标和阴
使用自定义选择器和逻辑进行 JQuery 验证

是否可以将 JQuery Validate 与自定义选择器和验证逻辑一起使用大致如下 myForm validate rules myattr foo function content return content val contain
CLR 在运行时使用的 dll

我有一个引用 NET DLL 的 C 应用程序如果这个 DLL 存在于我的应用程序中bin目录和 GAC 然后 CLR 在运行时会选择哪一个如果 GAC 有最新版本是否会使用该版本而不是bin 我如何强制 CLR 始终使用我的 CLR
无法阻止被动事件侦听器内的默认行为

我在用着Framework7 可排序列表它运行良好只是当列表更改时它不会触发事件所以我正在尝试一些内置事件 sortable handler on touchstart function e e preventDefault alert
FlashDevelop、Haxe 导入 CreateJS？

我刚刚开始尝试 Haxe 制作一个网络应用程序我想使用 CreateJS 它有一个 Haxe extern lib 东西我使用 FlashDevelop 作为我的 IDE 所以我在FlashDevelop中创建了一个新的Haxe JS项
从 jquery ui datepicker maxDate 选项获取日期对象

通过使用以下 var maxDate selector datepicker option maxDate 输出可以是 1M 20Y 12 12 2013 或更多的任何内容 1M 和 20Y 示例是否可以与本机 JavaScript 一起使
Actionscript 3：self 事件侦听器是否会阻止对象被垃圾回收？

我知道事件侦听器和对对象的引用将阻止垃圾收集器处理对象我的问题是放置在对象上的事件侦听器侦听同一对象是否会阻止该对象被垃圾收集我问是因为这似乎发生在我身上我正在破坏对某个对象的所有引用但当其计时器关闭时我仍然看到痕迹同时这似乎
如何使用 Angular CLI 安装特定版本的 Angular？

我搜索了 google 和 Angular cli 文档但找不到任何使用 Angular CLI 安装特定版本 Angular 的方法有可能吗为了回答您的问题我们假设您对特定的感兴趣angular版本而不是特定的角度 cli版本 A
如何解决MongoDB实例化失败的问题[关闭]

Closed 这个问题需要调试细节目前不接受答案我关注了 MongoDbDocs设置我的第一个 MongoDb 当我使用命令启动 MongoDB 时 C Program Files MongoDB Server 3 4 bin mong
jpeg 的有效 base64 字符串

这是有效的 jpeg base64 字符串吗 data image jpeg base64 9j 4AAQSkZJRgABAQAAAQABAAD 2wBDAAMCAgICAgMCAgIDAwMDBAYEBAQEBAgGBgUGCQgKCgk
如何使 JFrame 内的 JPanel 填充整个窗口？

在下面的示例中如何让 JPanel 占用所有 JFrame 我将首选尺寸设置为 800x420 但实际上只填充了 792x391 import java awt Color import java awt Dimension import
带单选按钮的 Android 颜色选择器

我想创建一组单选按钮来选择颜色像这样的东西我怎样才能实现这样的目标我在原始 RadioButton 上没有找到任何颜色属性我必须创建自定义控件吗如果是有人可以提示我基本步骤以便我可以尝试一些新的研究吗我对 Android 很
如果连续行之间的差异满足条件，则计算列的总和

这是帖子中的一个持续问题如果第二行满足条件则从每组中删除第一行下面是一个示例数据集 df lt data frame id c 9 9 9 5 5 4 4 4 4 4 20 20 Date c 11 29 2018 11 29 2018

如果连续行之间的差异满足条件，则计算列的总和

如果连续行之间的差异满足条件，则计算列的总和 的相关文章

随机推荐

热门标签

如果连续行之间的差异满足条件，则计算列的总和的相关文章