在 mutate pipeline 中按组获取唯一 ID [重复]

2024-05-24

自从新的 dplyr v1.0.0 更新发布以来，我注意到该功能group_indices()有...已弃用。我在工作中经常使用这个功能，并且我喜欢在mutate.

例如使用dplyr v0.8.3我能够非常轻松地做这样的事情：

#请注意，我没有运行此代码，因为我的计算机上不再有 v0.8.3。

library(dplyr) # v0.8.3
rep_data <- data.frame(
  x = c("a", "a", "a", "a", "b", "b", "b", "c"),
  y = c("v1", "v1", "v2", "v3", "v1", "v2", "v3", "v3"),
  expect_output = c(1, 1, 2, 3, 4, 5, 6, 7)
)
rep_data %>%
  mutate(expect_output2 = group_indices(x, y))

expect_output2应该有效地给出相同的结果expect_output.

现在既然...已被弃用我想不再使用它们，但我不确定如何做与上面相同的事情。

我基本上是在问这个问题HERE https://stackoverflow.com/questions/39650511/r-group-by-variable-and-then-assign-a-unique-id但这个问题现在已经过时了dplyr版本。

当我使用上面的代码运行时dplyr v1.0.0我收到警告消息：

Warning message:
The `...` argument of `group_keys()` is deprecated as of dplyr 1.0.0.
Please `group_by()` first

所以我尝试执行以下操作

library(dplyr) # v1.0.0
rep_data %>% 
  group_by(x, y) %>% 
  mutate(expect_output3 = group_indices(.))

这会导致错误

Error: Problem with `mutate()` input `expect_output3`.
x Input `expect_output3` can't be recycled to size 2.
i Input `expect_output3` is `group_indices(.)`.
i Input `expect_output3` must be size 2 or 1, not 8.
i The error occured in group 1: x = "a", y = "v1".

Keeping group_indices出于mutate工作正常并返回预期的向量，但是我想继续在管道链中操作我的数据，而不必像我在其他问题上看到的那样分配它例如我不想这样做

rep_data$expect_output3 = rep_data %>% group_by(x,y) %>% group_indices()

有没有办法group_indices()并在维护我的管道链的同时将此向量添加到我的数据中？我非常乐意使用与group_indices()然而我还没有找到一个适合我的目的的。

任何帮助，将不胜感激。谢谢！

该错误无法重现dplyr 1.0.0，但是group_indices已被弃用，而是使用cur_group_id

library(dplyr)# 1.0.0
rep_data %>% 
     group_by(x, y) %>% 
     mutate(expect_output2 =cur_group_id())
# A tibble: 8 x 4
# Groups:   x, y [7]
#  x     y     expect_output expect_output2
#  <chr> <chr>         <dbl>          <int>
#1 a     v1                1              1
#2 a     v1                1              1
#3 a     v2                2              2
#4 a     v3                3              3
#5 b     v1                4              4
#6 b     v2                5              5
#7 b     v3                6              6
#8 c     v3                7              7

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dplyr

在 mutate pipeline 中按组获取唯一 ID [重复] 的相关文章

有没有办法在 RStudio 中调试 RScript 调用？

假设我从命令行运行 R 脚本如下所示 Rscript prog R x y z 我想检查某一行的代码目前我无法在 RStudio 中以交互方式调试它因为我不知道如何传递参数由于它设计为从命令行运行因此如何通过命令行 RStudi
分离并重新附加“tools:rstudio”

又名玩火以下不起作用 rstd obj lt as environment tools rstudio detach tools rstudio attach rstd obj name tools rstudio 好吧它似乎有效但随
使用底格里斯河从纬度/经度获取人口普查区

我有相对较多的坐标我想获取其人口普查区除了 FIPS 代码我知道我可以使用以下命令查找各个纬度经度对call geolocator latlon 已完成here https stackoverflow com questions 5
使用 R 的 flextable 包时，有没有办法将传递给 add_header_lines() 的字符串部分加粗

我正在使用我喜欢的 flextable 包为 Word 文档创建几个表格但是我在将表格标题中的部分文本加粗时遇到了一些麻烦例如我希望标题为 Table 1 我的表格标题的其余部分而不是表 1 我的表格标题的其余部分 I 找到这个
如何在不循环的情况下添加组ID？

我有数据框例如 productid ordernum p1 10 p2 20 p3 30 p4 5 p5 20 p6 8 我想添加另一列称为 groupid 它将产品按顺序分组在一起一旦 sum ordernum 达到 30 分配一个
R：将 readRDS 应用于 .Rds 文件名的列表对象

我有几个包含数据帧对象的 Rds 文件我想对每个文件应用一个函数并将数据帧绑定到单个数据帧中但是当我尝试从文件名列表中读取多个 Rds 文件时我收到错误 FUN X i 中的错误从连接读取时出错 readRDS 不适用于列表吗 R
R.matlab/readMat：readTag(this) 中出错

我正在尝试使用 R matlab 将 matlab 文件读入 R 但遇到此错误 require R matlab r lt readMat file mat verbose T Trying to read MAT v5 file stre
将 sf voronoi 多边形裁剪到边界框时出错

我正在尝试将 voronoi polygons 使用 sf package 创建剪辑到边界框但它引发了我无法定义的错误我对 R 的空间世界不太有经验感谢所有帮助样本数据 stations lt structure list ST
如何更改 Shiny 中 navbarPage 折叠的断点

我想用shiny navbarPage collapsible TRUE 当在小屏幕上查看我的 Shiny 应用程序时将导航元素折叠到菜单中默认情况下当浏览器宽度小于 940 像素时会触发折叠有什么方法可以改变这一点以便在稍大的浏
R 更改小数位且不四舍五入

gt signif 1 89 digits 2 1 1 9 我想要1 8 这有点笨拙但它会起作用并保持所有数字 x lt 1 829380 trunc dec lt function x n floor x 10 n 10 n Resul
将函数应用于 3d 数组的每一层，返回一个数组

假设您有一个包含行列和层的 3 维数组 A lt array 1 27 c 3 3 3 想象你有一个函数它接受一个矩阵作为输入并返回一个矩阵作为输出就像t 如何将该函数应用于数组的每一层返回与第一层大小相同的另一个数组我觉得我应该
仅保留百分比的尾随零

给出以下示例 library pander tableAbs lt Titanic 1 1 tablePct lt round prop table tableAbs 100 2 table lt cbind tableAbs tableP
将数据从 R 导出到 Excel

我试图将从 R 获得的一些结果导出到 Excel 中但未成功我尝试过以下代码 write table ALBERTA1 D ALBERTA1 txt sep t write csv ALBERTA1 ALBERTA1 csv your
如何按 data.table 中的十分位数组计算统计数据

我有一个 data table 想按组计算统计数据 R set seed 1 R DT data table a rnorm 100 b rnorm 100 这些组应该定义为 R quantile DT a probs seq 1 9 1
如何将此“for”循环转换为向量解

这个问题与将嵌入其他文本的长州名称转换为两个字母的州缩写 https stackoverflow com questions 25582518 convert long state names embedded with other te
r 中的 5 维图

我正在尝试在 R 中绘制 5 维图我目前正在使用rgl包以 4 个维度绘制数据使用 3 个变量作为 x y z 坐标另一个变量作为颜色我想知道是否可以使用这个包添加第五个变量例如空间中点的大小或形状这是我的数据和当前代码的示例
有没有一种简单的方法来判断存储在一个列表中的许多数据帧是否包含相同的列？

我有一个包含许多数据框的列表 df1 lt data frame A 1 5 B 2 6 C LETTERS 1 5 df2 lt data frame A 1 5 B 2 6 C LETTERS 1 5 df3 lt data frame
带 R 的多彩标题

我想添加颜色某些词在我的图表标题中我已经能够在这里找到一些先例 http blog revolutionanalytics com 2009 01 multicolor text in r html 具体来说我希望用撇号括起来的文本在
16 位以上整数的计算

我有两个大整数两者都超过 16 位确切地说是 20 位而且我知道由于双精度浮点运算我在使用这些数字进行计算甚至将它们存储在变量中独立于编程语言时受到限制不过我想也许gmp图书馆应该处理它们但不幸的是它没有可以计算更大的整
如何将 ggrough 图表另存为 .png

说我正在使用R包裹ggrough https xvrdm github io ggrough https xvrdm github io ggrough 我有这个代码取自该网页 library ggplot2 library ggroug

随机推荐

AudioRecord - 如何将数据放入缓冲区？

我在使用 AudioRecord 类时遇到一些问题我想将记录的数据存储在缓冲区中但我不确定实现这一目标的正确方法是什么我查阅了大量示例但大多数都很复杂并且代表了许多不同的方法我正在寻找简单的一个或简单的解释这是我的项目的音频设置
获取 SQL 表上的某些百分位值

假设我有一个表其中存储用户他们拥有的红球数量球总数蓝色黄色其他颜色等以及红球与球总数的比率架构如下所示 user id ratio red balls total balls 1 2 2 10 2 3 6 20 我想根据排序
如何编写一个 SQL 查询来计算每月和每年的行数？

有谁知道如何查询 vbulletin 数据库来生成每月每年注册数量的报告以获得如下结果 MM YYYY Count 01 2001 10 02 2001 12 感谢下面的这些答案我的最终版本有效如下 SELECT COUNT as R
Flex 和 crossdomain.xml

我想知道将 crossdomain xml 添加到应用程序服务器的根目录是否存在任何安全问题它可以添加到服务器的任何其他部分吗您是否知道任何不需要服务器放置此文件的解决方法谢谢达米安通过添加 crossdomain xml 主要的
python名称错误名称未定义

在 python3 中运行此代码时出现错误名称未定义 def main D create empty dictionary for x in open wvtc data txt key name email record x strip
+entityForName: nil 不是搜索实体名称“Account”的合法 NSManagedObjectContext 参数

我尝试了很多选择但找不到解决这个问题的方法我创建了一个核心数据文件并将实体命名为帐户创建了一个名为用户名的字符串属性然后将实体的类编辑为NSManagedObject 不确定这是否正确现在以下代码位于我的 LoginViewCo
NGXS 状态大小和性能

Angular 中类似于 redux 的模式给我留下了深刻的印象并且我迷上了 NGXS 我将其与 NGRX 和 Akita 进行了比较但选择了 NGXS 我知道 NGXS 存储应用程序中的所有先前状态因此如果我有一个非常复杂的 UI
Java中的整数缓存[重复]

这个问题在这里已经有答案了可能的重复奇怪的Java拳击 https stackoverflow com questions 3130311 weird java boxing 最近我看到一个演示其中有以下 Java 代码示例 Inte
读取Python/Pandas中缺少值的空格分隔文件

我正在尝试使用 panda 中的 read csv 在 Python 中读取空格分隔的文件它通过指定分隔符来工作当列中存在某些缺失值时就会出现问题因为它通过将缺失值视为分隔符来忽略缺失值有办法解决这个问题吗 1600 1141
Heroku Toolbelt 在多个帐户之间切换

我想知道使用 heroku 工具带在 heroku 帐户之间切换的最佳方法是什么我习惯了拥有一个个人 Heroku 帐户它是我所有专业 Heroku 应用程序的协作者问题是当我想要做出一些会产生财务影响的更改时例如添加删除插件
如何在没有 Nexus/Artifactory/etc 的情况下索引 Maven 存储库？

我为一些开源运行我自己的小 Maven 存储库我没有专用服务器所以我使用谷歌代码存储库 https code google com p code cop code source browse repo mvn2repo 部署到文件系统然
创建 lambda 二维数组

因此我搜索了几个网站和其他有关此问题的问题但似乎没有一个答案适合我我有有效的代码我的编程导师建议我更改链接if else if改为使用 lambda 表我询问是否使用某种哈希表他说仅对 9 个项目使用哈希真正的程序有 9 个
excel公式中可以设置粗体吗？

格式样本 https i stack imgur com dmtpZ png 这里我想添加文本a1 b1 c1 但是我想boldb1 文字如命令模块会大胆这个词可以加粗吗日期格式 https i stack imgur com jF9U
为什么流式数据集会失败并显示“当流式数据帧/数据集上存在流式聚合时不支持完整输出模式...”？

我使用 Spark 2 2 0 在 Windows 上使用 Spark 结构化流时出现以下错误有时不支持完整输出模式streaming aggregations on streaming DataFrames DataSets没有wate
如何创建应用内购买以从免费版本升级到付费版本android

我的应用程序有两个版本付费版免费版现在在免费版本中我禁用了一些仅在付费版本中可用的功能所以我想要的是当用户点击任何这些禁用的功能时应用内购买窗口应该弹出并且当交易完成时应用程序的免费版本应该被付费版本取代您能告诉我什么
如何计算嵌套对象的深度？

我有一个嵌套对象的示例数组 let arr id 0 children id 1 children id 2 children id 3 children id 4 children 我需要计算每个对象的深度级别在所有对象中我也有一个pa
%*.*d 在 printf() 中如何工作？

include
更改服务的启动类型 (Windows)

我正在寻找更改 Windows 服务启动类型的方法我发现有两种方法可以做到这一点通过编辑注册表 http www techbytes ca techbyte74 html Or 通过使用 WMI 类 http www codeproje
在 WordPress 中使用 jquery 日期选择器

我想要在我的 WordPress 模板页面的表单中使用日期选择器但它不起作用这是我的子主题functions php的代码 function modify jquery if is admin comment out the next
在 mutate pipeline 中按组获取唯一 ID [重复]

这个问题在这里已经有答案了自从新的 dplyr v1 0 0 更新发布以来我注意到该功能group indices 有已弃用我在工作中经常使用这个功能并且我喜欢在mutate 例如使用dplyr v0 8 3我能够非常轻松地做这样

在 mutate pipeline 中按组获取唯一 ID [重复]

在 mutate pipeline 中按组获取唯一 ID [重复] 的相关文章

随机推荐

热门标签