使用列表列对 data.table 进行分组

2024-05-06

我有一个非常大的问题，循环遍历 data.table 来做我想做的事情太慢了，所以我试图绕过循环。假设我有一个 data.table 如下：

a <- data.table(i = c(1,2,3), j = c(2,2,6), k = list(c("a","b"),c("a","c"),c("b")))

> a
  i j   k
1: 1 2 a,b
2: 2 2 a,c
3: 3 6   b

我想根据 k 中的值进行分组。所以像这样：

a[, sum(j), by = k]

现在我收到以下错误：

 Error in `[.data.table`(a, , sum(i), by = k) : 
 The items in the 'by' or 'keyby' list are length (2,2,1). Each must be same length as rows in x or number of rows returned by i (3).

我正在寻找的答案是首先对 k 列中具有“a”的所有行进行分组并计算 sum(j)，然后计算具有“b”的所有行，依此类推。所以期望的答案是：

k V1 
a 4
b 8
c 2

有什么提示如何有效地做到这一点吗？我无法通过重复行来融化 K 列，因为 data.table 的大小对于我的情况来说太大了。

我认为这可能有效：

a[, .(k = unlist(k)), by=.(i,j)][,sum(j),by=k]

   k V1
1: a  4
2: b  8
3: c  2

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dataTable

使用列表列对 data.table 进行分组的相关文章

如何计算R中移动窗口内的平均斜率

我的数据集包含2个变量y 和 t 05s y 每 05 秒测量一次我正在尝试计算移动中的平均坡度20秒窗口即计算第一个 20 秒斜率值后窗口向前移动一个时间单位 05 秒并计算下一个 20 秒窗口在以下位置生成连续 20 秒斜率值
将数据框中的每个 x 个字符拆分为字符串

我知道这里有一些关于每隔一段时间分割一个字符串的答案nth字符例如this one https stackoverflow com questions 23208490 split each character in r and this
如何使用 usmap 标记数字而不是名称？

我知道 usmap 有一个选项label in plot usmap 我想标记一些数字而不是状态名称我想 usmap 中应该有与州质心坐标相关的数据但我不知道如何找到它如果我能得到坐标然后我可以用它来标记数字geom text 这
Dendextend：关于如何根据定义的组为树状图的标签着色

我正在尝试使用一个名为 dendextend 的很棒的 R 包来绘制树状图并根据一组先前定义的组为其分支和标签着色我已阅读您在 Stack Overflow 中的答案以及 dendextend vignette 的常见问题解答但我仍然不
R独特的列或行与NA无可比拟

有谁知道如果incomparables的论证unique or duplicated 曾经被实施过incomparables FALSE 也许我不明白它应该如何工作无论如何我正在寻找一个巧妙的解决方案以仅保留与另一列相同的唯一列或行
API 请求和curl::curl_fetch_memory(url, handle = handle) 中的错误：SSL 证书问题：证书已过期

几天前我运行了代码几个月没有任何问题 GET url myurl query 今天我遇到一个错误 Error in curl curl fetch memory url handle handle SSL certificate pro
将每列的值乘以 R 中另一个 data.frame 中的权重

我有两个data frames df and weights 代码如下 df看起来像这样 id a b d EE f 1 this 0 23421153 0 02324956 0 5457353 0 73068586 0 5642554 2
r 中训练和测试数据的最小最大缩放/归一化

我正在创建一个函数它将训练集和测试集作为其参数最小最大缩放标准化并返回训练集并使用这些same最小值和最小最大范围的值标准化并返回测试集到目前为止这是我想出的功能 min max scaling lt function tr
只读取选定的列

谁能告诉我如何仅读取下面每年数据的前 6 个月 7 列例如使用read table Year Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2009 41 27 25 31 31 39 2
将数据框中重叠的范围合并到唯一的组中

我有一个 n 行 3 的数据框 df lt data frame start c 178 400 983 1932 33653 end c 5025 5025 5535 6918 38197 group c 1 1 2 2 3 df sta
旋转 Markdown 的表格 pdf 输出

我想将 pdf 上的表格输出旋转 90 度我正在使用 Markdown 生成报告并kable循环显示表格如果可以的话我想继续使用kable因为还有很多其他依赖于它的东西我没有包含在这个 MWE 中这是一个简单的例子使用iris数据集
在 Rcpp 中使用其他包中的 C 函数

我试图从 C 函数中的 cubature 包调用 C 例程来执行多维积分我试图重现的基本 R 示例是 library cubature integrand lt function x sin x adaptIntegrate integr
ggplot2：如何标记事件发生的日期

我想从第二个情节中获取第一个情节的信息第二张图表示事件发生的天数它看起来更宽因为它没有图例但它是相同的时间尺度我选择在第一个图中手动分配颜色 I would like to overlay the second plot dots
将不均匀的层次列表转换为数据框

我认为还没有有人问过这个问题但是有没有一种方法可以将具有多个级别和不均匀结构的列表的信息组合成长格式的数据帧具体来说 library XML library plyr xml inning lt http gd2 mlb com c
如何从 R 读取 PDF 元数据

我们很好奇有没有一种方法可以从 R 读取 PDF 元数据例如下面显示的信息通过搜索我对此无能为力 r pdf metadata在当前的问题库中非常欢迎任何指点我想不出纯 R 的方法来执行此操作但您可能可以安装您最喜欢的 PDF
R“错误：“}”中出现意外的“}”[重复]

这个问题在这里已经有答案了我有一个字符串变量对于缺少数据的情况它具有空值我想将空值重新编码为缺失而不是说空值我正在尝试编写一个循环来删除这些空值条目但我不断收到错误错误中出现意外的 for row in dat
python 相当于 R 中的 get() （= 使用字符串检索符号的值）

在 R 中 get s 函数检索名称存储在字符变量向量中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数尽管花了一些时间翻
无法更改 RStudio 中的 R 版本

我的 RStudio V 0 99 491 无法更改 R 版本我以平常的方式行事Global Options gt R Version 然后它挂起并且不再工作或反应 R 运行良好的初始版本是R 3 1 0 我以前从未遇到过这样的问题也许
线性判别分析图

如何将样本 ID 行号作为标签添加到此 LDA 图中的每个点 library MASS ldaobject lt lda Species data iris plot ldaobject panel function x y points
如何使用 dplyr 独立过滤每列的行

我有以下内容 library tidyverse df lt tibble tribble gene colB colC a 1 2 b 2 3 c 3 4 d 1 1 df gt A tibble 4 x 3 gt gene colB c

随机推荐

NSImage 到 NSBitmapImageRep

如何将 NSImage 转换为 NSBitmapImageRep 我有代码 NSBitmapImageRep bitmapImageRepresentation NSBitmapImageRep ret NSBitmapImageRep s
Eclipse 调试模式下的 GDB 找不到 stdlib/rand.c

我试图让 gdb 在 ubuntu 上与 eclipse cdt 一起运行以开始调试一些简单的程序所以我做了我认为必要的步骤来让它运行 1 创建可执行项目 2 Compile 3 Run 4 创建文件 gdbinit 并将其放在主项目文
ASP.NET/ADO.NET：处理 .NET 对象内的许多数据库连接？

我们有一个 NET 对象它对数据库进行大量读写操作在该对象或使用它的 ASP 页的整个生命周期中它可能会通过查询更新来访问数据库 1 到 10 次它不是在每次对象需要访问数据库时打开和关闭数据库连接而是只是在实例化期间打开
如何在 SnakeYaml 中解析 YAML 文件的一部分

我是 YAML 新手并且解析了一个 YAML 配置文件如下所示 applications authentication service version 2 0 service url https myapp corp auth app
如何防止图像被裁剪

我正在尝试创建一个包含很多图层的动画图片为了在不同的屏幕上获得正确比例的图像我使用covercss 属性值我已经尝试过object fit对于图像和background size用于背景图像这就是为什么我的宽屏幕图像被浏览器裁剪的原
将文件存储在文件系统上或在 SQL Server 中存储为 varbinary(MAX)

我知道对于将文件作为 blob 存储在数据库中是否是不好的做法存在很多争议但我只是想了解这对于我的情况是否有意义我正在创建一个 ASP NET 应用程序在一家大公司内部使用用户需要能够将文件附加到系统中的作业这些文件通常是 P
简化巨大的 if 语句 - 设计模式？

我可能有一组如下所示的 if 语句 if a and b and c and d do stuff else a and b and c and d do something else else a and b and c and D do
将 Datagrid 组件与自定义查询结合使用 - react-admin

将 Datagrid 组件与自定义查询一起使用时收到以下错误下面的代码适用于反应管理版本 3 3 1 但不适用于版本 3 8 1 类型错误无法读取未定义的属性包含浏览器的控制台信息列表组件必须在内部使用依赖 props 而不
TSLint ：变量名必须是驼峰或大写

我有一些以下划线开头的变量名称更新 tslint json 后我仍然收到此警告 tslint json extends tslint recommended rules variable name true ban keywords ch
不要使用android内置的org.json

我写了一个使用的库org json http json org A 来自 json org 假设 Android 使用相同的在 android 中也称为org json B 只是它遗漏了一些相对关键的功能现在我想做的是设置我的 grad
Android 回调监听器 - 将 SDK 中的 pojo 的值发送到应用程序的 Activity

我有一个深埋在 SDK 中的 java 类它执行一个操作并返回一个布尔值它不知道应用程序的主要活动但我需要主要活动来接收该布尔值我见过很多关于回调广播和监听器的问题但他们似乎都了解该活动我的 pojo 确实有一个 Activi
无法加载文件或程序集“SharpSvn”或其依赖项之一。尝试加载格式不正确的程序

我刚刚在这里下载了 64 位版本的 SharpSVNthe link http sharpsvn open collab net files documents 180 5570 SSvn 1 7002 1998 x64 zip 当我运行我
创建每 5 分钟刷新一次的物化视图

我创建了一个每 5 分钟刷新一次的物化视图但是当我在物化视图上插入并执行选择时我会得到相同的旧数据吗需要手动刷新吗 CREATE MATERIALIZED VIEW MVW TEST REFRESH FORCE ON DEMAND S
System.Globalization.CultureInfo 不包含 Name 的定义

我对 System Globalization CultureInfo 类和 System Globalization 命名空间有这个特殊问题我从具有 CultureInfo 属性的 API 调用返回一个对象语言我能够成功地将其在客户
我应该在 laravel 5.1 中将模型保存事件监听器放在哪里

Laravel 文档说我应该将模型事件放在EventServiceProvider boot 像这样的方法 public function boot DispatcherContract events Raisefund saved fun
在容器中运行多个相似的进程有意义吗？

提供有关该问题的背景的简要背景目前我和我的团队正在将微服务迁移到 k8s 以减少维护多个部署工具和管道的工作量我们计划迁移的微服务之一是 ETL Worker 它监听 SQS 上的消息并执行多阶段处理它是使用 PHP Laravel
如何使用 html 敏捷包获取自定义标签？

需要创建摘要索引为此我有标签
liquibase中如何设置自增主键字段的起始值

我有一个要求比如我的 mysql 表的主键以 0 开头我应该如何在 liquibase xml 中指定它我在创建表时尝试了 startWith 参数但没有成功
如何使用 np.newaxis？

What is numpy newaxis https numpy org doc stable reference constants html numpy newaxis我什么时候应该使用它在一维数组上使用它x产生 gt gt gt
使用列表列对 data.table 进行分组

我有一个非常大的问题循环遍历 data table 来做我想做的事情太慢了所以我试图绕过循环假设我有一个 data table 如下 a lt data table i c 1 2 3 j c 2 2 6 k list c a b c

使用列表列对 data.table 进行分组

使用列表列对 data.table 进行分组 的相关文章

随机推荐

热门标签

使用列表列对 data.table 进行分组的相关文章