如何拆分 data.frame -> 将合并应用于子集 -> 合并到 data.frame 中

2024-05-12

我真的不知道如何在不使用 for 循环的情况下实现这一目标：

x <- c('a', 'b', 'c', 'd')

> x
[1] "a" "b" "c" "d"

data <- data.frame(
   x=c('a', 'b', 'a', 'b', 'c', 'a', 'a', 'b', 'c', 'd'),
   name=c('one','one', 'two','two','two', 'three', 'four','four','four','four'),
   other=c(1, 4, 5, 3, 2, 4, 5, 6, 3, 2)
)

> data
   x  name other
1  a   one     1
2  b   one     4
3  a   two     5
4  b   two     3
5  c   two     2
6  a three     4
7  a  four     5
8  b  four     6
9  c  four     3
10 d  four     2

我愿意分data通过价值name and merge每个子群都有x填充“缺失的行”，得到如下内容：

> data
   x  name other
1  a   one     1
2  b   one     4
   c   one     0 <- missing row added
   d   one     0 <- missing row added
3  a   two     5
4  b   two     3
5  c   two     2
   d   two     0 <- missing row added
6  a three     4
   b three     0 <- missing row added
   c three     0 <- missing row added
   d three     0 <- missing row added
7  a  four     5
8  b  four     6
9  c  four     3
10 d  four     2

最后，重新格式化data.frame像这样：

> data
   x  one  two  three  four
1  a    1    5      4     5
2  b    4    3      0     6
3  c    0    2      0     3
4  d    0    0      0     2

我可以使用 for 循环来实现它，但我确信必须有更好的解决方案*apply, by, split或类似的东西。有什么建议么？

** 更新 **

我最终对已接受的答案进行了一些修改（再次强调，伙计！），因为我不太喜欢与levels我不关心列的顺序：

grid <- expand.grid(x, unique(data$name))
colnames(grid) <- c("x", "name")
data <- merge(grid, data, all.x = TRUE)
data[is.na(data)] <- 0
dcast(data, x ~ name, value.var = 'other')

Try xtabs。不需要任何包。

首先把级别name按顺序排列各列：

data$name <- factor(data$name, levels = c("one", "two", "three", "four"))
tab <- xtabs(other ~., data)

给予这个c("xtabs", "table")类输出：

> tab
   name
x   one two three four
  a   1   5     4    5
  b   4   3     0    6
  c   0   2     0    3
  d   0   0     0    2

or use as.data.frame.matrix(tab)如果输出有"data.frame"类是所需的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

如何拆分 data.frame -> 将合并应用于子集 -> 合并到 data.frame 中的相关文章

有没有办法在 RStudio 中调试 RScript 调用？

假设我从命令行运行 R 脚本如下所示 Rscript prog R x y z 我想检查某一行的代码目前我无法在 RStudio 中以交互方式调试它因为我不知道如何传递参数由于它设计为从命令行运行因此如何通过命令行 RStudi
可以明确声明包依赖项的版本吗？

我倾向于对我编写的代码进行明确而不是隐含的描述因此在成功创建自己的包之后我立即想到的下一件事是如何最好地确保代码的健壮性和可靠性其中一部分与我的包所依赖的包有关实际问题在这方面是否可以明确声明需要期望哪个版本的包依赖项我正
R从列表中提取数据框，列名中没有前缀

我在列表中放置了一个数据框然后当尝试将其提取回来时我得到了该数据帧的所有以列表键为前缀的列名称有没有办法完全按照最初传递的方式提取数据帧 cols lt c column1 Column2 Column3 df1 lt data f
将summary()写入as.data.frame以在ggplot / R中使用

请查找 af 数据样本t below 我正在使用以下方法进行竞争风险分析etmCIF来自etm package 产生以下结果这很好但需要更好的图形曾经有一个ggtrans etm函数将数据导入ggplot 然而这个功能显然被删除了
使用 dplyr:group_by 将数据帧分成多个子集？

有没有办法根据 group by 组使用 dplyr 将一个数据帧拆分为数据帧的子集 mtcars gt group by cyl gear gt codes 非常感谢好吧并不是你真的想要但你可以这样做tidyr 即nearly一样的
如何获得属于五分位数的x？

我正在大学学习使用 R 进行计量经济学项目所以请原谅我的笨拙基本上使用并给出一个矩阵股票价格行天列公司股票价格另一个矩阵市值行天列公司市值我必须收集第三个矩阵每天观察的属于市值分布第一五分位数的股票价格然后
在 R 中绘制对数正态概率密度

我正在尝试在 R 中生成对数正态概率密度图其中包含 3 个不同的均值对数和标准差对数我尝试了以下方法但我的图表太丑了看起来一点也不好看 x lt seq 0 10 length 100 a lt dlnorm x meanlog 0
从 R 环境中删除对象

我正在阅读 Hadley 的 Advanced R 在第 8 章中他说我们可以使用以下方法从环境中删除对象 rm 但是移除该物体后我仍然可以看到该物体这是我的代码 e lt new env e a lt 1 e b lt 2 e a
在另一个 Rmd 中运行选定的块

我已经在源 Rmd 文件中运行了分析并且希望仅使用few来自源的块我已经看到了一些关于从源 Rmd 中提取所有块的答案来自另一个 Rmd 中的 Rmd 文件的源代码 https stackoverflow com questions 4
R 更改小数位且不四舍五入

gt signif 1 89 digits 2 1 1 9 我想要1 8 这有点笨拙但它会起作用并保持所有数字 x lt 1 829380 trunc dec lt function x n floor x 10 n 10 n Resul
逻辑回归/二项式的 glmnet 误差

当尝试将 glmnet 与 family binomial 配合以进行逻辑回归拟合时出现此错误 gt data lt read csv DAFMM HE16 matrix csv header F gt x lt as data fram
如何按 data.table 中的十分位数组计算统计数据

我有一个 data table 想按组计算统计数据 R set seed 1 R DT data table a rnorm 100 b rnorm 100 这些组应该定义为 R quantile DT a probs seq 1 9 1
R：表格格式

我有一个包含以下列的 Excel 文件 Column1 Column2 Column3 ab bb 0 5 ab bc 0 1 ab cd 0 7 ab dd 0 8 ac bb 0 2 ac bg 0 8 ac ee 0 8 ac dd
在 R 中使用 Huggingface Transformer 模型

我正在尝试在 R 中使用不同的 Huggingface 模型这是通过 reticulate 导入 Transformer 包来实现的谢谢 https rpubs com eR ic transfoRmers https rpubs co
使用 dplyr::filter 的整洁方式是什么？

使用下面的函数调用foo c b 输出以内联方式显示正确的写作方式是什么df gt filter x gt x 我已经包含了一个使用的示例mutate以整洁的风格与之对比filter foo lt function variables x
16 位以上整数的计算

我有两个大整数两者都超过 16 位确切地说是 20 位而且我知道由于双精度浮点运算我在使用这些数字进行计算甚至将它们存储在变量中独立于编程语言时受到限制不过我想也许gmp图书馆应该处理它们但不幸的是它没有可以计算更大的整
R 中的 Websocket

我设法在 R 中建立到 Mtgox websocket 的连接规格如下 url https socketio mtgox com mtgox Currency USD https socketio mtgox com mtgox Curr
GGPLOT2：如何在 ggplot() 脚本中绘制特定选择

这是一个名为的大型数据集的峰值P 其中有 10 个优惠 CS 有不同的商店 SHP 具有多个数值数据集列出了按周排序的它们 WK 2 tm 52 它创建一个大文件仅前 6 行出现峰值 WK MND CS SHP RevCY RevLY
如何将 ggrough 图表另存为 .png

说我正在使用R包裹ggrough https xvrdm github io ggrough https xvrdm github io ggrough 我有这个代码取自该网页 library ggplot2 library ggroug
非闪亮上下文中的反应式对象绑定

实际问题你怎样才能近似反应性环境行为 http shiny rstudio com tutorial lesson6 建立者shiny http shiny rstudio com函数或者甚至可能在一个函数中使用这些函数无光泽上下文以

随机推荐

检索受“rowspan”影响的行的列索引的最有效方法是什么？

考虑下表 table thead tr th th th A th th B th th C th tr thead tbody tr th 1 th td Apples td td Oranges td td Pears td tr tb
XSLT：我们可以使用abs值吗？

我想知道在 XSLT 中我们是否可以使用 math abs 我在某处看到过这个但它不起作用我有类似的东西
ipython/jupyter 中的 tk 问题

我正在尝试编写一个用于从 ipython jupyter 笔记本启动的 gui 但在笔记本中使用 tkinter 时遇到了麻烦特别是在让 tk gui 窗口正常关闭方面如何从 jupyter 制作启动 tkinter gui 然后在不
Bugzilla 还是 Mantis？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
PHP date_sun_info 错误时间

我正在尝试使用 PHPdate sun info函数获取全天太阳某些位置的时间信息目前我正在使用类似于中的代码文档 http php net manual en function date sun info php sun info da
使用MockWebServer暂停功能测试

我正在测试使用 MockWebServer 的挂起函数返回结果的 api 但它不适用于 runBlockingTest testCoroutineDispatcher testCorounieScope 除非launch使用builder
有没有办法列出Git中未修改的文件？

我从另一个来源以 tarball 的形式获取了一些更改我想知道哪些文件没有更改目标是 Git 克隆因此可以轻松查看新增内容和更改内容有人知道如何获取未更改内容的列表不包括未跟踪的内容吗编辑换句话说我希望利用 Git 来查找
django-tastypie：无法访问脱水中的bundle.request（self，bundle）

我发现有人有同样的问题但他的安慰对我不起作用看Django Tastypie 如何访问 Bundle 中的 Http request 对象 https stackoverflow com questions 7389632 我正在尝试应
Strapi v4 使用补丁包自定义页面

我想用我的自定义文本更改登录页面内的文本我做了一些改变node modules strapi admin src pages AuthPage components Login BaseLogin js 在编辑该文件之前我安装patch
使用 Selenium for C# 登录 Facebook

我一直在使用 Selenium C 框架并尝试进行 facebook 登录但没有任何运气这是我到目前为止得到的基于这篇文章使用 Selenium 测试 Facebook Connect 应用程序 https stackoverflo
UIView 内的 UIButton 目标操作

我有一个习惯UIView我创建了一个UIButton 在该视图中我有以下代码 func setupViews menuControlButton addTarget self action toggleButton forControlE
在Python中整齐地绘制PMF

有没有一个库可以帮助我在 python 中整齐地绘制样本的概率质量函数如下所示通过matplotlib pyplot的stem模块 matplotlib pyplot stem args kwargs from matplotlib p
如何从一组重叠的圆计算多边形集？

这个问题是一些计算细节的扩展这个问题 https stackoverflow com questions 1667310 combined area of overlapping circles 假设有一组可能重叠的圆并且希望计算这组
PyQt5 的 OpenGL 模块和版本控制问题（调用不正确的 _QOpenGLFunctions_(ver)）

我一直在努力得到PyQt5 helloGL 示例代码 https github com baoboa pyqt5 blob master examples opengl hellogl py编译当我尝试构建解决方案时我得到 Traceb
Perl 单元测试只针对模块，而不针对程序吗？

我在网上找到的文档和我拥有的书 Perl测试或者说或者建议 Perl 的单元测试通常是在创建模块时完成的这是真的有没有办法使用单元测试实际程序Test More和表兄弟姐妹当然您可以使用测试脚本测试更多 http search
全日历与 UTC 和本地日期的混淆

我确实让 fullcalendar 正常初始化所以它代表当前日期午夜 gt 午夜 1 天 1 小时时段我从其他一些数据源获取带有时间戳的数据格式为 YYYY MM DD HH mm 作为字符串传输无时区信息因此我将该字符串转换
如何安全地将 CGFloat 降低或提高到 int？

我经常需要在地板或天花板上安装CGFloat to an int 用于计算数组索引我永远看到的问题floorf theCGFloat or ceilf theCGFloat 是浮点不准确可能会带来麻烦那如果我的CGFloat is 2
seaborn 箱线图的子图

我有一个像这样的数据框 import seaborn as sns import pandas as pd pylab inline df pd DataFrame a one one two two one two one one one
React Native 中 fontAwesome 图标的圆形轮廓

我想使用 fontAwesome 图标使其位于圆圈的中间我想将它用作一个图标项我读到我们可以将它与圆形图标一起使用并将其放置在其中但我无法使其工作 import IconFA from react native vector ico
如何拆分 data.frame -> 将合并应用于子集 -> 合并到 data.frame 中

我真的不知道如何在不使用 for 循环的情况下实现这一目标 x lt c a b c d gt x 1 a b c d data lt data frame x c a b a b c a a b c d name c one one tw

如何拆分 data.frame -> 将合并应用于子集 -> 合并到 data.frame 中

如何拆分 data.frame -> 将合并应用于子集 -> 合并到 data.frame 中 的相关文章

随机推荐

热门标签

如何拆分 data.frame -> 将合并应用于子集 -> 合并到 data.frame 中的相关文章