复制data.frame的每一行并指定每行的复制次数？

2024-01-23

我在 R 中编程，遇到以下问题：

我有一个数据字符串 jb，它很长。这是它的一个简单版本：

jb:    a     b     frequency               jb.expanded: a    b   
       5     3        2                                 5    3
       5     7        1                                 5    3
       9     1        40                                5    7
       12    4        5                                 9    1
       12    5        13                                9    1
                                                        ...  ...

我想复制行，复制的频率就是列频率。这意味着，第一行被复制两次，第二行被复制一次，依此类推。我已经用代码解决了这个问题

jb.expanded <- jb[rep(row.names(jb), jb$freqency), 1:2]

现在问题来了：

每当频率角中的任何数字大于 10 时，复制列的数量就是错误的。例如：

Frequency: 43 --> 14 columns
           40 --> 13 columns
           13 --> 11 columns
           14 --> 12 columns

你能帮助我吗？我不知道如何解决这个问题，我也在互联网上找不到任何内容。

感谢您的帮助！

Update

重新审视这个问题后，我有一种感觉@Codoremifa 的假设是正确的，即您的“频率”列可能是factor.

如果是这种情况，这里有一个例子。它与您的实际数据不匹配，因为我不知道您的数据集中还有哪些其他级别。

mydf$F2 <- factor(as.character(mydf$frequency))
## expandRows(mydf, "F2")
mydf[rep(rownames(mydf), mydf$F2), ]
#      a b frequency F2
# 1    5 3         2  2
# 1.1  5 3         2  2
# 1.2  5 3         2  2
# 2    5 7         1  1
# 3    9 1        40 40
# 3.1  9 1        40 40
# 3.2  9 1        40 40
# 3.3  9 1        40 40
# 4   12 4         5  5
# 4.1 12 4         5  5
# 4.2 12 4         5  5
# 4.3 12 4         5  5
# 4.4 12 4         5  5
# 5   12 5        13 13
# 5.1 12 5        13 13

嗯。对我来说，这看起来不像 61 行。为什么不？因为rep使用底层的数值factor，在这种情况下与显示的值有很大不同：

as.numeric(mydf$F2)
# [1] 3 1 4 5 2

要正确转换它，您需要：

as.numeric(as.character(mydf$F2))
# [1]  2  1 40  5 13

原答案

不久前，我写了一个函数，它是 @Simono101 答案的概括。该函数如下所示：

expandRows <- function(dataset, count, count.is.col = TRUE) {
  if (!isTRUE(count.is.col)) {
    if (length(count) == 1) {
      dataset[rep(rownames(dataset), each = count), ]
    } else {
      if (length(count) != nrow(dataset)) {
        stop("Expand vector does not match number of rows in data.frame")
      }
      dataset[rep(rownames(dataset), count), ]
    }
  } else {
    dataset[rep(rownames(dataset), dataset[[count]]), 
            setdiff(names(dataset), names(dataset[count]))]
  }
}

出于您的目的，您可以使用expandRows(mydf, "frequency")

head(expandRows(mydf, "frequency"))
#     a b
# 1   5 3
# 1.1 5 3
# 2   5 7
# 3   9 1
# 3.1 9 1
# 3.2 9 1

其他选项是将每行重复相同的次数：

expandRows(mydf, 2, count.is.col=FALSE)
#      a b frequency
# 1    5 3         2
# 1.1  5 3         2
# 2    5 7         1
# 2.1  5 7         1
# 3    9 1        40
# 3.1  9 1        40
# 4   12 4         5
# 4.1 12 4         5
# 5   12 5        13
# 5.1 12 5        13

或者指定每行重复次数的向量。

expandRows(mydf, c(1, 2, 1, 0, 2), count.is.col=FALSE)
#      a b frequency
# 1    5 3         2
# 2    5 7         1
# 2.1  5 7         1
# 3    9 1        40
# 5   12 5        13
# 5.1 12 5        13

注意需要的count.is.col = FALSE最后两个选项的争论。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

replication

复制data.frame的每一行并指定每行的复制次数？的相关文章

如何使用 usmap 标记数字而不是名称？

我知道 usmap 有一个选项label in plot usmap 我想标记一些数字而不是状态名称我想 usmap 中应该有与州质心坐标相关的数据但我不知道如何找到它如果我能得到坐标然后我可以用它来标记数字geom text 这
kernlab 中 SVM 训练之外的核矩阵计算

我正在开发一种新算法该算法可以生成修改后的核矩阵以用于 SVM 训练但遇到了一个奇怪的问题出于测试目的我比较了使用 kernelMatrix 接口和普通内核接口学习的 SVM 模型例如 Model with kernelMatri
为什么 dplyr filter() 不能在函数内工作（即使用变量作为列名）？

使用 dplyr 函数对数据进行过滤分组和变异的函数基本管道序列在函数之外工作得很好这就是我使用真实列名称的地方将其放入一个函数中其中列名称是一个变量并且某些函数可以工作但有些函数则不能尤其是 dplyr filter 例如
API 请求和curl::curl_fetch_memory(url, handle = handle) 中的错误：SSL 证书问题：证书已过期

几天前我运行了代码几个月没有任何问题 GET url myurl query 今天我遇到一个错误 Error in curl curl fetch memory url handle handle SSL certificate pro
Purrr::map_df() 删除 NULL 行

使用时purrr map df 我偶尔会传递一个数据框列表其中一些项目是NULL 当我做 map df 返回行数少于原始列表的数据框我想发生的事情是这样的map df calls dplyr bind rows 它忽略了NULL价值观
将每列的值乘以 R 中另一个 data.frame 中的权重

我有两个data frames df and weights 代码如下 df看起来像这样 id a b d EE f 1 this 0 23421153 0 02324956 0 5457353 0 73068586 0 5642554 2
基于时间窗口的不规则时间序列的优化滚动函数

有没有办法使用 rollapply 来自zoo包或类似的东西优化功能 rollmean rollmedian等使用基于时间的窗口计算滚动函数而不是基于大量观察的函数我想要的很简单对于不规则时间序列中的每个元素我想计算一个具有 N
文本挖掘 pdf 文件/词频问题

我正在尝试挖掘一篇具有丰富 pdf 编码和图表的文章的 pdf 我注意到当我挖掘一些 pdf 文档时我得到的高频词是 phi taeoe toe sigma gamma 等它与某些 pdf 文档配合良好但与其他文档配合使用时却得到这
使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce
如何获得所有大于x且有位置的数字？

V lt c 1 3 2 4 2 3 1 X lt 3 pos lt V V X pos is 3 3 我需要的是所有 3 个的位置 I need 2 and 6 哪些职位是3 in V Use which pos lt which V 3
计算 R 中各列的唯一值

我正在尝试创建一个新变量其中包含来自两个不同列的字符串值的唯一计数所以我有这样的东西例如 A tibble 4 x 2 names partners
在 Rcpp 中使用其他包中的 C 函数

我试图从 C 函数中的 cubature 包调用 C 例程来执行多维积分我试图重现的基本 R 示例是 library cubature integrand lt function x sin x adaptIntegrate integr
所有 x 轴标签未以 45 度显示

I m having the code as like below But I m not getting all the x axis labels and it is not displaying in 45 degree when I
R“错误：“}”中出现意外的“}”[重复]

这个问题在这里已经有答案了我有一个字符串变量对于缺少数据的情况它具有空值我想将空值重新编码为缺失而不是说空值我正在尝试编写一个循环来删除这些空值条目但我不断收到错误错误中出现意外的 for row in dat
删除极坐标图边缘的多余空间和圆环

我有一个极坐标图ggplot2我已经非常接近完成相当简单的情节我已经能够在删除矩形边框方面获得帮助但我不需要删除最后一个范围轮廓与带有方位角标签的绘图周围的环之间的额外空间我希望该图的边界为 15 000 而不是 15 214 我编
如何在将两根柱子保持在一起的同时熔化柱子？

我有这种宽格式的数据我想将其转换为长格式 Cond Construct Line Plant Tube shoot weight shoot Tube root weight root 1 Standard NA NA 2 199 95
R：使用 tidyverse 将 NA 替换为 df 中的其他变量

我想使用 tidyverse 替换 df 中的 NA 值我想要的值应该从其他列中计算出来 input ID X1 X2 X3 A 0 96 NA 0 97 B 1 00 NA 1 01 C 0 98 0 03 NA A 1 00 NA 1
无法更改 RStudio 中的 R 版本

我的 RStudio V 0 99 491 无法更改 R 版本我以平常的方式行事Global Options gt R Version 然后它挂起并且不再工作或反应 R 运行良好的初始版本是R 3 1 0 我以前从未遇到过这样的问题也许
如何修复 R 中 Kaplan Meier 图的风险表计算错误

以下是一个数据帧其中 6 个参与者中的每一个都有唯一的 record ID 我想绘制一个生存分析图其中包含感兴趣事件的复发以及在时间间隔 tstart 到 tstop 内暴露药物剂量数值变量的时间依赖性协变量每个参与者的最大
识别 pandas 数据框中各组之间的差异

我有一个按日期和 ID 索引的 pandas 数据框我想识别日期之间增删的ID 将 ID 添加到另一个数据帧以及添加删除的日期 date ID value 12 31 2010 13 0 124409 9 0 555959 1 0 7

随机推荐

neo4j 导入速度减慢

我正在尝试使用 cypher 将大约 500 000 个节点的中等数据集导入到 neo4j 中我在配备 SSD 的 3 4 GHz i7 iMac 上本地运行 neo4j community 2 0 0 M05 我将密码传输到 neo4j
用完整的背景图像填充 svg 路径

我有下一个 svg
如何检测malloc失败？

有什么便携式方法可以检查是否malloc分配非零内存块失败根据单一 Unix 规范 http pubs opengroup org onlinepubs 007908799 xsh malloc html malloc将返回NULL并设置
AppDomain.CurrentDomain.Evidence 抛出 SerializationException

在 VS 2013 中使用 ReSharper 8 2 2 运行测试用例时我遇到了一个奇怪的错误演示问题的简化测试用例仅包含两行代码 CallContext LogicalSetData mydata new ActivityStack
无法从 Angular 中的资产文件夹加载 CSS 文件

我尝试在 Angular 5 项目中从资产文件夹加载 CSS 文件在这个文件夹中我有一个完整的模板当我打开文件夹中的默认 index html 时它可以正常工作但我想在 setcard component html 中使用它我打
nHibernate在多个线程上枚举相同的集合

我有一个生产应用程序 IIS8 MVC5 nHibernate DAL 并且我注意到最近 CPU 使用率很高循环应用程序池修复了它但在从服务器进行一些诊断和内存转储来分析问题之后我注意到多个线程尝试枚举同一集合的一致模式最常见的一点
Terraform v0.12 多行字符串 EOF shell 风格的“here doc”语法没有像 v0.11 之前那样被解释

在 Octopus Deploy 中我使用其应用 Terraform 模板设置了 Terraform 应用步骤在我的 Terraform main tf 文件中我想使用连接在 AWS 中的 Amazon Linux EC2 实例上运行
为什么 IoC/DI 在 Python 中不常见？

In Java IoC http en wikipedia org wiki Inversion of Control DI http en wikipedia org wiki Dependency Injection是一种非常常见的做法
错误 1449 (HY000): 指定为定义者的用户 ('mysql.infoschema'@'localhost') 不存在

我正在尝试列出 ubuntu 操作系统上 mysql 数据库中的所有表但我一直收到这个错误 mysql gt use mysql Database changed mysql gt show tables ERROR 1449 HY000
与 NHibernate ICriteria/QueryOver 查询的外连接中的条件相等

我该如何做equalsNhibernate QueryOver ICriteria 中外连接的条件我发现比较的唯一方法surveyRequest Survey Id with surveyID下面是与IsIn SystemUser sys
HTMLBars 模板中不允许使用“SCRIPT”标签

您好感谢您点击我的问题我刚刚将我的应用程序升级到最新的 ember cli 版本 2 3 0 beta 1 现在我的一个或多个模板搞乱了构建接下来的事情似乎是一个微不足道的问题但我从来没有完全解决它所以我终于问了正如标题所示
如何通过HttpClient以小写形式设置“Connection: keep-alive”标头？

我有一个任务需要能够以与 Firefox 浏览器相同的方式发送 Connection keep alive 标头请注意 keep alive 必须全部小写 Connection keep alive 但是我没有运气使用 HttpCli
州/省的地理边界 -> Google 地图多边形

我正在构建一个 Web 应用程序它将根据按钮和点击事件在 Google 地图上动态突出显示某些美国州和加拿大省份计划 A 多边形我的主要想法是绘制多边形为此我需要所有州和省轮廓顺时针或逆时针的坐标纬度经度列表在政府网站
如何修复“‘ServerVersion’引发‘System.InvalidOperationException’类型的异常”？ [复制]

这个问题在这里已经有答案了我有一个本地 SQL Server 数据库已启动并正在运行并且我正在尝试以一种看似万无一失的方式连接到它 new SqlConnection Server localdb v12 0 Integrated S
传达 Infinispan 远程异常会产生过多的网络流量

当我们的Infinispan集群版本9 4 8 Final 发生异常时出现异常的节点会将此信息发送到集群中的其他节点这似乎是设计使然此活动可能会导致大量流量从而导致超时异常进而使节点想要将其超时异常传达给其他节点在生产中我们
如何使用 Gatsby JS 处理国际化/本地化？

我想在世界各地的不同当地人中发布我的静态网站并提供本地化内容如何实现这一目标我最近添加了一个默认的 Gatsby starter 具有多语言 url 路由和浏览器语言检测功能 demo https gatsby starter defa
Keras Conv2D 和输入通道

Keras 层文档指定了卷积层的输入和输出大小 https keras io layers 卷积 https keras io layers convolutional 输入形状 samples channels rows cols 输出形
如何将多个报告附加在一起？

我有许多报告需要单独运行也需要作为一组运行我已经创建了这些报告并希望我可以创建一个表单在其中可以将 report1 report2 report3 等附加在一起而无需创建不同的报告并制作所有这些报告的子报告这可能吗编辑我在
Akka 在 Actor 之外进行日志记录

我有一个 Akka Actor 打电话给MyObject foo MyObject不是演员如何设置登录使用 Actor 就很简单因为我可以混合 Actor Logging 在 MyObject 中我无权访问 context syst
复制data.frame的每一行并指定每行的复制次数？

我在 R 中编程遇到以下问题我有一个数据字符串 jb 它很长这是它的一个简单版本 jb a b frequency jb expanded a b 5 3 2 5 3 5 7 1 5 3 9 1 40 5 7 12 4 5 9

复制data.frame的每一行并指定每行的复制次数？

Update

原答案

复制data.frame的每一行并指定每行的复制次数？ 的相关文章

随机推荐

热门标签

复制data.frame的每一行并指定每行的复制次数？的相关文章