将没有“timevar”的数据帧从长格式转置/重塑为宽格式

2023-12-02

我有一个遵循以下长模式的数据框：

   Name          MedName
  Name1    atenolol 25mg
  Name1     aspirin 81mg
  Name1 sildenafil 100mg
  Name2    atenolol 50mg
  Name2   enalapril 20mg

并希望得到下面的内容（我不在乎是否可以以这种方式命名列，只想要这种格式的数据）：

   Name   medication1    medication2      medication3
  Name1 atenolol 25mg   aspirin 81mg sildenafil 100mg
  Name2 atenolol 50mg enalapril 20mg             NA

通过这个网站，我已经熟悉了 reshape/reshape2 包，并且已经进行了多次尝试来尝试让它工作，但到目前为止都失败了。

当我尝试时dcast(dataframe, Name ~ MedName, value.var='MedName')我只是得到一堆作为药物名称标志的列（转置的值为 1 或 0）示例：

 Name  atenolol 25mg  aspirin 81mg
Name1              1             1
Name2              0             0

我也尝试过一个dcast(dataset, Name ~ variable)在我融化数据集之后，但这只是输出以下内容（仅计算每个人拥有多少药物）：

 Name  MedName
Name1        3
name2        2

最后，我尝试融化数据，然后使用重塑idvar="Name" timevar="variable"（其中全部都是 Medname），但是这似乎不是为我的问题构建的，因为如果 idvar 有多个匹配项，则重塑只采用第一个 MedName 并忽略其余部分。

有谁知道如何使用 reshape 或其他 R 函数来做到这一点？我意识到可能有一种方法可以以更混乱的方式执行此操作，使用一些 for 循环和条件来基本上拆分和重新粘贴数据，但我希望有一个更简单的解决方案。太感谢了！

随着数据表包，这可以很容易地用新的解决rowid功能：

library(data.table)
dcast(setDT(d1), 
      Name ~ rowid(Name, prefix = "medication"), 
      value.var = "MedName")

这使：

   Name    medication1     medication2       medication3
1 Name1  atenolol 25mg    aspirin 81mg  sildenafil 100mg
2 Name2  atenolol 50mg  enalapril 20mg              <NA>

另一种方法（1.9.7版本之前常用）：

dcast(setDT(d1)[, rn := 1:.N, by = Name], 
      Name ~ paste0("medication",rn), 
      value.var = "MedName")

给出相同的结果。

类似的方法，但现在使用dplyr and tidyr套餐：

library(dplyr)
library(tidyr)
d1 %>%
  group_by(Name) %>%
  mutate(rn = paste0("medication",row_number())) %>%
  spread(rn, MedName)

这使：

Source: local data frame [2 x 4]
Groups: Name [2]

    Name   medication1    medication2      medication3
  (fctr)         (chr)          (chr)            (chr)
1  Name1 atenolol 25mg   aspirin 81mg sildenafil 100mg
2  Name2 atenolol 50mg enalapril 20mg               NA

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将没有“timevar”的数据帧从长格式转置/重塑为宽格式的相关文章

ggplot 中的错误问题：“grid.Call(”L_textBounds“, as.graphicsAnnot(x$label), x$x, x$y, … 中的错误”[重复]

这个问题在这里已经有答案了我试图在 ggplot 中制作一个条形图其中我通过强制其中一些标签为长度为零的字符串即来指定要显示的标签但是我收到错误 Error in grid Call L textBounds as graphi
dplyr，do()，从模型中提取参数而不丢失分组变量

R 帮助中关于 do 的示例略有不同 by cyl lt group by mtcars cyl models lt by cyl gt do mod lm mpg disp data coefficients lt models gt d
查找数据帧列表中同一列中的所有重复值并将其转换为 NULL

我有一个清单BELGIAN COAST list包含数百个数据帧 df1 df2 15 列 X 1000 行每个数据帧的最后一列称为Chemicals并包含一些字符例如Sulfate or Ammonia 但是这一列有很多行Chemic
从 R 环境中删除对象

我正在阅读 Hadley 的 Advanced R 在第 8 章中他说我们可以使用以下方法从环境中删除对象 rm 但是移除该物体后我仍然可以看到该物体这是我的代码 e lt new env e a lt 1 e b lt 2 e a
当每个记录都是一个段落并且某些记录有 4 个字段而其他记录有 6 个字段时，如何将文本文件读入 R

如何读取文本文件其中每条记录都是一个段落每个换行符表示单独的字段复杂的是有些记录有 4 行有些记录有 6 行当字段数量的差异为 1 时 DWin 解决了我的问题但当字段数量差异为 2 时一切都崩溃了你可以有一个在这里看看他
从 R 中的 HTTPS 连接逐行读取

当创建连接时open r 它允许逐行读取这对于批量处理大数据流非常有用例如这个脚本 https gist github com jeroenooms d33a24958d99bb969ac0通过一次读取 100 行来解析相当大的 gzi
将 VLMC 拟合到很长的序列

我正在尝试将 VLMC 拟合到最长序列为 296 个状态的数据集我这样做如下所示 Load libraries library PST library RCurl library TraMineR Load and transform d
glmnet 未从 cv.glmnet 收敛 lambda.min

我跑了20倍cv glmnet套索模型以获得 lambda 的最佳值但是当我尝试重现结果时glmnet 我收到一个错误内容如下 Warning messages 1 from glmnet Fortran code error c
为什么这些数字不相等？

下面的代码显然是错误的有什么问题 i lt 0 1 i lt i 0 05 i 1 0 15 if i 0 15 cat i equals 0 15 else cat i does not equal 0 15 i does not eq
R 中的字符串作为函数参数

数据框chocolates列出了糖果的类型以及每种糖果的一组评级 ID sweetness filling crash snickers 0 67 0 55 0 40 milky way 0 81 0 53 0 56 我正在编写一个函数它
R - 通过覆盖和递归合并列表

假设我有两个带有名字的列表 a list a 1 b 2 c list d 1 e 2 d list a 1 b 2 b list a 2 c list e 1 f 2 d 3 e 2 我想递归地合并这些列表如果第二个参数包含冲突的值则
ggplot散点图中的图例问题

我想使用 ggplot 创建显示方法比较数据的散点图绘图应包含原始数据理想线和带误差的拟合线图例应显示理想线和拟合线的线型线宽线颜色我可以获得大部分我想要的东西但是图例存在以下问题图例显示每种线型有 2 条线为什么如何解
如何在R中同时对三个字段进行网络分析

如何在 R 中同时对三个字段进行网络分析下面是示例数据以及desired output在最后一栏中 df lt data frame stringsAsFactors FALSE id 1 c ABC ABC BCD CDE DEF EF
R 中的 Websocket

我设法在 R 中建立到 Mtgox websocket 的连接规格如下 url https socketio mtgox com mtgox Currency USD https socketio mtgox com mtgox Curr
R - tidyr - 变异并传播多列

我在 R 中有以下数据框 my df test lt data frame V1 c 1 2 1 V2 c A B A V3 c S1 S1 S2 V4 c x x x V5 c y y y V6 c A B C V7 c D E F my
为什么 \K 似乎消耗了基本 R 的 gsub 中的一个字符

这是一个示例字符串 bcadefgh 我希望我能匹配除了 cad 具有以下模式 wa w K w 如果我想替换所有不是的东西 cad 我可以用gsub 像这样gsub wa w K w bcadefgh perl TRUE 但是这输出 ca
R中将矩阵拆分为子矩阵的函数

我有一个 16 行 12 列的矩阵 M 我想将其拆分为 16 个矩阵的数组每个矩阵有 4 行 3 列我可以通过以下方式手动完成 M matrix sample 0 127 16 12 replace TRUE c 16 12 ma1 M
ggplot2 可视化/显示中的地图错误？

正如您在下面看到的我使用 ggplots 制作的地图上存在一个奇怪的显示问题任何投影似乎都会发生同样的问题这是代码仅包maps and ggplot2需要 mapWorld lt borders world colour gray5
根据R中的前一行和当前行按组计算

我可以根据 R 中的前一行和当前行进行计算对于此数据框 df A B 1 2 2 2 2 3 3 4 5 5 B2 A2 0 5 B1 我可以使用这段代码来计算这个函数 for i in 2 nrow df B i lt 1 2 B i
如何一次导入多个 .csv 文件？

假设我们有一个包含多个 data csv 文件的文件夹每个文件包含相同数量的变量但每个文件来自不同的时间 R 中有没有办法同时导入它们而不必单独导入它们我的问题是我有大约 2000 个数据文件需要导入并且必须使用以下代码单独导入

随机推荐

猫头鹰轮播 - 为同一页面上放置的多个滑块中的每个滑块设置不同的项目编号

我有一个带有多个滑块的页面这些滑块是用猫头鹰轮播创建的我想为每个滑块定义不同数量的可见项目完美的解决方案是在 HTML 中定义可见项的数量作为类或数据我刚刚开始使用 jQuery 所以我只能使用数据属性来传递一个值如下所示 di
如何使用更少的代码计算元素的宽度和高度及其填充/边距值？

我在用height width 方法但其返回值没有填充和边距值我在计算总高度值时没有问题这种方法有效但我的问题是计算所有这些都太长了有没有一种方法可以用更少的代码来计算这些并且没有错误这是 jsFiddle 示例 jQuery
OCaml - 找不到graphics.cma

在顶层加载图形模块时出现错误找不到graphics cma 我正在使用 OS X 并且我很确定我已经正确安装了 OCaml 因为我已经使用它大约一个月了所以看来 Graphics 模块没有包含在 OCaml 包中如何解决此问题或者
在 Debian 上实现 Python 3 机械化的最简单方法是什么？

我最近想移植我的刮刀mechanize Browser到Python 3 我还没有找到任何python3 mechanize包或类似的东西我还不熟悉使用一些特殊程序构建 Python 模块所以我不知道如何使用2to3那里有什么建议么
德尔福印地 Ping 错误 10040

我有一小段代码可以通过 ping 来检查计算机是否处于活动状态我们曾经有一个有 40 台计算机的房间我想通过我的程序远程检查它是否处于活动状态因此我使用 indy 编写了一个小 ping 函数 function TMainForm P
符号工具箱从符号名称中删除最后的“点”

我遇到了八度符号工具箱的奇怪行为其中符号变量以结尾 dot输掉决赛dot suffix pkg load symbolic clear clc syms xxxdot syms Symbolic variables in current
Windows7 Batch，如何在第一个For循环后中断

我正在编写一个简单的脚本来检索以 IP 形式给出的本地主机地址为了获取我的 IPv4 地址 Win7 我编写了简单的 FOR 循环但结果我从最后一个循环代替第一这是批处理代码 cls for f tokens 1 2 delims a
Plotly：如何使用plotly和plotlyexpress绘制回归线？

我有一个数据框 df 其中包含 pm1 和 pm25 列我想用一张图表用 Plotly 显示这两个信号的相关程度到目前为止我已经成功地显示了散点图但我无法绘制信号之间相关性的拟合线到目前为止我已经尝试过 denominator
在Linux中使用命令行将xlsx转换为csv

我正在寻找一种在 Linux 上将 xlsx 文件转换为 csv 文件的方法我不想使用 PHP Perl 或类似的东西因为我正在考虑处理数百万行所以我需要快速的东西我在 Ubuntu 存储库上找到了一个名为 xls2csv 的程序
Git 大文件存储背后的存储机制是什么？

Github最近推出了一个扩大git 以不同的方式存储大文件他们到底是什么意思扩展用 Git 内的文本指针替换大文件您可以在git lfs 源 how a 文本指针被定义 type Pointer struct Version str
QTableView 中只有复选框的列

我在 Sqlite 数据库中有一个表我使用 QTableview 和 QSqlQueryModel 显示该表第一列需要有一个标题它是一个复选框并且该列中的所有项目也需要是复选框我已将第一个列标题实现为复选框并且效果很好由于列中
WCF 4 REST 服务的正确配置是什么？

很抱歉发布这个消息但这让我发疯我在 VS2010 中的 WCF4 REST 模板中使用路由我将 maxreceivedmessagesize 属性设置为某个巨大的数字当我尝试向服务提交 xml 时它仍然给出 HTTP 状态代码 4
通过 BouncyCastle 进行 CSR 签名生成的证书被视为不受信任

我正在努力解决以下问题我有一个 CSR 我使用此代码签署 Override public X509Certificate signCSR Reader pemcsr int validityDays throws APIException
如何知道用户是否已经喜欢 Facebook Likebox 中的页面？

我需要找到一种方法来了解读者是否已经喜欢我的页面 Facebook API 中有没有方法可以知道这一点点赞按钮可以为您处理这个问题它会根据用户是否已经喜欢该页面来自动切换按钮的状态如果您在使用喜欢按钮之外需要此功能那么如果您的页
Linux 命令行使用 for 循环并格式化结果

如何使用一个命令行提供特定大小之间的所有文件的列表然后使用名称 md5 和文件大小格式化文件示例输出应该是 file1 MD5 value size file2 MD5 value size etc 我尝试了以下方法但它在单独的行上显
在java中使用jackson反序列化日期字段时抛出自定义异常

DTO Getter Setter ToString public class TestDto NotNull private String id NotNull DateTimeFormat pattern YYYY MM DD T hh
Git 中的 Sign Off 功能有什么用？

有什么意义Git 中的签核功能 git commit signoff 如果需要的话我应该什么时候使用它签核是将补丁添加到 Linux 内核和其他一些项目中的必要条件但大多数项目实际上并不使用它它是在上合组织诉讼 and SCO 的其
在 swift 中将双精度值四舍五入到 x 位小数

谁能告诉我如何在 Swift 中将双精度值四舍五入到 x 位小数 I have var totalWorkTimeInHours totalWorkTime 60 60 With totalWorkTime是秒内的 NSTimeInterv
PHP IDE，用于在远程文件中搜索而不将文件存储到本地[关闭]

Closed 这个问题是无关目前不接受答案是否有任何好的 IDE 可以从远程文件中搜索单词或短语而无需先存储同步到本地计算机我尝试过Aptana 但它似乎无法做到这一点但是远程文件系统很好不存储到本地我尝试过 Netbean
将没有“timevar”的数据帧从长格式转置/重塑为宽格式

我有一个遵循以下长模式的数据框 Name MedName Name1 atenolol 25mg Name1 aspirin 81mg Name1 sildenafil 100mg Name2 atenolol 50mg Name2 ena

将没有“timevar”的数据帧从长格式转置/重塑为宽格式

将没有“timevar”的数据帧从长格式转置/重塑为宽格式 的相关文章

随机推荐

热门标签

将没有“timevar”的数据帧从长格式转置/重塑为宽格式的相关文章