合并行，连接以逗号分隔的一列中的内容-R 编程

2023-12-02

我需要帮助合并数据（mydf）中具有相同名称（即起始列）的行，并连接“ALT”列中的内容，从而根据起始列中的相似值删除所有重复的行。我想合并行并连接“ALT”列中用逗号分隔的内容，并得到如下所示的结果。感谢您的帮助。

> mydf
         chr          start      end REF ALT         TYPE refGene               
       chr10 chr10:176131 176131   C   A          snp nonsynonymous SNV 
       chr10 chr10:159149 159149   C   G snp:17659149 nonsynonymous SNV 
       chr10 chr10:159149 159149   C   T snp:17659149 nonsynonymous SNV 
       chr10 chr10:241469 241469   T   C          snp          splicing 

> result
         chr          start      end REF ALT         TYPE refGene                   
       chr10 chr10:176131 176131   C   A          snp nonsynonymous SNV 
       chr10 chr10:159149 159149   C   G,T snp:17659149 nonsynonymous SNV 
       chr10 chr10:241469 241469   T   C          snp          splicing

DPUT 在这里：

structure(list(chr = c("chr3", "chr3", "chr3", "chr3"), start = c("chr3:75786036", 
"chr3:75786337", "chr3:75786337", "chr3:75788226"), end = c(75786036, 
75786337, 75786337, 75788226), REF = c("A", "G", "G", "C"), ALT = c("G", 
"A", "T", "A"), TYPE = c("snp:75786036", "snp:75786337", "snp:75786337", 
"snp:75788226"), `refGene::location` = c("nonsynonymous SNV", 
"nonsynonymous SNV", "nonsynonymous SNV", "nonsynonymous SNV"
), `refGene::type` = c("ZNF717:NM_001290208:exon5:c.T2738C:p.F913S,ZNF717:NM_001128223:exon5:c.T2738C:p.F913S,ZNF717:NM_001290209:exon5:c.T2588C:p.F863S,", 
"ZNF717:NM_001290208:exon5:c.C2437T:p.P813S,ZNF717:NM_001128223:exon5:c.C2437T:p.P813S,ZNF717:NM_001290209:exon5:c.C2287T:p.P763S,", 
"ZNF717:NM_001290208:exon5:c.C2437A:p.P813T,ZNF717:NM_001128223:exon5:c.C2437A:p.P813T,ZNF717:NM_001290209:exon5:c.C2287A:p.P763T,", 
"ZNF717:NM_001290208:exon5:c.G548T:p.C183F,ZNF717:NM_001128223:exon5:c.G548T:p.C183F,ZNF717:NM_001290209:exon5:c.G398T:p.C133F,"
)), .Names = c("chr", "start", "end", "REF", "ALT", "TYPE", "refGene::location", 
"refGene::type"), row.names = c("4041", "4051", "4052", "4128"
), class = "data.frame")

这是一个dplyr解决方案：

library(dplyr)
df %>% group_by(start) %>% 
       mutate(ALT = paste(ALT, collapse=",")) %>%
       distinct(start)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

合并行，连接以逗号分隔的一列中的内容-R 编程的相关文章

如何提取与 R 中主题 ID 列表匹配的行？

我有一个包含许多主题 ID 的数据框每个主题都有重复观察我还有一个单独的数据框其中只有一个主题 ID 列表我想从更大的数据框中匹配和提取如何以允许我引用不同数据帧中的SubjectID列表的方式编写代码不确定我是否完全理解这个问
将命名参数列表传递给函数？

我想编写一个小函数来从适当的分布生成样本例如 makeSample lt function n dist params values lt makeSample 100 unif list min 0 max 10 values lt m
如何对同一列上的数据帧列表中的所有数据帧进行排序？

我有一个数据框列表dataframes list 举个例子我把dput dataframes list 在底部我想对列列表中的所有数据框进行排序enrichment 我可以对一个数据框进行排序 first dataframe lt da
如何在R中删除重复项

我有一个非常大的数据集如下所示 df lt data frame school c a a a b b c c c year c 3 3 1 4 2 4 3 1 GPA c 4 4 4 3 3 3 2 2 school year GPA
如何在 ggplot 中保持配色方案，同时删除每个图中未使用的级别？

我想比较一个图中的数据的一些子组和另一图中的一些其他子组如果我绘制一个图其中绘制了所有子组那么这个数字将是巨大的并且每个单独的比较都会变得困难我认为如果给定的子组在所有图中都具有相同的颜色这对读者来说会更有意义这是我尝试过的两
使用 broom 和 tidyverse 总结 r 平方游戏

我发布了一个问题here https stackoverflow com questions 48627287 getting adjusted r squared value for each line in a geom smooth
如何从 R 运行带有特定模块的 perl 脚本？

我可以从终端运行 perl 脚本 myperlscript pl 没有任何问题但是如果我尝试从 RStudio 中运行相同的 perl 脚本则会出现以下错误 command lt myperlscript pl outputfile
计算每个唯一值出现的次数

假设我有 v rep c 1 2 2 2 25 现在我想计算每个唯一值出现的次数 unique v 返回唯一值是什么但不返回它们的数量 gt unique v 1 1 2 我想要一些能给我的东西 length v v 1 1 25 le
如何从 Fortran 调用 R 函数？

根据http gallery rcpp org articles r function from c http gallery rcpp org articles r function from c Rcpp 允许用户从 C 调用 R 函数
使用 purrr 迭代替换数据帧列中的字符串

我想用purrr使用以下命令在数据框列上迭代运行多个字符串替换gsub 功能这是示例数据框 df lt data frame Year 2019 Text c rep a aa 5 rep a bb 3 rep a cc 2 gt df
如何计算R中移动窗口内的平均斜率

我的数据集包含2个变量y 和 t 05s y 每 05 秒测量一次我正在尝试计算移动中的平均坡度20秒窗口即计算第一个 20 秒斜率值后窗口向前移动一个时间单位 05 秒并计算下一个 20 秒窗口在以下位置生成连续 20 秒斜率值
使用 pracma::findpeaks 识别持续峰值

我的语法有问题peakpat内的选项findpeaks内的函数pramcaR 包 v 2 1 1 我使用的是 R 3 4 3 x64 Windows 我希望该函数能够识别可能有两个重复值的峰值并且我相信该选项peakpat这就是我能做到的
多功能测试仪替代 system.time

我已经看到我认为是这样使用了类似于 system time 的函数它可以同时评估多个函数的时间并输出一个输出我不记得它是什么并且用我正在使用的术语进行互联网搜索并没有得到我想要的响应有人知道我正在谈论的功能的名称位置吗你想要
通过间接引用列来修改数据框中的某些值

我正在整理一些数据我们将失败的数据分类到垃圾箱中并按批次计算每个分类箱的有限产量我有一个描述排序箱的元表这些行按升序测试顺序排列一些排序标签带有非语法名称 sort tbl lt tibble tribble weight lab
twitterR 和 ROAuth R 软件包安装

我在安装 CRAN 上的 twitteR 和 RAOuth 软件包时遇到一些问题我尝试了几种不同的方法在 Windows 下使用源代码在 Ubuntu 下使用 RStudio 我尝试了以下命令 sudo apt get install
R独特的列或行与NA无可比拟

有谁知道如果incomparables的论证unique or duplicated 曾经被实施过incomparables FALSE 也许我不明白它应该如何工作无论如何我正在寻找一个巧妙的解决方案以仅保留与另一列相同的唯一列或行
为什么 dplyr filter() 不能在函数内工作（即使用变量作为列名）？

使用 dplyr 函数对数据进行过滤分组和变异的函数基本管道序列在函数之外工作得很好这就是我使用真实列名称的地方将其放入一个函数中其中列名称是一个变量并且某些函数可以工作但有些函数则不能尤其是 dplyr filter 例如
以引用透明的方式从函数的省略号参数中提取符号

事情又发生了我正要按下发布答案按钮的问题被删除了我正在寻找一种方法来从函数的省略号参数中提取绑定到符号的对象的值以及符号也就是说我试图以引用透明的方式从省略号中提取符号我尝试过使用替代品和lazy dots 但没有成功 funct
在 R 中使用 lapply 绘制多个数据帧

我正在尝试使用 lapply 函数绘制多个数据帧每个数据帧一个图但是尽管有关此主题的所有帖子我都找不到答案因为我不断收到错误图的输出列表为空我的数据结构如下 df1 lt mtcars gt group by cyl gt tal
只读取选定的列

谁能告诉我如何仅读取下面每年数据的前 6 个月 7 列例如使用read table Year Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2009 41 27 25 31 31 39 2

随机推荐

具有 DatabaseGenerateOption.Identity Guid Id 的 EF6 实体强制插入我的 Id 值

我正在尝试使用 EF 导出导入 DbContext 的现有数据库在此上下文中有多个实体具有 Guid Id 属性以及由 ModelBuilder 定义的 DatabaseGeneeratedOption Identity 当我重新导入
读取Python中的最低有效位

我必须在 Python 中解析系统日志消息的功能和严重性这些值作为单个整数随每条消息一起提供事件的严重性为 0 7 在整数的 3 个最低有效位中指定从数字中评估这 3 位的最简单最快的方法是什么我现在的代码只是右移 3 位然后将
无法使用 Django 3.0.3 中的迁移 API 来使用 ModelState 和 ProjectState 进行迁移

我正在使用 ProjectState 迁移到表的新属性我试图了解 Django 3 0 3 中迁移 API 的 ModelState 和 ProjectState 使用我无法迁移到有新字段的新州有人可以帮我吗ProjectState
按类型将引用 bean 自动装配到列表中

我有一个类其中包含以下对象列表Daemon type class Xyz List
删除
标签 HTML 上方和下方的空格

拿着它ul例如 ul li HI THERE li br li p ME p li ul 当innerHtml的li标签为空则li将自身包裹到文本处这不会发生在p标签我假设这是因为p适用于前后通常有空格的段落有什么办法可以去除这个吗
Objective C - 1 个 .h 文件需要 2 个 .m 文件？

我的问题是我知道如何将 2 个 m 文件用于一个对象类以及一个标头 h 我有一个包含 20000 多行的大方法并且我希望该方法独立于 m 文件中而其他方法独立于其他 m 文件中我已经完成了但出现错误这些方法不在一个 m 文件中
使用 javascript 设置背景图像

在 chrome safari 和 opera 中将背景图像设置为绝对引用例如 images image png 将其更改为 http sitepath images image png 它在 Firefox 中不会执行此操作有什么办
Firebase Auth：通过电子邮件或电话号码获取用户

我正在构建一个Android我使用不同的方式让用户注册自己的应用程序例如电子邮件密码电话 Google Facebook Twitter 我还希望用户能够相互添加为联系人如果我只使用电子邮件和 Google 那么实现这一点会很容易
Hibernate：奇怪的行为 - 需要在另一个会话中进行第二次 commit() 才能访问表条目

我有一个抽象类它只提供对会话创建的简单访问 private Session currentSession null private Transaction currentTransaction null protected void op
远程 Webdriver Chrome 抛出“驱动程序可执行文件的路径”错误

你好当我使用以下代码时 IWebDriver webDriver new RemoteWebDriver new Uri http 127 0 0 1 4444 wd hub DesiredCapabilities Chrome 我收到以
当我在 onCreate() 中调用 findViewById() 时，它返回 null

我的第一个 Android 应用程序上的 findViewById 遇到问题我试图调用这个函数但总是返回 null 我的应用程序有 2 个活动在第二个活动 activity display message 中我有以下代码 Overri
ASP.NET Web 应用程序中的多个 Web.Config 文件

我有一个 ASP NET Web 应用程序其中根文件夹中有多个子目录在我的根 web config 中我将 sessionMode 设置为 StateServer 因此在我的子目录的一页中我无法进行序列化如果我将 Session
C++ 中的 PyQt 自定义小部件

我可以用纯 C 编写自定义 Qt 小部件编译它并在 PyQt 中使用吗我正在尝试将 ctypes opencv 与 qt 一起使用但我在使用 python 代码以 Qt 形式显示 opencv 图像时遇到性能问题您必须使用以下方法为
Map对象转换为列表后清空自身

我不明白为什么map对象刷新自身如果这就是它正在做的事情这是我尝试过的 gt gt gt squares map lambda x x 2 range 10 gt gt gt squares
使用 JAXB 对 XML 进行部分解组以跳过某些 xmlElement

我想使用 JAXB 将 XML 文件解组为 java 对象 XML 文件非常大包含一些节点在某些情况下我想跳过这些节点以提高性能因为这些元素不可由客户端 java 程序编辑 XML 示例如下
如何从 NSDate 对象检索午夜过后的小时数？

我需要从 iPhone 项目中的 UIDatePicker 控件检索午夜过后的小时数 datePickerMode被设定为UIDatePickerModeTime 所以用户只能设置时间不能设置日期当用户完成并关闭 UIDatePicke
f 升值的合并排序

这是我的代码当我输入一个非常大的数字时我收到堆栈溢出错误有人知道为什么吗当我输入一个非常大的数字时我收到该错误我不太确定是什么原因导致的只有大数字小数字才能正常工作 merge two sorted lists into one
Android Studio 1.2.2 ClassNotFoundException android.widget.viewstub

我刚刚安装了 Android Studio 每当我启动一个项目时甚至是 IDE 创建的默认 Hello world 活动我有一个例外 java lang ClassNotFoundException 未找到类路径上的 android
如何将我的 Zip 文件转换为 NSData 以将我的 Zip 文件作为附件通过电子邮件发送

我正在使用 Objective Zip 库来压缩我拍摄的几张图像我我猜已经到了压缩图像的地步了现在我想用邮件编辑器发送这个压缩文件但是我需要在我的邮件函数中声明一个 NSData 对象 picker addAttachmentDa
合并行，连接以逗号分隔的一列中的内容-R 编程

我需要帮助合并数据 mydf 中具有相同名称即起始列的行并连接 ALT 列中的内容从而根据起始列中的相似值删除所有重复的行我想合并行并连接 ALT 列中用逗号分隔的内容并得到如下所示的结果感谢您的帮助 gt mydf chr

合并行，连接以逗号分隔的一列中的内容-R 编程

合并行，连接以逗号分隔的一列中的内容-R 编程 的相关文章

随机推荐

热门标签

合并行，连接以逗号分隔的一列中的内容-R 编程的相关文章