如何在 R 中对条形图的订单数据进行“分组”？

2023-12-08

我正在研究生物信息学，我需要输出一个包含祖先结果的图表（条形图）。通常，这些图表是通过将人群分组在一起来绘制的。完成的方法是，您只需绘制不同假定人群（此处为 4）的 Q 分数（下面的数据）的条形图。

问题是我使用ord = tbl[order(tbl$V1,tbl$V2,tbl$V3),]对我的价值观进行排序。这样我就看到一些条形条没有聚集在正确的群体中（参见图中应与第一组聚集在一起的橙色条形）。因此，我想知道如何按颜色（代表人口）对条形进行聚类。

有办法解决这个问题吗？

barplotgeno <- function(tbl, # To plot the Q scores (ancestry). 
                        col = c("#FF3030", # nice colors
                                "#9ACD31",
                                "#1D90FF",
                                "#FF8001"), 
                        pdf = TRUE,
                        pdf.path.name = "~/Desktop/Stacked_barplot.pdf") {

  ord = tbl[order(tbl$V1,tbl$V2,tbl$V3),]

  if(pdf) {
    pdf(pdf.path.name, width = 11, height = 8.5)
  bp = barplot(t(as.matrix(ord[,1:dim(ord)[2]-1])), 
               space = c(0.2),#space = c(0),# Space between the bars
               col=col, #rainbow(4),
               xlab="Individual #", 
               ylab="Ancestry", xaxt="n",
               border=NA, main = "Stacked barplot from ADMIXTURE analysis")
  labs <- row.names(ord)
  text(cex=0.5, x=bp+1, y=-0.03, labs, xpd=TRUE, srt=90, pos=2)
    dev.off()
  } else {
    bp = barplot(t(as.matrix(ord[,1:dim(ord)[2]])), 
                 space = c(0.2),
                 col=col, 
                 xlab="Individual #", 
                 ylab="Ancestry", xaxt="n",
                 border=NA, 
                 main = "Stacked barplot from ADMIXTURE analysis")
    labs <- row.names(ord)
    text(cex=0.5, x=bp+1, y=-0.03, labs, xpd=TRUE, srt=90, pos=2)
  }
}

# Example 
barplotgeno(tbl = tbl, pdf = FALSE)

以下是数据：

tbl = structure(list(V1 = c(1e-05, 0.99997, 1e-05, 1e-05, 1e-05, 1e-05, 
1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 0.430202, 0.99997, 
0.801974, 1e-05, 0.99997, 0.99997, 1e-05, 0.999968, 1e-05, 1e-05, 
1.3e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 0.99997, 1e-05, 1.8e-05, 
1e-05, 1.2e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1.1e-05, 1e-05, 0.642925, 
1e-05, 0.99997, 0.99997, 1e-05, 1e-05, 0.99997, 1e-05, 0.99997, 
0.99997, 0.287976, 1e-05, 0.99997, 0.99997, 0.99997, 1e-05, 0.533994, 
0.99997, 0.99997, 1e-05, 0.99997, 1e-05, 0.99997, 1e-05, 1e-05, 
0.99997, 0.99997, 1e-05, 1e-05, 1e-05, 1e-05, 0.307669, 0.99997, 
0.604114, 0.604792, 0.29646, 0.514252, 0.99997, 0.798616, 0.516577, 
1e-05, 1e-05, 1e-05, 1e-05, 0.449886, 1e-05, 1e-05, 1e-05, 1e-05, 
0.790272, 1e-05, 0.576786, 0.776731), V2 = c(0.99997, 1e-05, 
1e-05, 1e-05, 0.99997, 0.99997, 1e-05, 1e-05, 1e-05, 0.99997, 
0.99997, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 
1e-05, 1.2e-05, 0.99997, 1e-05, 1e-05, 1e-05, 0.99997, 1e-05, 
0.99997, 0.99997, 1e-05, 1e-05, 0.528138, 0.99997, 1e-05, 1e-05, 
1e-05, 1e-05, 0.99997, 1e-05, 0.99997, 1e-05, 1e-05, 1e-05, 1e-05, 
1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 0.712004, 0.99997, 
1e-05, 1e-05, 1e-05, 0.99997, 0.465986, 1e-05, 1e-05, 1e-05, 
1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 0.99997, 0.99997, 
0.99997, 0.99997, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 0.05777, 
1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 0.591857, 0.99997, 1e-05, 
0.99997, 0.99997, 0.99997, 0.99997, 1e-05, 1e-05, 1e-05, 1e-05
), V3 = c(1e-05, 1e-05, 1e-05, 0.541112, 1e-05, 1e-05, 0.329922, 
1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 0.198006, 
1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 0.999967, 0.451508, 
1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 0.749225, 
1e-05, 0.99997, 0.99997, 1e-05, 1e-05, 1e-05, 1e-05, 0.442211, 
1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 
1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 0.188, 
1e-05, 0.248756, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 
1e-05, 1e-05, 1e-05, 1e-05, 0.395866, 0.395188, 0.293429, 0.427968, 
1e-05, 0.201364, 0.483403, 1e-05, 1e-05, 0.408123, 1e-05, 0.550094, 
1e-05, 1e-05, 1e-05, 1e-05, 0.209708, 0.533729, 0.423194, 0.223249
), V4 = c(1e-05, 1e-05, 0.99997, 0.458868, 1e-05, 1e-05, 0.670058, 
0.99997, 0.99997, 1e-05, 1e-05, 0.99997, 0.99997, 0.569778, 1e-05, 
1e-05, 0.99997, 1e-05, 1e-05, 0.99997, 1e-05, 1e-05, 0.99997, 
1e-05, 0.548472, 1e-05, 0.99997, 1e-05, 1e-05, 1e-05, 0.99997, 
0.471833, 1e-05, 0.250753, 0.99997, 1e-05, 1e-05, 1e-05, 0.999969, 
1e-05, 0.357055, 0.557769, 1e-05, 1e-05, 0.99997, 0.99997, 1e-05, 
0.99997, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 
1e-05, 1e-05, 1e-05, 0.81198, 1e-05, 0.751224, 1e-05, 0.99997, 
0.99997, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 0.692311, 
1e-05, 1e-05, 1e-05, 0.410101, 1e-05, 1e-05, 1e-05, 1e-05, 0.99997, 
0.99997, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 1e-05, 
0.466251, 1e-05, 1e-05)), .Names = c("V1", "V2", "V3", "V4"), class = "data.frame", row.names = c(NA, 
-93L))

如果您需要一个分组变量，这里是一个（按数据顺序）：

species = c("fuliginosa", "fuliginosa", "fuliginosa", "fuliginosa", "fuliginosa", 
"fuliginosa", "fuliginosa", "fuliginosa", "fuliginosa", "fortis", 
"fuliginosa", "fuliginosa", "fortis", "fortis", "fortis", "fuliginosa", 
"fuliginosa", "fortis", "scandens", "fortis", "fortis", "scandens", 
"scandens", "fuliginosa", "magnirostris", "scandens", "magnirostris", 
"fortis", "fortis", "fortis", "fortis", "fortis", "scandens", 
"fortis", "scandens", "scandens", "magnirostris", "fortis", "fortis", 
"fortis", "scandens", "magnirostris", "magnirostris", "fortis", 
"fortis", "fortis", "fortis", "magnirostris", "fortis", "magnirostris", 
"magnirostris", "magnirostris", "fortis", "fortis", "fortis", 
"magnirostris", "magnirostris", "fortis", "fortis", "fortis", 
"fortis", "fortis", "fortis", "fortis", "fortis", "fortis", "fortis", 
"magnirostris", "fortis", "fortis", "fortis", "fortis", "fortis", 
"fortis", "fortis", "fortis", "fortis", "fortis", "fuliginosa", 
"fortis", "fortis", "fortis", "fortis", "fuliginosa", "fuliginosa", 
"fuliginosa", "fuliginosa", "fortis", "fortis", "fortis", "fortis", 
"fortis", "fortis")

稍微好一点的方法：

library(tidyverse)

plot_data <- tbl %>% 
  mutate(id = row_number()) %>% 
  gather('pop', 'prob', V1:V4) %>% 
  group_by(id) %>% 
  mutate(likely_assignment = pop[which.max(prob)],
         assingment_prob = max(prob)) %>% 
  arrange(likely_assignment, desc(assingment_prob)) %>% 
  ungroup() %>% 
  mutate(id = forcats::fct_inorder(factor(id)))

用 ggplot 绘制的图：

ggplot(plot_data, aes(id, prob, fill = pop)) +
  geom_col() +
  theme_classic()

或者用面：

ggplot(plot_data, aes(id, prob, fill = pop)) +
  geom_col() +
  facet_grid(~likely_assignment, scales = 'free', space = 'free')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

Sorting

plot

barchart

如何在 R 中对条形图的订单数据进行“分组”？的相关文章

将 VLMC 拟合到很长的序列

我正在尝试将 VLMC 拟合到最长序列为 296 个状态的数据集我这样做如下所示 Load libraries library PST library RCurl library TraMineR Load and transform d
如何在 JavaScript 中对关联数组进行排序？

我需要为我的一个项目通过 JS 对关联数组进行排序我发现这个函数在 Firefox 中运行得很好但不幸的是它在 IE8 OPERA CHROME 中不起作用无法找到使其在其他浏览器中运行的方法或者找到另一个适合该目的的函数我真的很
对范围值进行排序

我想对表示数值范围的字符串数组进行排序如下所示 b 0 5 100 250 5 25 50 100 250 500 25 50 使用sort我得到的方法 b sort gt 0 5 100 250 25 50 250 500 5 25 5
根据另一列中的键累积一列中的值时出现问题

我有一个看起来像这样的数据框我需要使用 PROJ ID 列中的字符串创建一个新的值列并形成 PROJ NAME 列中的值字符串这里提供的解决方案根据 r 中另一列的键累积一列中的值 https stackoverflow com q
解析，用三点参数替换

让我们考虑一个典型的deparse substitute R call f1 lt function u x y print deparse substitute x varU vu varX vx varY vy f1 u varU x
比较 R 中的两个字符向量

我有两个 ID 字符向量我想比较这两个字符向量特别是我对以下数字感兴趣 A和B各有多少个ID 有多少个ID在A中但不在B中有多少个ID在B但不在A 我还想画维恩图以下是一些可以尝试的基础知识 gt A c Dog Cat Mouse
使用healpy通过HEALPix像素化制作2D直方图

数据是天空中物体的坐标例如如下 import pylab as plt import numpy as np l np random uniform 180 180 2000 b np random uniform 90 90 2000
glmnet 未从 cv.glmnet 收敛 lambda.min

我跑了20倍cv glmnet套索模型以获得 lambda 的最佳值但是当我尝试重现结果时glmnet 我收到一个错误内容如下 Warning messages 1 from glmnet Fortran code error c
R：表格格式

我有一个包含以下列的 Excel 文件 Column1 Column2 Column3 ab bb 0 5 ab bc 0 1 ab cd 0 7 ab dd 0 8 ac bb 0 2 ac bg 0 8 ac ee 0 8 ac dd
R 中的字符串作为函数参数

数据框chocolates列出了糖果的类型以及每种糖果的一组评级 ID sweetness filling crash snickers 0 67 0 55 0 40 milky way 0 81 0 53 0 56 我正在编写一个函数它
表单提交时出现 rvest 错误

我想从以下网页中抓取数据 https swgoh gg u zozo collection 180 emperor palpatine https swgoh gg u zozo collection 180 emperor palpati
如何计算嵌套函数中的粘合表达式？

我正在尝试嵌套一个函数该函数将两个字符串粘合在一起该函数使用组合字符串来命名数据帧的列然而问题似乎是粘合表达式没有足够早地评估为字符串我可以并且应该强制在将表达式作为参数传递给另一个函数之前对其进行求值吗 library ti
具有 dplyr、tidyverse 和 broom 的相关矩阵 - P 值矩阵

全部我想使用以下方法从相关矩阵中获取 p 值dplyr 和或扫帚包并同时测试多个变量我知道其他方法但 dplyr 对我来说似乎更简单更直观此外 dplyr 需要关联每个变量以获得特定的 p 值这使得该过程更容易更快我检查
R 中的 Websocket

我设法在 R 中建立到 Mtgox websocket 的连接规格如下 url https socketio mtgox com mtgox Currency USD https socketio mtgox com mtgox Curr
对具有混合类型值的数组进行数字排序

我有一个像这样的混合数组 fruits array lemon Lemon 20 banana apple 121 40 50 然后申请sort 其功能如下 sort fruits SORT NUMERIC foreach fruits a
在多行中打印带有列名称的 R 数据框

我有一个带有长列名称的 R 数据框所以当我打印数据框时它太宽了有没有一种简单的方法可以将数据框打印到屏幕上并且列名出现在多行中我知道我可以缩短名字但我不想这样做当奥斯卡的答案被接受时我想这可能真的是一个答案不幸的是这只是复
如何在我自己的网络服务器上导出并托管 ggvis 图表？

据我了解 ggvis 运行在闪亮的之上但我不知道如何在没有 R shiny 的情况下导出在网络服务器上运行单个 ggvis 图表所需的所有文件这对于交互式绘图来说是不可能的因为每个交互式 ggvis 图都必须连接到正在运行的 R 会
R Tidytext 和 unnest_tokens 错误

对 R 非常陌生已经开始使用 tidytext 包我正在尝试使用参数来填充unnest tokens函数这样我就可以进行多列分析所以而不是这个 library janeaustenr library tidytext library
迭代字符串 R 的字符

有人可以解释一下为什么这不会在 R 中单独打印所有数字 numberstring lt 0123456789 for number in numberstring print number 字符串不就是字符数组吗在 R 中该怎么做 In
基于条件反应逻辑闪亮的 Flexdashboard

我正在尝试有条件地进行一种类型的渲染 renderPlot 或其他 renderText 基于一些输入这是我尝试过的 title Citation Extraction output flexdashboard flex dashboar

随机推荐

if 结构什么时候不需要括号？

我正在为 shell 脚本编写课程做一些作业并且有一个问题要求我编写一个脚本来测试输入的参数是否是有效的 shell 变量名称下面的脚本似乎工作正常 if echo 1 grep v A Za z gt dev null then ec
WinAPI C++：重新编程窗口大小

我有一个窗口我想将边框实现为调整边框大小就像任何其他窗口一样考虑到评论和答案的建议我重写了我的代码对于 WM GETMINMAXINFO 我有 MINMAXINFO min max reinterpret cast
嵌套 for 循环中的 if-else 块 - 编译器声称我需要 return 语句

我该如何进行这项工作它说我需要添加一个返回语句但我有一个 public boolean clockFactCheck int a int b for int i 0 i lt 276 i for int h 0 h lt 55 h if
React Router 4 和 props.history.push

React 中有一些东西让我抓狂我需要你的帮助基本上当用户单击我的个人资料时我想重定向到用户的个人资料为此我使用以下代码片段 viewProfile gt console log My USER ID this props
thymeleaf 无法将 java.lang.String 类型的属性值转换为所需类型 java.util.List

我是 Spring 和 Spring Boot 的新手正在阅读一本充满缺失信息的书我有一堂炸玉米饼课 public class Taco Size min 1 message You must choose at least 1 ing
注册 MessageBodyReader 和 MessageBodyWriter 实现的正确位置是什么？

我已经实现了 Javax WS RS APIMessageBodyReader for com ca tas crypto cmp client GeneralPKIMessageJaxRsReader and MessageBodyWri
Node JS：net.Socket 不是构造函数

如果我从命令行运行下面的代码它可以正常工作但是如果我在项目中的任何位置运行此代码我会收到此错误 net Socket is not a constructor 我尝试将下面的代码作为一个对象并将其导入需要它到我的项目中但我仍然收到
如何关闭Notes客户端中的xpages？我使用 CSJS window.close 但它不起作用

我正在做一个 xpinc 应用程序我按照中的例子here并对其进行了修改目前关闭按钮位于我的主页上客户想要一个关闭按钮而不是普通的 X 来关闭但该示例表明我应该创建 2 个 xpage 在第 1 页上我应该创建一个按钮window
给定路径，如何仅提取包含的文件夹名称？

在Python中我应该使用什么命令来获取包含我正在使用的文件的文件夹的名称 C folder1 folder2 filename xml Here folder2 是我想要得到的我唯一想到的就是使用os path split twice
在 Saxon 9 中，Java XML 解析器无法识别正则表达式中的单词边界 (\b)

我有以下简单的正则表达式 b w b 撒克逊报告以下错误 syntax error at char 2 in regular expression Escape character b not allowed 这是否意味着我不能在 Java
在 AngularJS 模块中包装 javascript 类并注入 Angular 服务的正确方法

在我正在开发的 AngularJS 模块中我有一个Canvas类定义为 angular module myModule factory Canvas function return Canvas var Canvas function e
SendInput 和 64 位

下面是我用来通过 SendInput API 模拟按键的一些代码的摘录如果我将应用程序设置为针对 x86 CPU 编译则此方法可以正常工作但不适用于 x64 CPU 编译我猜这与 x64 使用双倍大小指针有关但我试图改变这一点 F
Angular.js 路由不适用于 WAMP

我正在致力于设置一个使用 Express Node mySQL 堆栈构建的 Angular js 单页应用程序我为路线设置了以下代码 angular module myApp myApp filters myApp services my
PHP header() 函数没有重定向[关闭]

很难说出这里问的是什么这个问题模棱两可含糊不清不完整过于宽泛或言辞激烈无法以目前的形式合理回答如需帮助澄清此问题以便重新打开访问帮助中心我正在使用以下 PHP 代码来检查会话但是如果会话未登录则页面不会重定向仅显示黑
jar 中的类路径资源

我有一个项目A 其中包含一些java文件和一个类路径资源R txt 在项目中我使用 ClassLoader getSystemResource R txt 检索 R txt 然后我有一个项目 B 其中包含项目 A 的 jar 文件现在 g
多个线程可以同时向并发集合添加项目吗？

我正在尝试找出 C 中的并发集合 ConcurrentBag ConcurrentDictionary 和 ConcurrentQueue 多个线程是否可以向其中添加项目EXACTLY同时还是他们一前一后地等待我试图检查他们的源代码但
DialogFragment 中的 ActionBar

在我的 Galaxy Tab 10 1 上的日历应用程序中创建新事件时标题栏操作栏区域中会出现一个对话框其中包含完成和取消按钮我想在我的应用程序中实现这一点我尝试过使用setHasOptionsMenu true 除了覆
Android 无尽适配器

我正在使用无尽适配器http github com commonsguy cwac endless但是每当我返回 false 因为我没有更多的数据要附加如此处所述http github com commonsguy cwac endles
插入由触发器生成但未传递的 ID 字段

在 MySQL 中我有一个触发器 BEGIN IF EXISTS SELECT FROM devices WHERE device id NEW device id THEN SET NEW id NULL ELSE INSERT INT
如何在 R 中对条形图的订单数据进行“分组”？

我正在研究生物信息学我需要输出一个包含祖先结果的图表条形图通常这些图表是通过将人群分组在一起来绘制的完成的方法是您只需绘制不同假定人群此处为 4 的 Q 分数下面的数据的条形图问题是我使用ord tbl order tb

如何在 R 中对条形图的订单数据进行“分组”？

如何在 R 中对条形图的订单数据进行“分组”？ 的相关文章

随机推荐

热门标签

如何在 R 中对条形图的订单数据进行“分组”？的相关文章