数据框中按行相关

2024-05-23

我正在尝试计算大型数据帧的所有行之间的相关性，到目前为止已经提出了一个有效的简单 for 循环。例如：

name <- c("a", "b", "c", "d")
col1 <- c(43.78, 43.84, 37.92, 31.72)
col2 <- c(43.80, 43.40, 37.64, 31.62)
col3 <- c(43.14, 42.85, 37.54, 31.74)
df <- data.frame(name, col1, col2, col3)
cor.df <- data.frame(name1=NA, name2=NA,correl=NA)

for(i in 1: (nrow(df) - 1))  {
  for(j in (i+1): nrow(df) ) {
    v1 <- as.numeric( df[i, 2:ncol(df)] )
    v2 <- as.numeric( df[j, 2:ncol(df)] )
    correl <- cor(v1, v2)

    name1 <- df[i, "name"]
    name2 <- df[j, "name"]

    dftemp <- data.frame(name1, name2, correl)
    cor.df <- rbind(cor.df, dftemp)
   }
}

na.omit(cor.df)

#    name1 name2     correl
#     a     b      0.8841255
#     a     c      0.6842705
#     a     d     -0.6491118
#     b     c      0.9457125
#     b     d     -0.2184630
#     c     d      0.1105508

考虑到大数据帧和低效的 for 循环，相关性计算需要很长时间。有人对如何使其更快有任何建议吗？请注意，我的列表中有很多数据框，因此我可以使用 lapply （但尚未弄清楚如何编写该行代码）

删除第一列，转置并使用基础::cor功能：

> cor(t(df[-1]))
           [,1]       [,2]      [,3]       [,4]
[1,]  1.0000000  0.8841255 0.6842705 -0.6491118
[2,]  0.8841255  1.0000000 0.9457125 -0.2184630
[3,]  0.6842705  0.9457125 1.0000000  0.1105508
[4,] -0.6491118 -0.2184630 0.1105508  1.0000000

# pretty output
x <- cor(t(df[, -1]))
x[upper.tri(x, diag = TRUE)] <- NA
rownames(x) <- colnames(x) <- df$name
x <- na.omit(reshape::melt(t(x)))
x <- x[ order(x$X1, x$X2), ]

x
#    X1 X2      value
# 5   a  b  0.8841255
# 9   a  c  0.6842705
# 13  a  d -0.6491118
# 10  b  c  0.9457125
# 14  b  d -0.2184630
# 15  c  d  0.1105508

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

list

DataFrame

rows

correlation

数据框中按行相关的相关文章

删除极坐标图边缘的多余空间和圆环

我有一个极坐标图ggplot2我已经非常接近完成相当简单的情节我已经能够在删除矩形边框方面获得帮助但我不需要删除最后一个范围轮廓与带有方位角标签的绘图周围的环之间的额外空间我希望该图的边界为 15 000 而不是 15 214 我编
条件字体颜色 R Markdown

我无法找到一种方法来根据变量的值 gt 0 0 或 r setup include FALSE x lt 4 This is an R Markdown document r if x gt 0 textcolor red Markdown
R：使用 tidyverse 将 NA 替换为 df 中的其他变量

我想使用 tidyverse 替换 df 中的 NA 值我想要的值应该从其他列中计算出来 input ID X1 X2 X3 A 0 96 NA 0 97 B 1 00 NA 1 01 C 0 98 0 03 NA A 1 00 NA 1
实三次多项式的最快数值解？

R 问题寻找最快的方法来数值求解一堆已知具有实系数和三个实根的任意三次方程据报道 R 中的 polyroot 函数对复杂多项式使用 Jenkins Traub 算法 419 但对于实多项式作者参考了他们早期的工作对于实三次或更一般的
如何绘制具有显着性水平的箱线图？

前段时间问了一个关于绘制箱线图的问题Link1 https stackoverflow com questions 14604439 plot multiple boxplot in one graph 我有一些包含 3 个不同组或标签
如何修复 R 中 Kaplan Meier 图的风险表计算错误

以下是一个数据帧其中 6 个参与者中的每一个都有唯一的 record ID 我想绘制一个生存分析图其中包含感兴趣事件的复发以及在时间间隔 tstart 到 tstop 内暴露药物剂量数值变量的时间依赖性协变量每个参与者的最大
如何使用 dplyr 独立过滤每列的行

我有以下内容 library tidyverse df lt tibble tribble gene colB colC a 1 2 b 2 3 c 3 4 d 1 1 df gt A tibble 4 x 3 gt gene colB c
闪亮应用程序中的本地图像没有 img(src())？

我想按照以下说明在我的闪亮应用程序中包含本地图像文件在闪亮的应用程序中嵌入图像 https stackoverflow com questions 21996887 embedding image in shiny app 然而由于某种
r - 选择每组最后出现的 n 次

情况我有一个数据框df df lt structure list person structure c 1L 1L 1L 1L 2L 2L 2L 3L 3L Label c pA pB pC class factor date struc
将数字提高到非整数幂时出现奇怪的 NaN [重复]

这个问题在这里已经有答案了我执行了以下代码 tau lt 0 25 h lt 0 6 n 1 5 4 5 dnorm qnorm tau 4 qnorm tau 2 qnorm tau 2 1 2 1 5 R 继续生产NaN 然而 R 实
R：大向量的高效迭代子集和过滤

我想更快地执行以下操作 Logic 我有一个向量big共 4 个元素1 2 3 4 我还有一个相同长度的阈值向量1 1 3 1 4 1 5 1 我希望每个元素找到第一个元素的索引next元素高于相应的阈值在这种情况下我的预期输出是 2
Python 3 列表列表中的列表理解以转换类型

考虑以下列表 list1 1 1 1 2 1 3 2 1 2 2 2 3 要理解字符串列表并将其转换为浮点数可以使用 list1 0 float i for i in list1 0 但我尝试理解浮点数列表的列表并没有完全起作用 list
dplyr / left_join 中的嵌套管链

在尝试获取分组滞后变量的过程中仅使用这是不可能的 lag 建议的解决方案是将数据拉出滞后不同的行然后重新加入它我更喜欢在不创建中间对象的情况下执行此操作并且希望在链中间执行此操作然而它似乎没有像我预期的那样工作问题似乎是使用
长变量名在 dplyr 中失败

长度超过 39 个字符的字符串在 dplyr 中失败返回错误错误索引超出范围我错过了什么还是这是一个错误 40 个字符不起作用 library dplyr names iris 5 lt vvv 5vvv10vvv15vvv20vv
如何在R中得到一个大的稀疏矩阵？ (> 2^31-1)

我使用一些 C 代码从数据库中获取文本文件并从该文件创建 dgcMatrix 类型稀疏矩阵Matrix包裹我第一次尝试构建一个具有超过 2 31 1 个非稀疏成员的矩阵这意味着稀疏矩阵对象中的索引向量也必须比该限制长不幸的是向量似
R - 在浏览器中获取帮助而不是内置的 R 帮助程序

我见过 R help 的两种不同行为当你输入 density例如帮助已在您的默认浏览器中打开帮助在内置 R 帮助程序中打开 R 中的窗口我目前有第二种行为但我想在浏览器中打开帮助我可以轻松地在这两种行为之间切换吗无需重新安装
有没有办法在 RStudio 中调试 RScript 调用？

假设我从命令行运行 R 脚本如下所示 Rscript prog R x y z 我想检查某一行的代码目前我无法在 RStudio 中以交互方式调试它因为我不知道如何传递参数由于它设计为从命令行运行因此如何通过命令行 RStudi
在 R 中进行 Cox 回归后，将预测危险比列添加到数据帧中

在 R 中运行 Cox PH 回归后我需要在数据框中添加预测风险比的列数据框是面板数据其中 numgvkey 如果公司标识符和年龄是时间标识符您可以从此链接下载一小部分日期 https drive google com file
指定 R 中 hist() 中的 bin 数量？

我尝试指定垃圾箱的数量hist R为10 如下 gt hist x breaks 10 但垃圾箱的数量并不完全是 10 我尝试了几个其他数量的垃圾箱结果发生了同样的情况 hist says breaks可以指定给出直方图单元格数量的单个
如何生成向量的所有组合[重复]

这个问题在这里已经有答案了假设我有 3 个绿球 2 个橙球和 8 个黄球我想订购它们鉴于所有相同颜色的球都是相同的如何生成所有可能的序列在 R 中使用gregmisc 我可以 balls lt c orange orange g

随机推荐

最佳开源混合整数优化求解器[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我正在使用 CPLEX 来解决巨大的优化模型超过 100k 个变量现在我想看看是否可以找到开源替代
在 iPhone 上下载、保存和播放 mp3

我想从某个网站下载 mp3 文件将其保存到我的 CoreData 模型 AudioMp3 中然后播放下面的函数可以工作但首先效率低下因为它必须首先将 mp3 保存到文件其次它在接下来的调用次数中重复播放相同的 mp3 我认为
定位精度定义 - iOS

iOS 上返回的准确性或不确定性的统计意图是什么即使是近似值例如 Android 文档对其返回的精度数字进行了解释从这个意义上讲它大约是一个标准差我们将准确度定义为 68 置信度的半径换句话说如果您以该位置的纬度和经
SqlConnection - 是远程连接还是本地连接？

如果我有 SqlConnection 对象如何确定它是本地连接 localhost 或 127 0 0 1 还是远程连接本地区域的其他计算机使用连接询问 SQL 语句 SELECT SERVERNAME 然后验证这是否与客户端计算机的
尽管遵循安装说明，Beaker 仍无法找到 Python 和 Julia 安装

我最近安装了 Beaker Notebook 但无法启动 Python 我已经安装了 Python 它是使用 Anaconda 安装的实际上推荐用于 Beaker 我已经编辑过beaker pref json指向我的安装见下文但它无法
SonarQube 不收集代码覆盖率

我在使用 sonar runner 和 jacoco 设置 gradle 时遇到问题除了代码覆盖率之外一切都很好我已经尝试了一切但没有结果这是我的 build gradle 文件 apply from dependencies gr
防止应用程序在控制台关闭时退出

I use AllocConsole 在 winform 应用程序中打开控制台如何防止应用程序在控制台关闭时退出 EDIT 不时更新的完成百分比是我想在控制台中显示的 void bkpDBFull PercentComplete obje
PHP-MySQLi 连接随机失败并显示“无法分配请求的地址”

大约两周以来我一直在处理 LAMP 堆栈中最奇怪的问题之一长话短说与 MySQL 服务器的随机连接失败并显示错误消息 Warning mysqli real connect HY000 2002 Cannot assign reque
NSIndexpath.item 与 NSIndexpath.row

有谁知道之间的区别NSIndexpath row and NSIndexpath item 具体来说我在以下情况中使用哪一个 UITableViewCell tableView UITableView tableView cellForR
从枚举参数推断 Typescript 函数返回类型

我想创建一个加载服务为枚举中定义的 ID 返回正确类型的数据我所做的看起来像这样 enum IdentifierEnum ID1 ID1 ID2 ID2 interface DataType IdentifierEnum ID1 num
从 React-Navigation V4 - V5 迁移到 CommonActions.init 和 router.getStateForAction 发生了什么？

我们的应用程序使用CommonActions init 并将其传递给router getStateForAction 我这里有两个问题 the init 功能不再在CommonActions the router getStateForAc
“如何判断 Python 中的字符串是否重复？”的更复杂版本

我正在读书这个帖子 https stackoverflow com questions 29481088 how can i tell if a string repeats itself in python我想知道是否有人可以找到将重复的
Rails：使用水豚填充动态字段

我有一个通过 javascript 动态创建的带有长 id 的文本字段 user user skills attributes 69878013874980 skill title 哪里的69878013874980是生成的时间戳如何在水
如何在 Netbeans 工具栏中创建自定义按钮？

我有一个命令行脚本保存在我的电脑上的一个文件中如何在 NB 7 0 中创建工具栏按钮以便单击此按钮将运行我保存的脚本另外我应该将脚本文件命名为什么文件扩展名以便它可以执行或者这很重要吗这里有一个工具栏按钮教程 http pl
[\b] 退格正则表达式有什么用？

b 显然匹配退格字符我无法理解字符串如何包含退格字符有人能给我一个具体的例子来说明如何使用它吗非常感谢虽然所有其他人总体上都是正确的即 b是单词边界 b does表示字符类中的退格键 b 这确实会匹配退格字符它只是一个可以出现在
“第一类对象”是什么意思？

In a 最近的问题 https stackoverflow com questions 700684 content ideas for a short javascript lesson 我收到了一些建议其中包括讨论 JavaScri
如何获取Postgres当前的可用磁盘空间？

在开始在数据库中进行某些工作之前我需要确保至少有 1Gb 的可用磁盘空间我正在寻找这样的东西 select pg get free disk space 是否可以我在文档中没有找到任何相关内容 PG 9 3 操作系统 Linux Wi
通过node.js的npm安装gulp会破坏windows

我想在我的 Windows 机器上使用 gulp 它实际上工作得很好除非我尝试使用创建的文件例如推送到 github 或删除然后它就崩溃了因为文件路径太长这似乎是一个相当常见的问题 https github com joyent
如何从另一个UserControl继承一个UserControl？

是否可以从另一个用户控件继承用户控件我想要实现的是从另一个用户控件继承的用户控件所以我有baseusercontrol ascx 它只有文本 Stuff 然后我有另一个用户控件 childusercontrol ascx 继承了base
数据框中按行相关

我正在尝试计算大型数据帧的所有行之间的相关性到目前为止已经提出了一个有效的简单 for 循环例如 name lt c a b c d col1 lt c 43 78 43 84 37 92 31 72 col2 lt c 43 80 4

数据框中按行相关

数据框中按行相关 的相关文章

随机推荐

热门标签

数据框中按行相关的相关文章