计算 R 中前两个主成分的最快方法是什么？

2024-01-12

我在用princomp在 R 中执行 PCA。我的数据矩阵很大（10K x 10K，每个值最多 4 位小数）。在 Xeon 2.27 GHz 处理器上大约需要 3.5 小时和大约 6.5 GB 物理内存。

由于我只想要前两个组件，是否有更快的方法来做到这一点？

Update :

除了速度之外，是否有一种内存有效的方法来做到这一点？

使用以下命令计算前两个分量需要约 2 小时和约 6.3 GB 物理内存svd(,2,).

有时您可以访问所谓的“经济”分解，它允许您限制特征值/特征向量的数量。看起来像eigen() and prcomp()不提供这个，但是svd()允许您指定要计算的最大数量。

在小矩阵上，收益似乎不大：

R> set.seed(42); N <- 10; M <- matrix(rnorm(N*N), N, N)
R> library(rbenchmark)
R> benchmark(eigen(M), svd(M,2,0), prcomp(M), princomp(M), order="relative")
          test replications elapsed relative user.self sys.self user.child
2 svd(M, 2, 0)          100   0.021  1.00000      0.02        0          0
3    prcomp(M)          100   0.043  2.04762      0.04        0          0
1     eigen(M)          100   0.050  2.38095      0.05        0          0
4  princomp(M)          100   0.065  3.09524      0.06        0          0
R>

但三倍相对于princomp()重建时可能值得您princomp() from svd() as svd()允许您在两个值后停止。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

PCA

eigenvector

eigenvalue

计算 R 中前两个主成分的最快方法是什么？的相关文章

Rsolnp：在 cbind(temp, funv) 中：结果的行数不是向量长度的倍数（arg 1）

我是 stackoverflow 的新手搜索了很多但找不到我的问题的答案我正在尝试使用优化包 Rsolnp 来最小化以下问题尽管求解器为我提供了解决方案但每次运行代码时我都会收到以下警告消息警告消息 1 在 cbind temp
替换列表列表中的元素

The applyR 中的函数是简化 for 循环以获得输出的好方法是否有一个等效的函数可以帮助人们在替换向量的值时避免 for 循环通过示例可以更好地理解这一点 Take this list for example x list li
如何在R中计算文本中的句子数？

我使用 R 将文本读入readChar 功能我的目的是测试文本句子中字母 a 出现次数与字母 b 出现次数一样多的假设我最近发现了 stringr 包它帮助我对文本做很多有用的事情例如计算字符数以及整个文本中每个字母出现的总数现在
返回数据帧 R 中的下一行

我有一个看起来像这样的数据框 kind datetime book 2016 04 23 04 23 00 pen 2016 04 23 04 30 00 toy 2016 04 23 06 45 00 我想为数据集中的每一行返回下一行的日
将 Instagram/youtube 嵌入 Shiny R 应用程序

我想通过点击图表来播放 Instagram 或 Youtube 视频例如显示异常值等到目前为止明确告诉 Shiny 视频内容是有效的 require shiny require ggplot2 data df lt data fram
.wav 文件长度/持续时间，无需读入文件

有没有办法提取有关 wav 文件长度持续时间的信息而无需在 R 中读取文件我有数千个这样的文件如果我必须阅读每个文件才能找到其持续时间那将需要很长时间 Windows 文件资源管理器为您提供了打开长度字段的选项并且您可以查看
LDA with topicmodels，如何查看不同文档属于哪些主题？

我正在使用 topicmodels 包中的 LDA 我已经在大约 30 000 个文档上运行它获取了 30 个主题并获得了主题的前 10 个单词它们看起来非常好但我想看看哪些文档属于哪个主题的概率最高我该怎么做 myCorpus
使用 broom 和 tidyverse 总结 r 平方游戏

我发布了一个问题here https stackoverflow com questions 48627287 getting adjusted r squared value for each line in a geom smooth
在 R 中创建一个运行计数变量？

我有一个足球比赛结果的数据集我希望通过创建一组类似于世界足球 Elo 公式的运行评级来学习 R 我遇到了麻烦在 Excel 中看似简单的事情在 R 中并不完全直观例如 4270 个观察中的前 15 个具有必要的变量 date t 1
使用 pracma::findpeaks 识别持续峰值

我的语法有问题peakpat内的选项findpeaks内的函数pramcaR 包 v 2 1 1 我使用的是 R 3 4 3 x64 Windows 我希望该函数能够识别可能有两个重复值的峰值并且我相信该选项peakpat这就是我能做到的
多功能测试仪替代 system.time

我已经看到我认为是这样使用了类似于 system time 的函数它可以同时评估多个函数的时间并输出一个输出我不记得它是什么并且用我正在使用的术语进行互联网搜索并没有得到我想要的响应有人知道我正在谈论的功能的名称位置吗你想要
如何使用 R 计算成为列表中中位数的概率？

假设我有以下数据集其中显示了假设实验的每个状态的三个观察结果的列表 state lt c Iowa Minnesota Illinois outcome lt list c 5 11 11 c 3 12 8 c 9 14 2 dat lt
时间戳半小时窗口内字段的平均值

我的数据框有列名Timestamp es看起来像 Timestamp es 2015 04 01 09 07 42 31 2015 04 01 09 08 01 29 5 2015 04 01 09 15 03 18 5 2015 04 0
Dendextend：关于如何根据定义的组为树状图的标签着色

我正在尝试使用一个名为 dendextend 的很棒的 R 包来绘制树状图并根据一组先前定义的组为其分支和标签着色我已阅读您在 Stack Overflow 中的答案以及 dendextend vignette 的常见问题解答但我仍然不
为什么 dplyr filter() 不能在函数内工作（即使用变量作为列名）？

使用 dplyr 函数对数据进行过滤分组和变异的函数基本管道序列在函数之外工作得很好这就是我使用真实列名称的地方将其放入一个函数中其中列名称是一个变量并且某些函数可以工作但有些函数则不能尤其是 dplyr filter 例如
在 R 格子包中微调点图

我正在尝试为不同的数据集和不同的算法绘制一堆 ROC 区域我有三个变量方案指定所使用的算法数据集是正在测试算法的数据集以及 Area under ROC 我正在 R 中使用lattice库命令如下点图方案 Area und
将数据框中重叠的范围合并到唯一的组中

我有一个 n 行 3 的数据框 df lt data frame start c 178 400 983 1932 33653 end c 5025 5025 5535 6918 38197 group c 1 1 2 2 3 df sta
使用 Shiny 发布平行坐标图表时出现“错误：路径[1]="”：没有这样的文件或目录”

我有一个似乎很常见但我还没有找到解决方案的问题当尝试使用 rCharts Parcoords 发布 Web 应用程序时出现以下错误错误路径 1 没有这样的文件或目录奇怪的是该应用程序在我的笔记本电脑上运行得很好下面是我正在使用
将阴影区域添加到五分位数之间的直方图中

All 我有一个包含 2 个直方图的图表其中我还绘制了代表第 20 40 60 和 80 个百分位数的线条下面的代码使用虚拟数据重现了类似的图表 data lt rbind data frame x rnorm 1000 0 1 g o
文本挖掘 pdf 文件/词频问题

我正在尝试挖掘一篇具有丰富 pdf 编码和图表的文章的 pdf 我注意到当我挖掘一些 pdf 文档时我得到的高频词是 phi taeoe toe sigma gamma 等它与某些 pdf 文档配合良好但与其他文档配合使用时却得到这

随机推荐

下载图像并在 BlackBerry 上显示

我必须开发一个网址其中涉及从网址下载图像并在黑莓刺激器中显示任何人都可以在这方面帮助我吗此代码将连接给定的 URL 并返回 Bitmap 对象 public static Bitmap connectServerForImage St
LINQ 表达式> 相当于 .Contains()

有谁知道如何使用 Linq 表达式创建 Contains string 函数甚至创建谓词来完成此操作 public static Expression
如何仅使用 CSS 制作选项卡？ [复制]

这个问题在这里已经有答案了我正在寻找像这样的选项卡系统jQuery 选项卡 http jqueryui com tabs 用户可以在不同的面板之间切换以查看不同的内容但是我需要在不使用 JavaScript 的情况下完成此操作以便未
C/C++ 是否有允许任意精度指数的任意精度浮点库？

我正在寻找 C C 的任意精度浮点库首选普通 C 我需要任意精度的指数 GMP 和 MPFR 使用固定大小的指数因此它们不符合条件我有一些解决方法的想法但我更喜欢开箱即用的解决方案如果指数精度可以自动调整以防止无穷大值那将是一个
Django DRF，如何使用 DRF 操作正确注册自定义 URL 模式

背景我有一个定义了多个自定义操作的 ModelViewSet 我正在使用我的默认路由器urls py注册 URL 现在我的视图使用默认创建的路由例如 images images pk 为了让用户能够使用他们熟悉的资源名称来使用 API
Matlab 中 += 相当于什么？

在Matlab中是否可以增加变量的值而不在语句的右侧重新声明它 AFAIK MATLAB 中没有这样的东西这是可以理解的 http groups google com group comp soft sys matlab browse f
ForEach-Object -Parallel 参数集无法解析

使用 powershell 并执行以下操作时本文 https devblogs microsoft com powershell powershell foreach object parallel feature 运行以下示例会引发错误
ColdFusion 并从 MySQL 获取数据

我正在 CF 网站上工作需要从 MySQL 表中获取数据我可以很好地创建 CFQuery 并检查返回的记录但如何获取返回的记录并循环它们并从每行中的特定字段获取数据我可以写 while if end if 等我只是不记得如何访问数
指向索引处向量的指针与迭代器

我有一个矢量 myvec我在代码中使用它来保存内存中的对象列表我在正常向量中保留一个指向当前对象的指针C时尚通过使用 Object pObj myvec index 如果 myvec 没有变得足够大以至于无法在某个过程中移动那么这一
使用 NodeJS 的 IExpress 安装后批处理未立即找到 NPM

我正在尝试使用 iExpress 在我在 NodeJS 上创建的小脚本上安装依赖项 iExpress 包只需安装 Node 包 msiexec i node msi 然后运行安装后批处理将 Javascript 放入 UserProfil
API 级别 19 上 grantUriPermission 中的 IllegalArgumentException

下面这行代码 context getApplicationContext grantUriPermission packageName uri Intent FLAG GRANT PERSISTABLE URI PERMISSION 在 A
为什么 mypy 拒绝我的“混合联合”类型声明？

While 解决 Python 聊天中的半相关问题 https chat stackoverflow com transcript message 49920836 49920836 我在 mypy 中发现了一些我不理解的行为 from t
Hive 执行钩子

我需要在 Apache Hive 中挂钩自定义执行挂钩如果有人知道该怎么做请告诉我我当前使用的环境如下 Hadoop Cloudera 版本 4 1 2 操作系统 Centos 谢谢阿伦有多种类型的挂钩具体取决于您要在哪个阶段注
setuptools、distribution 和 pip 之间如何相互关联？

我一直在通过 Learn Python The Hard Way 第二版一书自学 Python 在练习 46 中它告诉我阅读 Pip Distribute 和其他一些软件包 pip 的文档足够清楚了它允许我安装卸载和升级软件包阅读
ConcurrentHashMap：我们可以信任它吗？

来自ConcurrentHashMap的文档支持完全并发检索和可调整的更新预期并发的哈希表我们能否完全相信ConcurrentHashMap线程安全操作吗我正在使用 ConcurrentHashMap 将键与其值进行映射我的键值对是
是否可以在不使用格式化 printf 的情况下在 java 中进行精确转换？ [复制]

这个问题在这里已经有答案了该行产生双值3 33333333335 System out println Average marks of name double sum 3 是否可以设置精度宽度您可以使用DecimalFormat or
Glass 上的 Google Play 服务“不真实”

我正在尝试获取用户在 Glass 上的当前位置 Calling mLocationClient connect 失败而没有任何解决方案然后我检查了设备上是否可以使用 Google Play 服务 GooglePlayServicesUti
ASP.NET Core集成测试在本地工作，但在生产环境中运行时抛出空引用异常

我有一个 ASP NET Core 2 2 Razor Pages Web 应用程序我已经为以下内容编写了一些集成测试官方指南 https learn microsoft com en us aspnet core test integr
将 Intent Web url 转换为 Android Intent

我目前在我的应用程序中集成了一个 webview webview flutter 2 0 4 以进行支付流程不幸的是在某些时候启动了以下网址 intent payment Intent action ch twint action TW
计算 R 中前两个主成分的最快方法是什么？

我在用princomp在 R 中执行 PCA 我的数据矩阵很大 10K x 10K 每个值最多 4 位小数在 Xeon 2 27 GHz 处理器上大约需要 3 5 小时和大约 6 5 GB 物理内存由于我只想要前两个组件是否有更快的方

计算 R 中前两个主成分的最快方法是什么？

计算 R 中前两个主成分的最快方法是什么？ 的相关文章

随机推荐

热门标签

计算 R 中前两个主成分的最快方法是什么？的相关文章