当我用一个观察值运行回归时，为什么“fastLm()”会返回结果？

2024-05-10

为什么fastLm()当我用一项观察进行回归时返回结果吗？

下面为什么不lm() and fastLm()结果相等吗？

library(Rcpp)
library(RcppArmadillo)
library(data.table)
set.seed(1)
DT <- data.table(y = rnorm(5), x1 = rnorm(5), x2 = rnorm(5), my.key = 1:5)
#             y         x1         x2 my.key
# 1: -0.6264538 -0.8204684  1.5117812      1
# 2:  0.1836433  0.4874291  0.3898432      2
# 3: -0.8356286  0.7383247 -0.6212406      3
# 4:  1.5952808  0.5757814 -2.2146999      4
# 5:  0.3295078 -0.3053884  1.1249309      5

lm(y ~ 1 + x1 + x2, data = DT[my.key == 1])
# Coefficients:
# (Intercept)           x1           x2  
#     -0.6265           NA           NA

fastLm(X = model.matrix(y ~ 1 + x1 + x2, data = DT[my.key == 1]), y = DT[my.key == 1]$y)
# Coefficients:
# (Intercept)          x1          x2 
#    -0.15825     0.12984    -0.23924 

model.matrix(y ~ 1 + x1 + x2, data = DT[my.key == 1])
#   (Intercept)        x1       x2
#             1 -0.8204684 1.511781
# attr(,"assign")
# [1] 0 1 2

DT[my.key == 1]$y
# [1] -0.6264538

当我使用整个DT结果是相等的：

 all.equal(fastLm(X = model.matrix(y ~ 1 + x1 + x2, data = DT), y = DT$y)$coef, 
           lm.fit(x = model.matrix(y ~ 1 + x1 + x2, data = DT), y = DT$y)$coef)
# [1] TRUE

来自RcppArmadillo修改过的库电影双播 https://github.com/RcppCore/RcppArmadillo/blob/master/inst/examples/fastLm.r我也得到同样的行为：

src <- '
Rcpp::List fLmTwoCastsOnlyCoefficients(Rcpp::NumericMatrix Xr, Rcpp::NumericVector yr) {
    int n = Xr.nrow(), k = Xr.ncol();
    arma::mat X(Xr.begin(), n, k, false);
    arma::colvec y(yr.begin(), yr.size(), false);
    arma::colvec coef = arma::solve(X, y);
    return Rcpp::List::create(Rcpp::Named("coefficients")=trans(coef));
}
'
cppFunction(code=src, depends="RcppArmadillo")

XX <- model.matrix(y ~ 1 + x1 + x2, data = DT[my.key == 1])
YY <- DT[my.key == 1]$y
fLmTwoCastsOnlyCoefficients(XX, YY)$coef
#            [,1]      [,2]       [,3]
# [1,] -0.1582493 0.1298386 -0.2392384

使用整体DT这些系数应该是相同的：

lm(y ~ 1 + x1 + x2, data = DT)$coef
# (Intercept)          x1          x2 
#   0.2587933  -0.7709158  -0.6648270

XX.whole <- model.matrix(y ~ 1 + x1 + x2, data = DT)
YY.whole <- DT$y
fLmTwoCastsOnlyCoefficients(XX.whole, YY.whole)
#           [,1]       [,2]      [,3]
# [1,] 0.2587933 -0.7709158 -0.664827

Because fastLm不担心排名不足；这是您为速度付出的代价的一部分。

From ?fastLm:

... Armadillo 之所以能够比 stats 包中的函数更快地执行 lm.fit 之类的操作，是因为 Armadillo 使用 QR 分解的 Lapack 版本，而 stats 包使用修改后的 Linpack 版本。因此，Armadillo 使用 3 级 BLAS 代码，而 stats 包使用 1 级 BLAS。然而，犰狳要么会失败，要么更糟糕的是，在秩缺陷模型矩阵上产生完全错误的答案，而由于修改了 Linpack 代码，stats 包中的函数将正确处理它们。

看代码here https://github.com/RcppCore/Rcpp/blob/82d8a3a922fc158f2403b233b2ac6861c538d514/inst/examples/Attributes/Depends.cpp，代码的核心是

 arma::colvec coef = arma::solve(X, y);

这会进行 QR 分解。我们可以匹配lmFast结果与qr()来自基本 R （这里我不只使用基本 R 构造，而不是依赖于data.table):

set.seed(1)
dd <- data.frame(y = rnorm(5), 
      x1 = rnorm(5), x2 = rnorm(5), my.key = 1:5)

X <- model.matrix(~1+x1+x2, data=subset(dd,my.key==1))
qr(X,dd$y)
## $qr
##   (Intercept)         x1       x2
## 1           1 -0.8204684 1.511781

你可以看一下代码lm.fit()看看 R 在拟合线性模型时如何处理秩不足问题；它调用的底层 BLAS 算法通过旋转进行 QR ...

如果你想标记这些情况，我认为Matrix::rankMatrix()会成功的：

library(Matrix)
rankMatrix(X) < ncol(X)  ## TRUE
X1 <- model.matrix(~1+x1+x2, data=dd)
rankMatrix(X1) < ncol(X1)  ## FALSE

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

rcpp

armadillo

当我用一个观察值运行回归时，为什么“fastLm()”会返回结果？的相关文章

安装 gplots 时出错

我正在 OSX v 10 9 2 上运行 R v 3 0 3 当尝试使用以下命令在 R studio 中安装 gplots 包时出现错误 gt library gplots Error in library gplots there is
R 中 nlme 包中的 gls 函数出错

我不断收到这样的错误 Error in coef lt corARMA tmp value c 18 3113452983211 1 56626248550284 Coefficient matrix not invertible 或者像这
tidyverse 干扰 ggplot2 吗？无法访问map_data

在控制台中运行这些命令输出为 gt cty0 ggplot2 map data county gt library tidyverse Loading tidyverse ggplot2 Loading tidyverse tibble
r：按多列分组并计数

我有以下数据框 df LeftOrRight SpeedCategory NumThruLanes R 25to45 3 L 45to62 2 R Gt62 1 我想按速度类别对其进行分组并循环遍历其他列以获取每个速度类别中每个唯一代码的
dplyr：带引号变量名的 mutate 的标准评估

我将如何使用mutate 我的假设是我正在寻找标准评价就我而言因此mutate 但我对此并不完全有信心当使用接受变量名列表的函数时如下所示 createSum function data variableNames data gt m
R 带有列和行的分面 qqplots

我需要使用按行和列的构面创建 qqplot 我了解如何用列和行绘制分面图但我不确定如何设置我的数据最终我想按列和行对数据集进行分组然后按升序对建模结果和观察到结果进行排序同时添加带有行组的列和带有列组的列我一直在
距数据帧中最近的非 NA 值的距离

我有以下数据帧 df 我想添加一列其中包含与每行最接近的非 NA 值的距离 df lt data frame x 1 20 df c 1 3 4 5 11 14 15 16 x lt NA 换句话说我正在寻找以下值 df distanc
如何使用 ggplot2 对曲线下的区域进行着色

我一直在尝试使用 ggplot2 生成类似于此 R 图形的绘图 xv lt seq 0 4 0 01 yv lt dnorm xv 2 0 5 plot xv yv type l polygon c xv xv lt 1 5 1 5 c y
ggsubplot 是否适用于 R 3.2.1+？

CRAN 提供的 ggsubplot 版本与 R 的最新版本例如 3 1 1 不兼容运行 ggsubplot 示例会返回以下错误 Error in layout base data vars drop drop At least one
如何在 R Markdown 中的内联 LateX 方程中输出 R 变量的值（即动态更新）

我无法找到一种方法将 r 代码实现到 R markdown 中的内联 LateX 方程中目标是如果变量值发生变化则不必对它们的值进行硬编码 Given values lt c 1 4 2 5 7 9 avg lt sum value
R：（中缀）运算符的两个定义之间的冲突：如何指定包？

在 R 中每当两个包定义相同的函数时很容易指定要使用哪个包pkg foo 但是当冲突的功能是一个时你该怎么办 infix运算符即使用定义举个例子两者ggplot2 and crayon define 有没有一种方法可以让我默认
在 R 的替换命令中取消引用字符串

我想知道是否可以unquote通过替换命令传递给表达式的字符串具体来说我使用 dplyr 从数据框中过滤和选择 gt w subject sex response 1 1 M 19 08 2 2 M 16 46 6 6 M 23 60
将模式的所有元素与向量以相同的顺序匹配

我创建了一个函数yes seq需要两个参数一个模式pat和数据dat 该函数以相同的顺序查找数据中是否存在模式例如 dat lt letters 1 10 dat 1 a b c d e f g h i j pat lt c a c g
Shiny ：针对所有错误显示一条消息

我在 R 的 Shiny 中有一个应用程序我想处理消息以便用户看不到发生了什么错误我知道通过 tags style type text css shiny output error visibility hidden shiny ou
使用 R 下载压缩数据文件、提取并导入 .csv

我正在尝试使用以下方法从网页下载并提取 csv 文件R 这个问题是重复的使用 R 下载压缩数据文件提取和导入数据 https stackoverflow com questions 3053833 using r to download
如何在R中创建for循环？ [复制]

这个问题在这里已经有答案了可能的重复如何在 R 编程中启动 for 循环 https stackoverflow com questions 4162363 how to start a for loop in r programmin
如何不显示 ggplot 轴上的所有标签？

I m trying to using ggplot2 to plot this But as you can see on the x axis you can t read anything 那么如何在 x 轴上显示每 10 年的值呢
如何对范围内的行进行分组并考虑第三列？

我有一个遗传数据集我想对基因组中物理上靠近的遗传变异行进行分组我想对每条染色体基因组中某些点范围内的基因进行分组 chrom 我的点数据集包含变体行需要在一定范围内的位置如下所示 chrom low high 1 500 17
R ggplot2 分面保持比率但覆盖/定义输出图大小

我目前正在使用 ggplot2 来比较不同组的统计数据每个组属于不同的区域这是通过运行 R 脚本的 Web 应用程序 tikiwiki CMS 插件 R 完成的每个区域我可以有 2 到 30 个或更多组相同的 R 脚本针对唯一网页中
如何在闪亮的observeEvent中监听多个事件表达式

我想要两个不同的事件触发观察者有人建议here https stackoverflow com questions 34731975 how to listen for more than one event expression wit

随机推荐

为什么 int 数组的最大大小小于 Int32.MaxValue？ [复制]

这个问题在这里已经有答案了虽然这篇文章说它应该有效 https stackoverflow com questions 2338778 what is the maximum length of an array in net on 64
React Query useInfiniteQuery 使单个项目无效

使用 useInfiniteQuery 时如何使单个项目无效这是一个演示我想要实现的目标的示例假设我有一个成员列表每个成员都有一个关注按钮当我按下关注按钮时会单独调用服务器来标记给定用户正在关注另一个用户此后我必须使整个无
双击打开 Excel 工作簿时，Excel 2010 AddIn 未加载

我为 Excel 2010 编写了一个加载项如果我从开始菜单打开 Excel 它可以正常工作但是如果我双击 Excel 工作簿则无法加载 AddIn 我签入了ThisAddIn cs 方法InternalStartup 没有参与
WCF - 如何增加消息大小配额

我有一个 WCF 服务它将 1000 条记录从数据库返回给客户端我有一个 ASP NET WCF 客户端我在 asp net Web 应用程序项目中添加了服务引用来使用 WCF 当我运行客户端应用程序时我收到以下消息传入消息的最大
如何在 Visual Studio 11 中直接将成员函数绑定到 std::function？

我可以轻松地将成员函数绑定到std function通过使用带有 capture 子句的 lambda 表达式来包装它们 class Class Class Register int n Function n void Register s
有没有等效的 gulp 插件来执行“grunt Bower”？

With grunt 我可以使用命令grunt bower 由提供grunt bower requirejs https github com ck86 gulp bower files 自动生成RequireJS我本地的配置文件bowe
在 xCode 6 中发现意外的 Mach-O 标头代码：1918975009

导致错误的原因是什么 Found an unexpected Mach O header code 1918975009 in xCode 6 我将我的项目存档并作为ad hoc构建并且它构建链接存档很好但是当我在xCode组织者和选择
getClassLoader().getResource() 返回 null

我有这个测试应用程序 import java applet import java awt import java net URL public class Test extends Applet public void init URL
如何用xlrd读取公式

我正在尝试做一个解析器它读取几个 Excel 文件我通常需要位于行底部的值您可以在其中找到所有上部元素的总和因此单元格值实际上是 sum 或 A5 0 5 可以说对于使用 Excel 打开此文件的用户来说它看起来像一个数字这
无法在浏览器上访问 localhost:4200 上的 NodeJS 应用程序（docker run -p 4200:4200 ....）

我需要一些帮助对 docker 很陌生感觉这是我错过的一些小事我正在尝试使用 dockerfile 和 docker compose 运行 nodejs 应用程序然而我使用的是 Ubuntu 17 04 LTS 尽管状态显示为 U
PHP：检测USB设备

我正在尝试使用 PHP 将用户名和密码存储到 USB 拇指驱动器上的文本文件中因此当用户返回使用 USB 密钥登录时应该会打开一个弹出窗口并提示输入用户名和密码所以我的问题是如何使用 PHP 检测 USB 拇指驱动器所以客户端或
如何使用 Apache Arrow 在 Windows 上使用 C++ 编写 Parquet 格式的文件？

我正在尝试使用 C 在 Windows 上编写 Parquet 文件我按照我找到的说明进行操作here https github com apache arrow blob master docs source developers cp
htaccess - XAMPP 上的互联网服务器错误 500 [已关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我尝试在 XAMPP 上运行脚本但收到互联网服务器错误 500 在实时服务器上运行时效果很好我认为这是一个 htaccess 错误 htacce
如何在 Angular Material 2 中使用 mat-chip 和自动完成功能保存选定的对象

我正在使用 Angular 6 和 Angular Material 我正在尝试从 mat chip 和自动完成功能中保存选定的对象或选定对象的列表我能够将字符串值发送到fruits 数组但无法将选定的对象发送到fruits 数组请帮
如何使用php api检查电子邮件或手机paypal帐户状态？

如何使用 php api 检查电子邮件或手机 Paypal 帐户状态好的如果我想汇款到此电子邮件贝宝 email protected cdn cgi l email protection 或手机 1234567890 汇款前我可以检查
如何仅将整个嵌套目录中的头文件复制到另一个目录，在复制到新文件夹后保持相同的层次结构

我有一个目录其中有很多头文件 h 和其他 o 和 c 文件以及其他文件这个目录里面有很多嵌套的目录我只想将头文件复制到一个单独的目录并在新目录中保留相同的结构 cp rf oldDirectory newDirectory将复制所有
Kafka 主题删除不起作用

我使用的是 Kafka 0 8 2 版本在开发过程中我想我可能需要删除一个主题所以我所做的是将以下行放入服务器配置文件中并启动两个 kafka 服务器 delete topic enable true 当我需要删除一个主题并运行以下命
使用 ES6 静态函数时，我得到“没有这样的方法”

我正在尝试为我在 React Native 中工作的项目创建一个包含静态函数的 utils 类我读到了如何在 StackOverFlow 中创建静态函数question https stackoverflow com questions
想要从字符格式转换为带小数的数字格式

想要将字符格式 00001000000 转换为10000 00 请帮我我已经尝试过 select to number 00012300 9999999999 99 nls numeric characters from dual 这个脚本
当我用一个观察值运行回归时，为什么“fastLm()”会返回结果？

为什么fastLm 当我用一项观察进行回归时返回结果吗下面为什么不lm and fastLm 结果相等吗 library Rcpp library RcppArmadillo library data table set seed 1 D

当我用一个观察值运行回归时，为什么“fastLm()”会返回结果？

当我用一个观察值运行回归时，为什么“fastLm()”会返回结果？ 的相关文章

随机推荐

热门标签

当我用一个观察值运行回归时，为什么“fastLm()”会返回结果？的相关文章