零截距模型的 lm() 中的 R 平方

2023-12-12

我经营一家lm()在 R 中,这是总结的结果:

Multiple R-squared:  0.8918,    Adjusted R-squared:  0.8917 
F-statistic:  9416 on 9 and 10283 DF,  p-value: < 2.2e-16

看起来这是一个很好的模型,但是如果我手动计算 R^2,我会得到:

model=lm(S~0+C+HA+L1+L2,data=train)
pred=predict(model,train)
rss <- sum((model$fitted.values - train$S) ^ 2)
tss <- sum((train$S - mean(train$S)) ^ 2)
1 - rss/tss
##[1] 0.247238
rSquared(train$S,(train$S-model$fitted.values))
##          [,1]
## [1,] 0.247238

怎么了?

str(train[,c('S','Campionato','HA','L1','L2')])
Classes ‘tbl_df’, ‘tbl’ and 'data.frame':   10292 obs. of  5 variables:
 $ S         : num  19 18 9 12 12 8 21 24 9 8 ...
 $ C         : Factor w/ 6 levels "D","E","F","I",..: 4 4 4 4 4 4 4 4 4 4 ...
 $ HA        : Factor w/ 2 levels "A","H": 1 2 1 1 2 1 2 2 1 2 ...
 $ L1        : num  0.99 1.41 1.46 1.43 1.12 1.08 1.4 1.45 0.85 1.44 ...
 $ L2        : num  1.31 0.63 1.16 1.15 1.29 1.31 0.7 0.65 1.35 0.59 ...

您正在运行一个没有截距的模型(公式右侧的 ~0)。对于这些类型的模型,R^2 的计算是有问题的,并且会产生误导性的值。这篇文章解释得很好:https://stats.stackexchange.com/a/26205/99681

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

零截距模型的 lm() 中的 R 平方 的相关文章

  • 在 R 中向散点图添加线条

    如何向图表添加线条 我做了以下 dat lt data frame xvar 1 20 rnorm 20 sd 10 yvar 1 20 rnorm 20 sd 10 zvar 1 20 rnorm 20 sd 10 plot dat 1
  • 如何使用 R 计算成为列表中中位数的概率?

    假设我有以下数据集 其中显示了假设实验的每个状态的三个观察结果的列表 state lt c Iowa Minnesota Illinois outcome lt list c 5 11 11 c 3 12 8 c 9 14 2 dat lt
  • 时间戳半小时窗口内字段的平均值

    我的数据框有列名Timestamp es看起来像 Timestamp es 2015 04 01 09 07 42 31 2015 04 01 09 08 01 29 5 2015 04 01 09 15 03 18 5 2015 04 0
  • 在 R 中绘制 Likert 变量的堆积条形图

    假设我有一个如下所示的数据框 P Q1 Q2 1 1 4 1 2 2 3 4 3 1 1 4 其中的列告诉我哪个人相应地回答了问题 q1 q2 中的哪一个 这些问题需要按照 4 分李克特量表进行回答 例如 批准 表示 1 稍微批准 表示 2
  • 为什么 dplyr filter() 不能在函数内工作(即使用变量作为列名)?

    使用 dplyr 函数对数据进行过滤 分组和变异的函数 基本管道序列在函数之外工作得很好 这就是我使用真实列名称的地方 将其放入一个函数中 其中列名称是一个变量 并且某些函数可以工作 但有些函数则不能 尤其是 dplyr filter 例如
  • 在 R 格子包中微调点图

    我正在尝试为不同的数据集和不同的算法绘制一堆 ROC 区域 我有三个变量 方案 指定所使用的算法 数据集 是正在测试算法的数据集 以及 Area under ROC 我正在 R 中使用lattice库 命令如下 点图 方案 Area und
  • R 中的列乘以子字符串

    假设我有一个数据框 其中包含多个组件及其在多个列中列出的属性 并且我想对这些列运行多个函数 我的方法是尝试将其基于每个列标题中的子字符串 但我无法弄清楚如何做到这一点 下面是数据框的示例 Basket F Type 1 F Qty 1 F
  • 基于时间窗口的不规则时间序列的优化滚动函数

    有没有办法使用 rollapply 来自zoo包或类似的东西 优化功能 rollmean rollmedian等 使用基于时间的窗口计算滚动函数 而不是基于大量观察的函数 我想要的很简单 对于不规则时间序列中的每个元素 我想计算一个具有 N
  • 更改闪亮 R 中的默认浏览器

    我在 RStudio 中使用 01 hello 虽然在 IE 中默认打开程序时它不会显示直方图 但即使在 Chrome 中 滑块也不起作用 我无法滑动条形图并看到直方图中的变化 如何更改 R 中的默认浏览器 以便闪亮启动 Chrome 而不
  • 所有 x 轴标签未以 45 度显示

    I m having the code as like below But I m not getting all the x axis labels and it is not displaying in 45 degree when I
  • 为什么 R 更新后 sim_slopes() 中会出现此错误?

    我正在尝试使用 交互 包来创建简单斜率的约翰逊 尼曼图 但是 当尝试运行 sim slopes 函数时 出现以下错误 直到我将R更新到4 2 2 我才没有遇到这个问题 我使用的是 macOS Ventura 13 1 Error class
  • R:如何获取该月的周数

    我是 R 新手 我想要该日期所属月份的周数 通过使用以下代码 gt CurrentDate lt Sys Date gt Week Number lt format CurrentDate format U gt Week Number 3
  • R 中用于调用 sed、rsync、ssh 等的 system() 的替代方案:函数是否存在,我应该编写自己的函数,还是我错过了重点?

    最近 我发现了base files命令 与其他命令一起使用 例如getwd write lines file show dir等等 似乎有许多 bash 函数的 R 等价物 我还在 R 中编写了一些函数来简化对ssh and rsync通过
  • 如何使用 SparkR 1.6.0 写入 JDBC 源?

    使用 SparkR 1 6 0 我可以使用以下代码从 JDBC 源读取数据 jdbc url lt jdbc mysql localhost 3306 dashboard user
  • SPSS 中的标准化残差与 R rstandard(lm()) 不匹配

    在寻找 R 相关解决方案时 我发现 R 和 SPSS 版本 24 在计算简单线性模型中的标准化残差方面存在一些不一致 看来SPSS所谓的标准化残差匹配 R学生化残差 我完全不认为某处存在软件错误 但显然这两个程序之间存在差异 看看这个例子
  • 实三次多项式的最快数值解?

    R 问题 寻找最快的方法来数值求解一堆已知具有实系数和三个实根的任意三次方程 据报道 R 中的 polyroot 函数对复杂多项式使用 Jenkins Traub 算法 419 但对于实多项式 作者参考了他们早期的工作 对于实三次或更一般的
  • 如何使用 tidymodels 和工作流集在同一数据集上拟合多个不同的线性模型

    我想评估同一数据集上多个 主要是 线性回归模型的性能 我想也许使用tidymodels包连同workflowsets workflow set 可能会起作用 我按照这个例子here https workflowsets tidymodels
  • 无法更改 RStudio 中的 R 版本

    我的 RStudio V 0 99 491 无法更改 R 版本 我以平常的方式行事Global Options gt R Version 然后它挂起并且不再工作或反应 R 运行良好的初始版本是R 3 1 0 我以前从未遇到过这样的问题 也许
  • 麦当劳 omega:R 中的警告

    我正在计算几种不同尺度的欧米茄 并在 R 中使用不同的 omega 函数获取不同比例的不同警告消息 我的问题是如何解释这些警告以及报告检索到的 omega 统计数据是否安全 当我使用 从 alpha 到 omega 内部一致性估计普遍问题的
  • Statsmodels.formula.api OLS不显示截距的统计值

    我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

  • Javascript:捕获鼠标滚轮事件并且不滚动页面?

    我试图防止页面元素捕获鼠标滚轮事件以导致滚动 我期望false作为最后一个参数来获得预期的结果 但是在这个 canvas 元素上使用鼠标滚轮仍然会导致滚动 this canvas addEventListener mousewheel fu
  • 计算任何指数的幂(负或正)

    我想计算结果 给定任何指数 负或正 和整数类型的基数 我正在使用递归 public static double hoch double basis int exponent if exponent gt 0 return basis hoc
  • Symfony 2 实体字段属性

    我的表单中有一个实体字段 该字段如下所示 gt add user entity array class gt Elearning SiteBundle Entity User property gt name multiple gt tru
  • 从 JSON 中解析并提取属性

    我有一个与此类似的大型 JSON 文件 data attribution null tags thenight2 type image images standard resolution url http distilleryimage3
  • 运行时未调用自定义 Spring 安全过滤器

    我正在尝试在 Spring Boot Rest 服务项目中启用 Spring Security 但遇到了一些问题 我用这段代码配置了它 Configuration EnableWebSecurity public class WebSecu
  • 将文件(如对象)保存到 s3 时出现错误:Unicode 对象必须在散列之前进行编码

    这是我的代码 import boto3 import pandas as pd import requests from io import StringIO campaign buffer StringIO r requests get
  • 将 css 放置在 codeigniter 视图中

    我是 codeigniter 的新手 我制作了一个简单的控制器来加载三个视图 页眉 正文和页脚 我的标头包含指向多个具有相对路径的 javascript 和 CSS 的链接 我将所有与文件相关的 css 和 js 保留在视图文件夹中 问题是
  • 为什么同一自动化流程生成的 pdf 在不同机器上会有所不同?

    我有一个生成 pdf 的自动化流程然后我们通过批准测试将其与已知版本进行比较验证该管道中没有任何损坏 我标准化不匹配的字段例如创建 修改日期和时区 本地所有内容始终 100 匹配 然而由于某种原因 我们的构建服务器上生成的 pdf 是ver
  • unique() 用于多个变量

    我在 R 中有以下数据框 gt str df data frame 545227 obs of 15 variables ykod int 93 93 93 93 93 93 93 93 93 93 yad Factor w 42 leve
  • Safari 和 Chrome 中允许跨域请求吗?服务器响应与命令行参数

    我正在尝试在 Windows 上使用 Safari 发出跨域请求 我的 Safari 版本是 5 1 2 这是一个经典问题 我在很多地方读到 Chrome 和 Safari 允许跨域请求 只要服务器在响应中使用以下标头进行响应 Access
  • 在 UITextField 之外的任何地方触摸时关闭键盘

    我正在开发一个iPad应用程序 其中有大量UIViewControllers UITableViews 与细胞accessoryViews of UITextFields 等等等等 许多UIViewControllers出现在导航层次结构中
  • 访问 pandas DataFrame 中名为“class”的列时出现语法错误

    我有名为 dataset 的 pandas DataFrame 它包含一个名为 class 的列 当我执行以下行时 我得到 SyntaxError 无效语法 print Unique values in the Class column d
  • C#中如何杀死线程?

    我有一个线程打开 MyMessageAlert 类型的表单 该表单是一个弹出窗口 当我调用它时会打开它 它有一个计时器 在 30 秒后调用 CloseWindow 方法 m messagAlert new MyMessageAlert Pa
  • 这个配置规格足够好吗?

    我更喜欢 UCM 而不是 Base CC 谁能告诉我这个配置规范是否好 我对最后一行有一些疑问 没有的话可以吗element main LATEST 以下是开发者的要求 我希望他们所有的改变 main nz plusOne分支 即使他们从
  • 如何使用 sed 匹配后面不跟单词的字符串

    我需要删除由连字符后跟空格组成的所有字符串 但前提是空格后面没有单词 og 示例文件 Kultur og idrettsavdelinga skapar nyska pande kunst og utvik lar samfunnet 我尝
  • 为什么这个随机数生成器不是随机的? [复制]

    这个问题在这里已经有答案了 可能的重复 为什么我的随机数生成器在 C 中不是随机的 随机数生成器没有按我计划的方式工作 C 我有这个方法来计算随机值 private double getMetrics SourceFile sf Rando
  • C 中的堆大小限制

    我对 C 程序的程序执行布局图中的堆有疑问 我知道所有动态分配的内存都是在动态增长的堆中分配的 但我想知道 C 程序的最大堆大小是多少 我只是附加一个示例 C 程序 这里我尝试为字符串分配 1GB 内存 甚至执行 memset includ
  • 在 VSTS 中显示代码分析警告

    I ve 设置静态代码分析在我的 Visual Studio Team Services 构建上 我正在为我的解决方案使用 MSBuild 构建步骤 在构建日志中 它显示了 999 多行以 warning 2017 11 09T13 52
  • MongoDB:与 ASP.NET MVC 应用程序连接

    我创建了一个 ASP NET MVC 5 应用程序 并将其托管在 IIS 7 上 我现在想开始在该应用程序中使用 MongoDB 数据库 我已经成功运行了 MongoDB Windows 服务 但我现在不知道下一步是什么 Namely i
  • 零截距模型的 lm() 中的 R 平方

    我经营一家lm 在 R 中 这是总结的结果 Multiple R squared 0 8918 Adjusted R squared 0 8917 F statistic 9416 on 9 and 10283 DF p value lt