使用 lm() 进行线性回归 - 对结果感到惊讶

2023-11-22

我对已有的数据进行了线性回归，使用lm功能。一切正常（没有错误消息），但我对结果感到惊讶：我的印象是 R“错过”了一组点，即截距和斜率不是最佳拟合。例如，我指的是坐标 x=15-25,y=0-20 处的点组。

我的问题：

是否有一个函数可以比较“预期”系数和“lm计算”系数的拟合度？
我在编码时犯过一个愚蠢的错误吗？lm去做那？

以下是一些答案：有关 x 和 y 的附加信息

x and y are both visual estimates of disease symptoms. There is the same uncertainty on both of them.

数据和代码在这里：

x1=c(24.0,23.9,23.6,21.6,21.0,20.8,22.4,22.6,
     21.6,21.2,19.0,19.4,21.1,21.5,21.5,20.1,20.1,
     20.1,17.2,18.6,21.5,18.2,23.2,20.4,19.2,22.4,
     18.8,17.9,19.1,17.9,19.6,18.1,17.6,17.4,17.5,
     17.5,25.2,24.4,25.6,24.3,24.6,24.3,29.4,29.4,
     29.1,28.5,27.2,27.9,31.5,31.5,31.5,27.8,31.2,
     27.4,28.8,27.9,27.6,26.9,28.0,28.0,33.0,32.0,
     34.2,34.0,32.6,30.8)

y1=c(100.0,95.5,93.5,100.0,98.5,99.5,34.8,
     45.8,47.5,17.4,42.6,63.0,6.9,12.1,30.5,
     10.5,14.3,41.1, 2.2,20.0,9.8,3.5,0.5,3.5,5.7,
     3.1,19.2,6.4, 1.2, 4.5, 5.7, 3.1,19.2, 6.4,
     1.2,4.5,81.5,70.5,91.5,75.0,59.5,73.3,66.5,
     47.0,60.5,47.5,33.0,62.5,87.0,86.0,77.0,
     86.0,83.0,78.5,83.0,83.5,73.0,69.5,82.5,78.5,
     84.0,93.5,83.5,96.5,96.0,97.5)   



## x11()
plot(x1,y1,xlim=c(0,35),ylim=c(0,100))

# linear regression
reg_lin=lm(y1 ~ x1)
abline(reg_lin,lty="solid", col="royalblue")
text(12.5,25,labels="R result",col="royalblue", cex=0.85)
text(12.5,20,labels=bquote(y== .(5.26)*x - .(76)),col="royalblue", cex=0.85)

# result I would have imagined
abline(a=-150,b=8,lty="dashed", col="red")
text(27.5,25,labels="What I think is better",col="red", cex=0.85)
text(27.5,20,labels=bquote(y== .(8)*x - .(150)),col="red", cex=0.85)

尝试这个：

reg_lin_int <- reg_lin$coefficients[1]
reg_lin_slp <- reg_lin$coefficients[2]

sum((y1 - (reg_lin_int + reg_lin_slp*x1)) ^ 2)
# [1] 39486.33
sum((y1 - (-150 + 8 * x1)) ^ 2)
# [1] 55583.18

残差平方和在以下情况下较低lm拟合线。这是可以预料的，因为reg_lin_int and reg_lin_slp保证产生最小的总平方误差。

直观上，我们知道平方损失函数下的估计量对异常值很敏感。它“丢失”了底部的组，因为它更接近左上角的组，而距离远得多 - 并且平方距离赋予这些点更多的权重。

事实上，如果我们使用最小绝对偏差回归（即指定绝对损失函数而不是平方），结果更接近您的猜测：

library(quantreg)
lad_reg <- rq(y1 ~ x1)

（专业提示：使用lwd制作你的图表much更具可读性）

更接近你的想法的是总最小二乘法，正如 @nongkrong 和 @MikeWilliamson 提到的。以下是样本上的 TLS 结果：

v <- prcomp(cbind(x1, y1))$rotation
bbeta <- v[-ncol(v), ncol(v)] / v[1, 1]
inter <- mean(y1) - bbeta * mean(x1)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

linearregression

LM

leastsquares

orthogonal

使用 lm() 进行线性回归 - 对结果感到惊讶的相关文章

R中的一元加/减是什么？

来自 R 的详细信息部分Syntax http stat ethz ch R manual R patched library base html Syntax html帮助页面定义了以下一元和二元运算符他们被列出在优先级组中从最高
在 R 中向散点图添加线条

如何向图表添加线条我做了以下 dat lt data frame xvar 1 20 rnorm 20 sd 10 yvar 1 20 rnorm 20 sd 10 zvar 1 20 rnorm 20 sd 10 plot dat 1
将绘图调用拆分为多个块

我正在编写一个图的解释其中我基本上将在第一个块中创建图然后描述该输出并在第二个块中添加一个轴然而似乎每个块都会强制一个新的绘图环境因此当我们尝试使用以下命令运行块时会出现错误axis独自的观察 output html docu
R独特的列或行与NA无可比拟

有谁知道如果incomparables的论证unique or duplicated 曾经被实施过incomparables FALSE 也许我不明白它应该如何工作无论如何我正在寻找一个巧妙的解决方案以仅保留与另一列相同的唯一列或行
Purrr::map_df() 删除 NULL 行

使用时purrr map df 我偶尔会传递一个数据框列表其中一些项目是NULL 当我做 map df 返回行数少于原始列表的数据框我想发生的事情是这样的map df calls dplyr bind rows 它忽略了NULL价值观
r 中训练和测试数据的最小最大缩放/归一化

我正在创建一个函数它将训练集和测试集作为其参数最小最大缩放标准化并返回训练集并使用这些same最小值和最小最大范围的值标准化并返回测试集到目前为止这是我想出的功能 min max scaling lt function tr
ggplot2 geom_密度和geom_histogram在一个图中

如何制作一个所有条形加起来为 1 的直方图并在适合的上方添加一个密度层 set seed 1234 df lt data frame sex factor rep c F M each 200 weight round c rnorm 2
朴素贝叶斯分类器仅基于先验概率做出决策

我试图根据推文的情绪将推文分为三类买入持有卖出我正在使用 R 和包 e1071 我有两个数据框一个训练集和一组需要预测情绪的新推文训练集数据框 text sentiment this stock is a good buy Bu
只读取选定的列

谁能告诉我如何仅读取下面每年数据的前 6 个月 7 列例如使用read table Year Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2009 41 27 25 31 31 39 2
ddply 和aggregate 之间的区别

有人可以通过以下示例帮助我了解聚合和 ddply 之间的区别数据框 mydat lt data frame first rpois 10 10 second rpois 10 10 third rpois 10 10 group c re
基于时间窗口的不规则时间序列的优化滚动函数

有没有办法使用 rollapply 来自zoo包或类似的东西优化功能 rollmean rollmedian等使用基于时间的窗口计算滚动函数而不是基于大量观察的函数我想要的很简单对于不规则时间序列中的每个元素我想计算一个具有 N
如何仅删除单括号并保留配对的括号

你好我亲爱的老师 R 用户朋友们我最近开始认真学习正则表达式最近我遇到了一种情况我们只想保留配对括号并省略未配对的这是我的样本数据 structure list t1 c Book Pg 1 Website Online Jou
如何获得所有大于x且有位置的数字？

V lt c 1 3 2 4 2 3 1 X lt 3 pos lt V V X pos is 3 3 我需要的是所有 3 个的位置 I need 2 and 6 哪些职位是3 in V Use which pos lt which V 3
所有 x 轴标签未以 45 度显示

I m having the code as like below But I m not getting all the x axis labels and it is not displaying in 45 degree when I
使用 ggmap 截断密度多边形

我在使用 R ggmap 绘制密度图时遇到问题我的数据如下所示 gt head W date lat lon dist 1 2010 01 01 31 942 86 659 292 415 2 2010 01 10 32 970 84 1
纵向比较 R 中的值...并进行扭转

我有许多人在多达四个时间段进行的测试结果这是一个示例 dat lt structure list Participant ID c A A A A B B B B C C C C phase structure c 1L 2L 3L 4L
read_html(url) 和 read_html(content(GET(url), "text")) 之间的区别

我正在看这个很棒的答案 https stackoverflow com a 58211397 3502164 https stackoverflow com a 58211397 3502164 解决方案的开头包括 library httr
SPSS 中的标准化残差与 R rstandard(lm()) 不匹配

在寻找 R 相关解决方案时我发现 R 和 SPSS 版本 24 在计算简单线性模型中的标准化残差方面存在一些不一致看来SPSS所谓的标准化残差匹配 R学生化残差我完全不认为某处存在软件错误但显然这两个程序之间存在差异看看这个例子
R：使用 tidyverse 将 NA 替换为 df 中的其他变量

我想使用 tidyverse 替换 df 中的 NA 值我想要的值应该从其他列中计算出来 input ID X1 X2 X3 A 0 96 NA 0 97 B 1 00 NA 1 01 C 0 98 0 03 NA A 1 00 NA 1
无法更改 RStudio 中的 R 版本

我的 RStudio V 0 99 491 无法更改 R 版本我以平常的方式行事Global Options gt R Version 然后它挂起并且不再工作或反应 R 运行良好的初始版本是R 3 1 0 我以前从未遇到过这样的问题也许

随机推荐

Boost.MultiArray 的一行初始化程序

我有一个 n 维 Boost MultiArray 我初始化如下 const int n 3 size 4 of dimensions and size of one dimension boost multi array
选择除顶行之外的所有行[重复]

这个问题在这里已经有答案了如何返回表中除第一行之外的所有行这是我的sql语句 Select Top TopWhat from tbl SongsPlayed where Station Station order by DateTime
帮助理解受保护方法的问题

我正在阅读Sybex 完整 Java 2 认证学习指南 2005 年 4 月 ISBN0782144195 本书适合想要通过java认证的java开发人员在了解访问修饰符以及其他修饰符一章之后我发现了以下问题 17 对或错如果 Y
当我没有 app.config 文件时，编译器告诉我“考虑 app.config 重新映射”，我应该更改什么？

在编译一个从 VS2003 中的 NET 1 1 移植到 VS2008 中的 NET 3 5 的解决方案时我得到了一些建议其中以下一条具有代表性考虑将程序集 System Windows Forms Culture neutral P
已弃用：mysql_pconnect()：

我在 php 执行期间遇到错误我认为这是由于较新的 php 5 5 造成的已弃用 mysql pconnect mysql 扩展已弃用并将在将来删除在第 7 行的 public html mydomain com connx php
从先前的布局方向在相同位置重绘多个路径

基于我之前的问题如何在camera2 Android api中创建一个BottomBar作为StickyBottomCaptureLayout 我创建了一个布局StickyBar SB 始终锁定在系统栏上方附近我设置了 SB 和其他布
MVC，不再“应该”使用 HttpContext.Current 了吗？

有人在帖子里here 评论说在使用 MVC 时不应该使用 HttpContext Current 而应该使用ControllerBase ControllerContext 在某些方面这是有道理的但在其他方面则不然例如 Control
设置错误值与删除属性

我正在读一些关于布尔属性的内容here 这表示对于布尔属性在这个特定的示例中 loop的属性
从 XmlDocument XPath 查询获取特定数量的结果

我正在查询 Twitter RSS 源并将结果提供到转发器中进行显示我只想获取 XPath 查询的前 5 个结果有没有办法在 XPath 语法中做到这一点或者我是否必须循环生成结果XmlNodeList取出前5个 XmlDocumen
.NET Core 2.0 Cookie 事件 OnRedirectToLogin

如何将中间件应用于 Cookie 选项中的 OnRedirectToLogin 事件以便我可以使用依赖项注入或者如何从 RedirectContext 检索 actionContext 我尝试过搜索文档或示例但很难找到而且我还没有看
JavaBean 比较

有谁知道一个免费的开源库实用程序类它允许您比较一个 Java bean 的两个实例并返回在这两个实例中值不同的属性列表数组请发布一个小样本 Cheers Tomas Bean比较器Apache commons 就是您正在寻找的 Up
Azure Function - 此平台不支持 System.Data.SqlClient

我正在运行以下内容insert将我的 azure 函数中的代码写入 azure sql server 2014 数据库 private static void Command SqlConnection sqlConnection stri
带有 select2 z-index 的引导模式

我正在尝试将内容从不同的 html 页面加载到弹出窗口然后在其上应用 select2 一切正常但 select2 的 z index 不正确如果我将其修改为比引导对话框更大的值这是我正在做的事情的一个片段 select2 dropd
IAP - 如果内容下载失败或收据无效，如何取消购买交易？

我正在尝试用 IAP 来解决一些问题在文档中我看到只有在为用户成功下载购买的内容后我才需要调用完成交易您的应用程序应仅在成功处理交易并解锁用户购买的功能后调用 finishTransaction 我有这样的情况用户购买内容购买完
如何在 Azure Dev Ops 中编辑视图和编辑发布管道的 YAML 文件？

我已通过修改管道 YAML 文件在 Azure Dev Ops 上成功构建了代码但我无法成功将该项目部署到我的 IIS 服务器创建部署的唯一方法是使用其令人不快的 UI 我读到通过打开多管道预览功能您可以查看和编辑 YAML 文件
核心数据不支持带有 ALL 和 IN 的谓词

我有一个这样的请求 NSPredicate predicate NSPredicate predicateWithFormat ANY attributes attribute attributeId IN attributeIds 这将返
无法通过 IP 和命名实例远程连接到 SQL 2012

首先我已经知道 Windows 防火墙正在阻止我的连接我只是不知道该怎么办当我完全关闭 WF 时我的远程连接可以正常工作我已经有一条规则允许端口 1433 传入请求这似乎是正确的端口但我不确定现在了解更多详细信息我的远程专
Firemonkey Mobile 中的 Bidi 从右到左语言

如何使用 FireMonkey 在 Android 或 iOS 中以从右到左的语言例如波斯语或阿拉伯语显示任何字符串我使用 Embarcadero Rad Studio XE6 Delphi 当我放置 TLabel 或 TEdit 并
如何在 Java 字符串的正则表达式中使用开始和结束标记？

为什么以下内容没有为我在 Android 中更改文本 String content test n test ntest content content replaceAll
使用 lm() 进行线性回归 - 对结果感到惊讶

我对已有的数据进行了线性回归使用lm功能一切正常没有错误消息但我对结果感到惊讶我的印象是 R 错过了一组点即截距和斜率不是最佳拟合例如我指的是坐标 x 15 25 y 0 20 处的点组我的问题是否有一个函数可以比较

使用 lm() 进行线性回归 - 对结果感到惊讶

使用 lm() 进行线性回归 - 对结果感到惊讶 的相关文章

随机推荐

热门标签

使用 lm() 进行线性回归 - 对结果感到惊讶的相关文章