R：数据点与高斯函数的稳健拟合

2023-12-20

我需要进行一些稳健的数据拟合操作。

I have bunch of (x,y) data, that I want to fit to a Gaussian http://en.wikipedia.org/wiki/Gaussian_function (aka normal) function. The point is, I want to remove the ouliers. As one can see on the sample plot below, there is another distribution of data thats pollutting my data on the right, and I don't want to take it into account to do the fitting (i.e. to find \sigma, \mu and the overall scale parameter). sample data plot

R 似乎是适合这项工作的工具，我找到了一些软件包（robust http://cran.r-project.org/web/packages/robust/, 坚固的基础 http://cran.r-project.org/web/packages/robustbase/, MASS http://cran.r-project.org/web/packages/MASS/例如）与稳健拟合相关。

然而，他们假设用户已经对 R 有了很强的了解，这不是我的情况，并且文档仅作为一种参考手册提供，没有教程或等效内容。我的统计背景相当低，我尝试阅读与 R 拟合的参考资料 http://cran.r-project.org/doc/contrib/Ricci-distributions-en.pdf，但这并没有真正帮助（而且我什至不确定这是正确的方法）。但我感觉这其实是一个很简单的操作。

我已经检查过这个相关问题 https://stackoverflow.com/questions/14511454/（以及链接的），但是它们将单个值向量作为输入，并且我有一个成对的向量，所以我不知道如何转置。

任何有关如何执行此操作的帮助将不胜感激。

对数据进行高斯曲线拟合，其原理是最小化拟合曲线与数据的平方和差，所以我们定义f我们的目标函数和运行optim on it:

fitG =
function(x,y,mu,sig,scale){

  f = function(p){
    d = p[3]*dnorm(x,mean=p[1],sd=p[2])
    sum((d-y)^2)
  }

  optim(c(mu,sig,scale),f)
 }

现在，将其扩展到两个高斯：

fit2G <- function(x,y,mu1,sig1,scale1,mu2,sig2,scale2,...){

  f = function(p){
    d = p[3]*dnorm(x,mean=p[1],sd=p[2]) + p[6]*dnorm(x,mean=p[4],sd=p[5])
    sum((d-y)^2)
  }
  optim(c(mu1,sig1,scale1,mu2,sig2,scale2),f,...)
}

使用第一次拟合的初始参数以及对第二个峰值的目测猜测进行拟合。需要增加最大迭代次数：

> fit2P = fit2G(data$V3,data$V6,6,.6,.02,8.3,0.10,.002,control=list(maxit=10000))
Warning messages:
1: In dnorm(x, mean = p[1], sd = p[2]) : NaNs produced
2: In dnorm(x, mean = p[4], sd = p[5]) : NaNs produced
3: In dnorm(x, mean = p[4], sd = p[5]) : NaNs produced
> fit2P
$par
[1] 6.035610393 0.653149616 0.023744876 8.317215066 0.107767881 0.002055287

这一切看起来是什么样的？

> plot(data$V3,data$V6)
> p = fit2P$par
> lines(data$V3,p[3]*dnorm(data$V3,p[1],p[2]))
> lines(data$V3,p[6]*dnorm(data$V3,p[4],p[5]),col=2)

但是，我对有关函数参数的统计推断持谨慎态度......

产生的警告消息可能是由于 sd 参数变为负值所致。您可以通过使用 L-BFGS-B 并设置下限来修复此问题并获得更快的收敛：

> fit2P = fit2G(data$V3,data$V6,6,.6,.02,8.3,0.10,.002,control=list(maxit=10000),method="L-BFGS-B",lower=c(0,0,0,0,0,0))
> fit2P
$par
[1] 6.03564202 0.65302676 0.02374196 8.31424025 0.11117534 0.00208724

正如所指出的，对初始值的敏感性始终是此类曲线拟合的问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

datafitting

R：数据点与高斯函数的稳健拟合的相关文章

在 Shiny 中设置一个绘图缩放以匹配另一个绘图缩放

我正在尝试使用情节重排获取一个图的 x 轴缩放限制并将它们应用到 Shiny 中的另一个图到目前为止我可以从 plot1 x轴限制获取相关的plotly relayout数据将其转换从数字到日期并在绘制 plot2 之前将其提
R read_excel：libxls 错误：无法解析文件

我试图使用 readxl read excel 将 xls 文件读入 R 但它给出了以下错误 Error filepath data xls libxls error Unable to parse file 还尝试了 readxl exc
R 中的 NA 替换函数

我正在尝试替换矩阵中的 NA mat 零我在用着mat is na mat lt 0 当我有 18946 个变量的 94531 个观察值或更小的矩阵时效果很好但我在 22752 个变量的 112039 个观察值的矩阵上尝试它 R 显示
如何让R使用所有处理器？

我有一台运行 Windows XP 的四核笔记本电脑但查看任务管理器 R 似乎一次只使用一个处理器如何让 R 使用全部四个处理器并加速我的 R 程序我有一个基本系统我使用它在 for 循环上并行化我的程序一旦您了解需要做什么此方
如何使用 R 中带引号的字符值内的序列读取 CSV？

这是一个包含两个字符列的 CSV 文件 key value a 所有字符值都用双引号引起来并且有一个顺序在值之一内转义引号加分隔符我无法通过 read csv readr 中的 read csv 或 data table 中的 fr
将列表中的列转换为 R 中的数据框

我有使用 R 创建的以下列表 set seed 326581 X1 rnorm 10 0 1 Y1 rnorm 10 0 2 data data frame X1 Y1 lst lt replicate 100 df smpl lt dat
如何在 R 中为传单中的数值变量设置不对称颜色渐变

我想让传单调色板以零为中心红白绿发散我已经尝试过中所说的这个帖子 https stackoverflow com questions 29262824 r center color palette on 0 当我尝试手动创建颜色时我得
R 中的发散积分可在 Wolfram 中求解

我知道我以前问过同样的问题但由于我是新来的这个问题问得不好而且不可重现因此我在这里尝试做得更好如果我只编辑旧的可能没有人会读它我有一个想要积分的二重积分 ff lt function g t exp 16 g exp 8 t t
在另一个 Rmd 中运行选定的块

我已经在源 Rmd 文件中运行了分析并且希望仅使用few来自源的块我已经看到了一些关于从源 Rmd 中提取所有块的答案来自另一个 Rmd 中的 Rmd 文件的源代码 https stackoverflow com questions 4
R 编程：如何计算数据框中两个单元格之间的差异并将它们保存在新列中

尝试学习 R 并陷入自相关示例中我想将 x 的差异与 y 的差异进行回归我在数据框中有 x 和 y 并且希望将 x2 x1 的差值保存在新列例如 dx 中我不知道该怎么做我拥有的 data1 x y 5 3 8 9 3 1 1 5
将 sf voronoi 多边形裁剪到边界框时出错

我正在尝试将 voronoi polygons 使用 sf package 创建剪辑到边界框但它引发了我无法定义的错误我对 R 的空间世界不太有经验感谢所有帮助样本数据 stations lt structure list ST
如何更改 Shiny 中 navbarPage 折叠的断点

我想用shiny navbarPage collapsible TRUE 当在小屏幕上查看我的 Shiny 应用程序时将导航元素折叠到菜单中默认情况下当浏览器宽度小于 940 像素时会触发折叠有什么方法可以改变这一点以便在稍大的浏
如何按 data.table 中的十分位数组计算统计数据

我有一个 data table 想按组计算统计数据 R set seed 1 R DT data table a rnorm 100 b rnorm 100 这些组应该定义为 R quantile DT a probs seq 1 9 1
如何将此“for”循环转换为向量解

这个问题与将嵌入其他文本的长州名称转换为两个字母的州缩写 https stackoverflow com questions 25582518 convert long state names embedded with other te
使用 R 进行项目组织 [重复]

这个问题在这里已经有答案了可能的重复统计分析和报告撰写的工作流程 https stackoverflow com questions 1429907 workflow for statistical analysis and repor
R 中的字符串作为函数参数

数据框chocolates列出了糖果的类型以及每种糖果的一组评级 ID sweetness filling crash snickers 0 67 0 55 0 40 milky way 0 81 0 53 0 56 我正在编写一个函数它
有没有一种简单的方法来判断存储在一个列表中的许多数据帧是否包含相同的列？

我有一个包含许多数据框的列表 df1 lt data frame A 1 5 B 2 6 C LETTERS 1 5 df2 lt data frame A 1 5 B 2 6 C LETTERS 1 5 df3 lt data frame
如何计算嵌套函数中的粘合表达式？

我正在尝试嵌套一个函数该函数将两个字符串粘合在一起该函数使用组合字符串来命名数据帧的列然而问题似乎是粘合表达式没有足够早地评估为字符串我可以并且应该强制在将表达式作为参数传递给另一个函数之前对其进行求值吗 library ti
如何在R中同时对三个字段进行网络分析

如何在 R 中同时对三个字段进行网络分析下面是示例数据以及desired output在最后一栏中 df lt data frame stringsAsFactors FALSE id 1 c ABC ABC BCD CDE DEF EF
为什么 geom_boxplot 比基本箱线图识别更多异常值？

这是一个可重复的示例与基本箱线图相比最后一个治疗组又发现了一个异常值 dta lt structure list Treatment c A A A A A A A A A A A A A A A A B B B B B B B B B

随机推荐

使用 jFreeChart 在多个图形中绘制多个图形

我正在尝试使用 jFreechart 生成两个数字每个数字有 12 个图表在 jFreeChart 中称为系列然而有些图表被简单地跳过了我知道我在这里遇到同步问题并尝试使用用户 trashgod 提供给我的方法here http
Python json.dumps() 输出缩小的json？

有没有办法让python的json dumps
如何在 Azure AD B2C 中停用和重新激活用户

有什么方法可以停用并重新激活 Azure AD B2C 用户我想实现切换 Azure AD 用户状态的功能如果停用并重新激活是指阻止用户登录目前这仅适用于本地帐户不适用于来自社交提供商的帐户 Facebook Google 等
如何设置SWFUpload上传的文件夹？

我在文档中没有看到如何使用 SWFUpload 设置上传的文件文件夹有人能指出我正确的方向吗如果有帮助的话我正在使用 PHP 5 您所做的就是调用 PHP 脚本该脚本会处理文件上传您可以打开调试这将为您提供一个非常好的调试视图了
gridview 中的分页

我的网格视图
动态缩略图/调整图像大小生成[重复]

这个问题在这里已经有答案了可能的重复 PHP 动态调整图像大小与存储调整大小的图像 https stackoverflow com questions 2823600 php image resize on the fly vs stor
未找到 glib.h 和 gtk.h

大家好我有一个程序其中包括 gtk gtk h glib h 我使用过以下命令 sudo apt get install libgtk2 0 dev glib sudo apt get install glade 但我仍然收到 glib
本机 xml 数据库中的唯一性插入

我正在开发一个基于XML 的项目我使用 Sedna 数据库来存储我的集合其中包含 XML 文件及其 XSD 架构文件我在这些方案中定义了主键唯一键但到目前为止我可以将重复值通过 XQuery 更新插入命令插入到主键字段中为了
内存泄漏和处置

我可能不理解这个概念或者我做错了什么我对 NET 中的内存管理有一些疑问想象一下情况 Form1是大人窗体作为 MDI 父级和一点FormChild 被绑定为子项 public partial class Form1 Form pub
如何使用 @output 将布尔值从子级发送到父级

嗨有角的社区我想使用 Output 触发一个事件来隐藏或打开关闭包含其他组件的 div 这很简单但我以前从未使用过 EventEmitter 所以我希望当调用 hideDem 时它会根据来自 child ts 的其他属性隐藏或打开
如何增加android中线性布局中元素之间的空间？ [复制]

这个问题在这里已经有答案了在我的应用程序中我使用了 Linearlayout 其中有 3 个 EditText 元素现在我想增加 Edittext 元素之间的空间填充是否可以基本上这是相对于你的边框而言的如果你想在边框内的元素
使用该 exe 的 VM 参数在 Maven 中创建一个 exe 文件

我目前正在开发一个 Java 项目该项目需要指定 java library path 的 VM 参数当从 Eclipse 中运行我的程序时没问题我可以轻松指定我的 VM 参数现在我想通过 Maven 构建我的项目但还没有找到向该
如何将二进制字符串写入文件 C#

我有一个二进制数字符串例如 temp 0101110011 我想将其另存为文件该 Temp 有 10 个字符如何将此字符串保存到 10 位长度的文件中 void Save Data string temp bool BoolArray
使用 NSXMLParserDelegate 构建项目时出错

TurbineXMLParser h import
VBA - 文件夹选择器 - 设置从哪里开始[重复]

这个问题在这里已经有答案了我有一个小型 Access VBA 应用程序需要用户选择一个文件夹我想知道是否有办法告诉 VBA 启动文件夹选择器的路径即启动文件夹选择器C data forms 目前看来是从以前使用的目录开始的还有一种
WebDriver / 将元素读入变量并重新使用它们

我有一个大问题Webdriver 硒2 在我的测试代码中我找到测试开始时的所有元素并对它们执行一些操作例如click 检查属性等我的问题是我的页面刷新并重新加载我的元素而 Webdriver 不知道再次识别这些元素我知道我可以再
即使调整窗口大小，也保持背景图像居中

我有一个容器 div 另一个 div 居中里面有背景图像当我调整浏览器窗口大小时我希望图像保持居中即使浏览器窗口的宽度为smaller比图像的宽度这是一些代码 CSS wrap width 100 height 357px bac
Git 推送在 TOTAL 上挂起

Git 突然开始挂起PUSH命令我搜索了其他问题但解决方案不起作用我使用的是 ubuntu 12 04 Counting objects 18 done Delta compression using up to 2 threads
我可以将 Snapchat SDK (SnapKit) 与 SwiftUI 结合使用吗？

我正在尝试整合Snapkit https docs snapchat com 使用 iOS 应用程序但我想使用 SwiftUI 而不是 UIKit 我已经使用 Snapkit 完成了所需的设置现在我正在尝试让 Snapchat 登录按钮
R：数据点与高斯函数的稳健拟合

我需要进行一些稳健的数据拟合操作 I have bunch of x y data that I want to fit to a Gaussian http en wikipedia org wiki Gaussian function

R：数据点与高斯函数的稳健拟合

R：数据点与高斯函数的稳健拟合 的相关文章

随机推荐

热门标签

R：数据点与高斯函数的稳健拟合的相关文章