检测简单数值向量中的一个或多个拐点

2024-01-11

All,

我正在寻找一种可靠的、无监督的方法来检测相对较短的向量中的变化点。考虑以下两个示例：

v1 = c(0.299584,0.314446,0.357783,0.388896,0.410417,0.427182,0.450383,0.466671,0.474884,0.474749,0.493566,0.500374,0.522482,0.529851,0.538387,0.577901,0.610939,0.639383,0.662433,0.692656,0.720543,0.738255,0.748055,0.7591,0.770595,0.781811,0.794479,0.794588,0.789448,0.77667,0.765406,0.75152,0.740408,0.726898,0.720766,0.709445,0.69896,0.687508,0.673382,0.65795,0.639214,0.620445,0.590047,0.561773,0.526807,0.486848,0.439681,0.387545,0.313369,0.282872,0.279908,0.271836,0.269088,0.262727,0.259782)

v2 = c(0.081309,0.206263,0.429069,0.511859,0.565194,0.578792,0.56919,0.51985,0.432563,0.193907,0.0771,0.086603,0.18303,0.177608,0.169706,0.260917,0.292062,0.2979,0.263249,0.270576,0.250422,0.25219,0.182878,0.080623,0.079443,0.088944,0.087623,0.126403,0.155563,0.273942,0.312054,0.370195,0.357087,0.336452,0.300574,0.243105,0.243105,0.25593,0.227401,0.218047,0.15857,0.157727,0.139801,0.125742,0.129142,0.142166,0.142166,0.136748,0.107755,0.064377,0.072801,0.060093,0.103441,0.111704,0.124544)

如果你看

plot(v1,type='l')

and

plot(v2,type='l')

您可以看到，对于 v1，我希望检测索引 = 28 附近的变化，对于 v2，我希望检测索引值 8、11、18、25、32 和 51 处的变化。到目前为止，我我已经尝试过贝叶斯变化点算法，该算法在识别可能出现拐点的位置（低后验概率区域）方面效果不错，但仍然迫使我依靠目视检查来进行最终确定：

install.packages('bcp')
library(bcp)

test = bcp(v1,w0=0.2,p0=0.01)
plot(v1,type='l')
par(new=TRUE)
plot(test$posterior.prob,type='l',col=2)

test = bcp(v2,w0=0.2,p0=0.01)
plot(v2,type='l')
par(new=TRUE)
plot(test$posterior.prob,type='l',col=2)

有没有一种方法可以自动无监督地选择此类数据中多个变化点的估计？也许我只是徒劳地寻找人类直觉的替代品：P我还查看了changepoint包，但它似乎不是为此类数据设计的。

谢谢，亚伦

所以，这是一个简单的解决方案。您可以修改参数以返回不同的（更多/更少，敏感/不敏感）拐点（或区域，就您的数据而言）。

plot(v2, type="l", col="darkblue", lwd=2)
# v2 <- smooth(v2, kind="3")  # optional
lines(v2, lwd=1, col="red")
d2 <- diff(v2)
d2 <- d2>0
d2 <- d2*2 -1 
k <- 5
cutoff <- 10
scores <- sapply(k:(length(d2)-k), FUN=function(i){
  score <- abs(mean(-d2[ i-1:k ], na.rm=T) + mean(d2[ i+0:k ], na.rm=T))
})


scores <- sapply(k:(length(v2)-k), FUN=function(i){
  left <- (v2[sapply(i-1:k, max, 1) ]<v2[i])*2-1
  right <- (v2[sapply(i+1:k, min, length(v2)) ]<v2[i])*2-1

  score <- abs(sum(left) + sum(right))
})

inflections <- (k:(length(v2)-k))[scores>=cutoff]

plot(v2, type="l")
abline(v=inflections, col="red", lwd=3)
print(inflections) #  6 11 18 25 32 (missed 51, if you make cutoff=8 it'll catch it...)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

检测简单数值向量中的一个或多个拐点的相关文章

如何从 Fortran 调用 R 函数？

根据http gallery rcpp org articles r function from c http gallery rcpp org articles r function from c Rcpp 允许用户从 C 调用 R 函数
R中的一元加/减是什么？

来自 R 的详细信息部分Syntax http stat ethz ch R manual R patched library base html Syntax html帮助页面定义了以下一元和二元运算符他们被列出在优先级组中从最高
如何删除箱线图上的刻度线

我试图从箱线图中删除 x 轴刻度线但保留与刻度线关联的标签这在基础 R 中可能吗 colors lt c lightskyblue3 gray78 gold1 wheat1 boxplot avgscore module data mi
正则表达式字符串中第一个和最后一个非点的位置

我希望找到字符串的第一个和最后一个非点元素的位置理想情况下我想这样做regex在基地R 我已经写过R解决问题的代码不过我对一个感兴趣regex解决方案感谢您的任何建议这是一个示例数据集和R代码以获得所需的结果此代码拆分字符串并使
使用 pracma::findpeaks 识别持续峰值

我的语法有问题peakpat内的选项findpeaks内的函数pramcaR 包 v 2 1 1 我使用的是 R 3 4 3 x64 Windows 我希望该函数能够识别可能有两个重复值的峰值并且我相信该选项peakpat这就是我能做到的
通过间接引用列来修改数据框中的某些值

我正在整理一些数据我们将失败的数据分类到垃圾箱中并按批次计算每个分类箱的有限产量我有一个描述排序箱的元表这些行按升序测试顺序排列一些排序标签带有非语法名称 sort tbl lt tibble tribble weight lab
绘制点之间的所有线

我有以下 R 代码 x lt c 0 01848598 0 08052353 0 06741172 0 11652034 y lt c 0 4177541 0 4042247 0 3964025 0 4074685 d lt data fr
kernlab 中 SVM 训练之外的核矩阵计算

我正在开发一种新算法该算法可以生成修改后的核矩阵以用于 SVM 训练但遇到了一个奇怪的问题出于测试目的我比较了使用 kernelMatrix 接口和普通内核接口学习的 SVM 模型例如 Model with kernelMatri
R 中的快速 QR 分解

我有大量矩阵需要对其执行 QR 分解并存储生成的 Q 矩阵进行归一化以便 R 矩阵在其对角线上具有正数除了使用之外还有其他方法吗qr 功能这是工作示例 system time Parameters for the matrix t
API 请求和curl::curl_fetch_memory(url, handle = handle) 中的错误：SSL 证书问题：证书已过期

几天前我运行了代码几个月没有任何问题 GET url myurl query 今天我遇到一个错误 Error in curl curl fetch memory url handle handle SSL certificate pro
r 中训练和测试数据的最小最大缩放/归一化

我正在创建一个函数它将训练集和测试集作为其参数最小最大缩放标准化并返回训练集并使用这些same最小值和最小最大范围的值标准化并返回测试集到目前为止这是我想出的功能 min max scaling lt function tr
使用 Shiny 发布平行坐标图表时出现“错误：路径[1]="”：没有这样的文件或目录”

我有一个似乎很常见但我还没有找到解决方案的问题当尝试使用 rCharts Parcoords 发布 Web 应用程序时出现以下错误错误路径 1 没有这样的文件或目录奇怪的是该应用程序在我的笔记本电脑上运行得很好下面是我正在使用
更改闪亮 R 中的默认浏览器

我在 RStudio 中使用 01 hello 虽然在 IE 中默认打开程序时它不会显示直方图但即使在 Chrome 中滑块也不起作用我无法滑动条形图并看到直方图中的变化如何更改 R 中的默认浏览器以便闪亮启动 Chrome 而不
如何仅删除单括号并保留配对的括号

你好我亲爱的老师 R 用户朋友们我最近开始认真学习正则表达式最近我遇到了一种情况我们只想保留配对括号并省略未配对的这是我的样本数据 structure list t1 c Book Pg 1 Website Online Jou
如何从 R keras 中的类似生成器的数据中评估（）和预测（）

我有以下代码数据集可以下载here https www dropbox com s qjt5o31oyqj10m8 data tar gz dl 0 or here https www kaggle com c dogs vs cats
R 中用于调用 sed、rsync、ssh 等的 system() 的替代方案：函数是否存在，我应该编写自己的函数，还是我错过了重点？

最近我发现了base files命令与其他命令一起使用例如getwd write lines file show dir等等似乎有许多 bash 函数的 R 等价物我还在 R 中编写了一些函数来简化对ssh and rsync通过
如何使用 SparkR 1.6.0 写入 JDBC 源？

使用 SparkR 1 6 0 我可以使用以下代码从 JDBC 源读取数据 jdbc url lt jdbc mysql localhost 3306 dashboard user
任意列中包含字符串的子集行

我有一个如下所示的数据集 Col1 Col2 Col3 abckel NA 7 jdmelw njabc NA 8 jdken jdne 如何对数据集进行子集化使其仅保留包含字符串 abc 的行最终预期输出 Col1 Col2 Col3
如何使用 tidymodels 和工作流集在同一数据集上拟合多个不同的线性模型

我想评估同一数据集上多个主要是线性回归模型的性能我想也许使用tidymodels包连同workflowsets workflow set 可能会起作用我按照这个例子here https workflowsets tidymodels
如何使用 dplyr 独立过滤每列的行

我有以下内容 library tidyverse df lt tibble tribble gene colB colC a 1 2 b 2 3 c 3 4 d 1 1 df gt A tibble 4 x 3 gt gene colB c

随机推荐

远程运行 Perl 脚本时使用 MsgBox 回显变量？

这可能吗我正在使用 VB net 执行远程 Perl 脚本我希望屏幕上出现一个 MsgBox 类似于 VBScript 我尝试只执行 Win32 MsgBox Test 但这不起作用有可能吗我正在从 Windows 系统远程执行脚本
计算两幅图像之间的模糊内核

与标准且更具挑战性去模糊和超分辨率场景不同我可以访问原始清晰图像G而且是模糊版本B 我只是在寻找模糊内核h 所以因为B使用真实相机拍摄关系为 B G h N 在哪里表示卷积和N是一些附加噪声自然这是一个过度约束的问题因为
正则表达式仅匹配不在括号或方括号中的逗号

我想用不在括号或方括号中的逗号分隔字符串我正在使用以下字符串土豆植物油向日葵油玉米油和或菜籽油蜂蜜烧烤调味料糖盐葡萄糖圆酵母洋葱粉香料麦芽糊精果糖酵母提取物糖蜜天然香料含牛奶玉米淀粉蜂蜜阿拉伯胶
直接用户输入的动态 LINQ 有什么危险吗？

我在 ASP NET MVC 应用程序中有一个表我希望可以使用 AJAX 对其进行排序服务器端和过滤我希望它在其他地方相当容易使用并且不想将排序和过滤硬编码到查询表达式中因此我寻找一种动态构建表达式的方法我发现最好的方法是使用
如何将 CSS 变换矩阵转换回其组件属性

我通过使用获得了元素的 CSS 变换矩阵getComputedStyle 方法如下 var style window getComputedStyle elem1 null var trans style transform 反式矩阵 1
使用 LINQ LAMBDA 获取每个部门的员工

我正在尝试使用 LINQ 连接两个表员工和部门并尝试获取下面给出的图像格式的结果有人可以帮助如何实现这一目标吗如何实现每个部门的员工这是我的代码 var EmpList from d in Department join e in
初始加载后取消选择列表框中的所有项目

我有一个列表框最初显示时选择了第一个项目我希望它显示时未选择任何项目这可能吗 ListBox ClearSelected or ListBox SelectedIndex 1 当然它们是成员方法
导航栏下方的空白区域

When self navigationController navigationBar translucent NO 导航栏下方出现空白如下所示我怎样才能删除它 From above example void loadUI self
找不到模块 ember-validations

尝试使用 ember cli 的 ember validations 插件遇到这个问题我不知道缺少什么这是我的 package json 中的依赖项部分 devDependencies broccoli asset rev 2 0 0
未找到 Xamarin 方法“CGSize..ctor”

我刚刚更新了 xamarin studio 然后更新了我的 iOS 项目中的 xamarin forms 包一切都构建得很好但是当我尝试在模拟器中运行该应用程序时出现以下错误未找到方法 CGSize ctor 我创建了一个新的解决方
Laravel Blade 表单关闭问题

我在 Laravel 中有一个这样的表单 div class modal body Form model questionGroup route gt question groups update questionGroup gt id m
如何使用 uniqueId() jquery ui

似乎 jquery ui 已加载因为当我运行时 function did the UI load console log ui version JS控制台返回1 10 3 我正在使用宝石https github com joliss jq
Pandas 将 groupby 总和值分配给原始表中的最后一行

例如我有一张桌子 A id price sum 1 2 0 1 6 0 1 4 0 2 2 0 2 10 0 2 1 0 2 5 0 3 1 0 3 5 0 我想要的就像最后一行sum应该是price一个团体的 id price sum
Asp.net 会员资格 - 帐户被锁定

我们正在使用 ASP net 附带的标准 ASP net 会员功能我们的会员数据库中的某些帐户将锁定标志设置为 true 这种情况何时如何发生在可配置的时间长度 passwordAttemptWindow 默认 10 分钟内登录
JQuery FullCalendar 从 ajax 成功调用 rerenderEvents 时出现问题

由于某种原因我无法在 POST 后重新呈现日历到那时一切都很顺利 calendar fullCalendar select function startDate endDate ajax url data php type POST d
使用 Skip/Take 进行分页时 LINQ 查询性能极差

我需要使用 LINQ 从 DB2 数据库查询记录我有从数据库架构生成的实体并尝试使用 Skip 和 Take 执行 LINQ 查询基础表大约有 25 列可能有 100 万条记录当我在没有 Skip 的情况下执行查询时大约需要 0
反应式表单提交后显示错误消息

在 Angular 8 Reactive 表单上我有以下内容
phonegap 3.5.0 中缺少 Cordova jar

在我使用phonegap 2 7 0之前因此对于phonegap更新我使用node js安装了phonegap版本3 5 0 但在phonegap文件夹中没有cordova jar文件如果我在 ADT 中创建一个项目如何添加 co
VS2008 C++ 优化器有时会生成较慢的代码吗？

继从上一个问题 https stackoverflow com questions 5165877 whole program optimization failing in vc2008 我一直在我的发布版本中尝试优化器设置以了解使用编
检测简单数值向量中的一个或多个拐点

All 我正在寻找一种可靠的无监督的方法来检测相对较短的向量中的变化点考虑以下两个示例 v1 c 0 299584 0 314446 0 357783 0 388896 0 410417 0 427182 0 450383 0 4666

检测简单数值向量中的一个或多个拐点

检测简单数值向量中的一个或多个拐点 的相关文章

随机推荐

热门标签

检测简单数值向量中的一个或多个拐点的相关文章