稳定地找到曲线的肘点？

2024-03-17

我知道存在this https://stackoverflow.com/questions/4033821/using-a-smoother-with-the-l-method-to-determine-the-number-of-k-means-clusters, and this https://stackoverflow.com/questions/2018178/finding-the-best-trade-off-point-on-a-curve关于这个话题。不过，这次我想最终确定Python 中的实际实现。

我唯一的问题是肘点似乎随着代码的不同实例而变化。观察这篇文章中显示的两个图。虽然它们在视觉上看起来相似，但肘点的值发生了显着变化。两条曲线均由 20 次不同运行的平均值生成。即使这样，肘点的值也发生了显着的变化。我可以采取哪些预防措施来确保该值落在某个范围内？

我的尝试如下所示：

def elbowPoint(points):
  secondDerivative = collections.defaultdict(lambda:0)
  for i in range(1, len(points) - 1):
    secondDerivative[i] = points[i+1] + points[i-1] - 2*points[i]

  max_index = secondDerivative.values().index(max(secondDerivative.values()))
  elbow_point = max_index + 1
  return elbow_point

points = [0.80881476685027154, 0.79457906121371058, 0.78071124401504677, 0.77110686192601441, 0.76062373158581287, 0.75174963969985187, 0.74356408965979193, 0.73577573557299236, 0.72782434749305047, 0.71952590556748364, 0.71417942487824781, 0.7076502559300516, 0.70089375208028415, 0.69393584640497064, 0.68550490458450741, 0.68494440529025913, 0.67920157634796108, 0.67280267176628761]
max_point = elbowPoint(points)

听起来您真正关心的是如何平滑数据，因为它包含噪声？在这种情况下，也许您应该首先将曲线拟合到数据，然后找到拟合曲线的肘部？

这是否有效取决于噪声源，以及噪声对您的应用是否重要？顺便说一句，您可能想通过查看当从拟合中省略一个点时它如何变化（或希望不变化）来了解您的拟合对数据的敏感度（显然，使用足够高的多项式，您总是会得到一个很好的拟合）到一组特定的数据，但您可能对一般情况感兴趣）

我不知道这种方法是否可以接受，但直觉上我认为对小错误的敏感性不好。最终，通过拟合曲线，您可以说在理想情况下，基本过程是由曲线建模的，任何与曲线的偏差都是错误/噪声

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

稳定地找到曲线的肘点？的相关文章

通过 Scrapy 抓取 Google Analytics

我一直在尝试使用 Scrapy 从 Google Analytics 获取一些数据尽管我是一个完全的 Python 新手但我已经取得了一些进展我现在可以通过 Scrapy 登录 Google Analytics 但我需要发出 AJAX
Python 的键盘中断不会中止 Rust 函数 (PyO3)

我有一个使用 PyO3 用 Rust 编写的 Python 库它涉及一些昂贵的计算单个函数调用最多需要 10 分钟从 Python 调用时如何中止执行 Ctrl C 好像只有执行结束后才会处理所以本质上没什么用最小可重现示例 Ca
SQLAlchemy 通过关联对象声明式多对多自连接

我有一个用户表和一个朋友表它将用户映射到其他用户因为每个用户可以有很多朋友这个关系显然是对称的如果用户A是用户B的朋友那么用户B也是用户A的朋友我只存储这个关系一次除了两个用户 ID 之外 Friends 表还有其他字段因此
将 saxon 与 python 结合使用

我需要使用 python 处理 XSLT 目前我正在使用仅支持 XSLT 1 的 lxml 现在我需要处理 XSLT 2 有没有办法将 saxon XSLT 处理器与 python 一起使用有两种可能的方法设置一个 HTTP 服务接受
Flask 会话变量

我正在用 Flask 编写一个小型网络应用程序当两个用户在同一网络下尝试使用应用程序时我遇到会话变量问题这是代码 import os from flask import Flask request render template
如何在 Python 中检索 for 循环中的剩余项目？

我有一个简单的 for 循环迭代项目列表在某些时候我知道它会破裂我该如何退回剩余的物品 for i in a b c d e f g try some func i except return remaining items if s
如何替换 pandas 数据框列中的重音符号

我有一个数据框dataSwiss其中包含瑞士城市的信息我想用普通字母替换带有重音符号的字母这就是我正在做的 dataSwiss Municipality dataSwiss Municipality str encode utf 8 d
测试 python Counter 是否包含在另一个 Counter 中

如何测试是否是pythonCounter https docs python org 2 library collections html collections Counter is 包含在另一个中使用以下定义柜台a包含在计数器中b当且
使用 Tkinter 显示 numpy 数组中的图像

我对 Python 缺乏经验第一次使用 Tkinter 制作一个 UI 显示我的数字分类程序与 mnist 数据集的结果当图像来自 numpy 数组而不是我的 PC 上的文件路径时我有一个关于在 Tkinter 中显示图像的问题我为
OpenCV 无法从 MacBook Pro iSight 捕获

几天后我无法再从 opencv 应用程序内部打开我的 iSight 相机 cap cv2 VideoCapture 0 返回并且cap isOpened 回报true 然而 cap grab 刚刚返回false 有任何想法吗示例代码
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
绘制方程

我正在尝试创建一个函数它将绘制我告诉它的任何公式 import numpy as np import matplotlib pyplot as plt def graph formula x range x np array x rang
BeautifulSoup 中的嵌套标签 - Python

我在网站和 stackoverflow 上查看了许多示例但找不到解决我的问题的通用解决方案我正在处理一个非常混乱的网站我想抓取一些数据标记看起来像这样 table tbody tr tr tr td td td table tr t
Pandas：merge_asof() 对多行求和/不重复

我正在处理两个数据集每个数据集具有不同的关联日期我想合并它们但因为日期不完全匹配我相信merge asof 是最好的方法然而有两件事发生merge asof 不理想的数字重复数字丢失以下代码是一个示例 df a pd Da
向 Altair 图表添加背景实心填充

I like Altair a lot for making graphs in Python As a tribute I wanted to regenerate the Economist graph s in Mistakes we
每个 X 具有多个 Y 值的 Python 散点图

我正在尝试使用 Python 创建一个散点图其中包含两个 X 类别 cat1 cat2 每个类别都有多个 Y 值如果每个 X 值的 Y 值的数量相同我可以使用以下代码使其工作 import numpy as np import mat
对年龄列进行分组/分类

我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
Conda SafetyError：文件大小不正确

使用创建 Conda 环境时conda create n env name python 3 6 我收到以下警告 Preparing transaction done Verifying transaction SafetyError Th
使用 Python 绘制 2D 核密度估计

I would like to plot a 2D kernel density estimation I find the seaborn package very useful here However after searching
Statsmodels.formula.api OLS不显示截距的统计值

我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

oledb/ado.net：获取命令的文本，并替换所有参数

是否可以获取文本OleDbCommand所有参数都替换为它们的值例如在下面的代码中我正在寻找一种获取查询文本的方法 SELECT FROM my table WHERE c1 hello and c2 world 当我完成参数分配后 v
WooCommerce 在可变价格后显示变量描述

我正在尝试将变量描述显示到 woocommerce 产品页面中我安装了一个名为 woocommerce 单选按钮的插件用于将我的可变产品和价格显示为单选按钮而不是选择我正在这个插件中编辑variable php文件然后完成后我会将其
PHP - 从 MySQL 数据创建嵌套数组

我有一些数据存储在表中如下所示 id parent id name 1 0 Entry 1 2 0 Entry 2 3 0 Entry 3 4 1 Child of entry 1 我想将它变成一个嵌套数组如下所示 array arra
_ctypes.cpython-39-x86_64-linux-gnu.so：未定义符号：使用 dlopen 加载的嵌入式 Python 中的 PyFloat_Type

我在 ubuntu 20 04 中使用嵌入式 Python 3 9 并尝试导入 ctypes 这会产生错误 ctypes cpython 39 x86 64 linux gnu so undefined symbol PyFloat Typ
org.hibernate.hql.internal.ast.QuerySyntaxException：意外标记：* 靠近第 1 行

我必须登录我的网站
从 QT 应用程序打开 Android 设置(com.android.settings)

我在 QT 中有一个 Android 应用程序我想通过按钮调用 android 设置我在 Java 中使用了这段代码 public void usb View v Intent intent new Intent intent setC
YouTube IFrame API 并不总是加载？

我见过很多类似的问题但我相信这是不同的当我尝试定义onYouTubeIframeAPIReady在全局范围内该函数仅在加载页面的一半时间被调用如果我不断刷新有时我会看到控制台消息有时则不存在让我感到困惑的是这种情况只偶尔发生
从 Tridion Broker Service (2009 SP1) 加载 CustomMeta 时出现异常

我正在尝试从发布到 Tridion Broker 的组件加载一些自定义元这是 2009 SP1 我可以通过如下查询查看 Custom Meta 表中的组件 SELECT FROM Tridion Broker dbo CUSTOM MET
将 CSV 从 Azure Data Lake（第 2 代）加载到 Azure SQL 数据库

我有一个包含多个容器的 Azure Data Lake Storage 第 2 代帐户我想导入salesorderdetail csv文件从 Sales 容器复制到 Azure SQL 数据库中我已经使用 Azure 数据工厂成功构建
Android意图序列化

我正在尝试实现一个应用程序来序列化android意图并通过套接字从客户端发送到服务器并在服务器上反序列化它我尝试使用常规java序列化API在客户端序列化意图但在运行时它说意图不可序列化是否有任何解决方案可以序列化意图并反序列化它只是
是否存在一种可以抵抗图像操纵的数字图像隐写算法？

我想知道是否有一种针对数字图像的隐写解决方案可以抵抗图像操作我所说的操作是指最标准的操作重新压缩 JPEG 甚至完全更改文件格式裁剪和缩放这种方法的应用自然是为了图像版权的保护我完全理解图像被操纵的越多隐写水印完好无损的
为什么仅对已处理的异常保证堆栈展开？

C standard http www open std org jtc1 sc22 wg21 docs papers 2017 n4659 pdf says except handle 9 如果没有找到匹配的处理程序则调用函数 std
关于 Julia 中的 ndarray 创建：在额外维度中堆叠

我想将以下 python 代码转换为 julia import numpy as np x np random random 4 5 6 y np array x x x 2 x 3 x 4 x print y shape gt 2 3 4
文本在 WPF 窗口和 ElementHost 内的呈现方式不同

我使用 WPF 互操作性在 WinForms 表单内托管 WPF 用户控件除了丑陋的文本渲染之外一切正常
.htaccess 中的 MIME 类型（带或不带前导点）

我在 Firefox 中播放 mp4 时遇到一些问题这并不奇怪大多数时候建议在我的 htaccess 文件中添加一些 MIME 类型就像是 AddType video mp4 mp4 m4v AddType audio mp4 m4
Java 记录堆栈的分配方式与 C# 结构类似吗？

Java 记录与 C 结构类似吗我的意思是如果它们是堆栈分配的而不是使用像类这样的引用那么它们是在堆上分配的不记录只是编写值类的一种更简单的方法但分配方式与普通对象没有任何不同这并不是说此类类型没有进行中它们正在进行中但
使用 .Net 列出 Google Drive V2 中的所有文件和文件夹

我正在使用 Google API Net 客户端库在 Net 中使用 Google Drive API 创建应用程序在该列表请求中从根文件夹以及子文件夹和共享文件中获取所有文件我不想把它们全部列出来我想要仅在根文件夹中可用的文件列表
与PrincipalSearcher FindAll 一起使用的PrincipalSearchResult，为什么T 必须是Principal 而不是UserPrincipal

我只是好奇 List
使用“WITH”子句的 SQL Server 查询出现奇怪的错误

以下查询 WITH CteProductLookup ProductId oid AS SELECT p ProductID p oid FROM dbo ME CatalogProducts p SELECT rel Name as Re
稳定地找到曲线的肘点？

我知道存在this https stackoverflow com questions 4033821 using a smoother with the l method to determine the number of k mean

稳定地找到曲线的肘点？

稳定地找到曲线的肘点？ 的相关文章

随机推荐

热门标签

稳定地找到曲线的肘点？的相关文章