离散数据拟合：负二项式、泊松分布、几何分布

2023-11-22

在 scipy 中，不支持使用数据拟合离散分布。我知道有很多关于这个的话题。

例如，如果我有一个如下所示的数组：

x = [2,3,4,5,6,7,0,1,1,0,1,8,10,9,1,1,1,0,0]

我无法申请这个数组：

from scipy.stats import nbinom
param = nbinom.fit(x)

但我想问您最新的情况，有没有什么方法可以拟合这三个离散分布，然后选择最适合离散数据集的方法？

您可以使用矩量法以适应任何特定的分布。

基本思想：得到经验一阶矩、二阶矩等，然后从这些矩导出分布参数。

因此，在所有这些情况下，我们只需要两个时刻。让我们得到它们：

import pandas as pd
# for other distributions, you'll need to implement PMF
from scipy.stats import nbinom, poisson, geom

x = pd.Series(x)
mean = x.mean()
var = x.var()
likelihoods = {}  # we'll use it later

注意：我使用 pandas 而不是 numpy。那是因为 numpy 的var() and std()不申请贝塞尔修正，而熊猫则这样做。如果您有 100 多个样本，应该不会有太大差异，但对于较小的样本，这可能很重要。

现在，让我们获取这些分布的参数。负二项式有两个参数：p，r。让我们估计它们并计算数据集的可能性：

# From the wikipedia page, we have:
# mean = pr / (1-p)
# var = pr / (1-p)**2
# without wiki, you could use MGF to get moments; too long to explain here
# Solving for p and r, we get:

p = 1 - mean / var  # TODO: check for zero variance and limit p by [0, 1]
r = (1-p) * mean / p

UPD:维基百科和 scipy 使用不同的 p 定义，一种将其视为成功的概率，另一种将其视为失败的概率。因此，为了与 scipy 概念保持一致，请使用：

p = mean / var
r = p * mean / (1-p)

UPD 结束

UPD2:

我建议改用@thilak 的代码日志可能性。它可以避免精度损失，这对于大样本尤其重要。

UPD2 结束

计算可能性：

likelihoods['nbinom'] = x.map(lambda val: nbinom.pmf(val, r, p)).prod()

同样适用于Poisson，只有一个参数：

# from Wikipedia,
# mean = variance = lambda. Nothing to solve here
lambda_ = mean
likelihoods['poisson'] = x.map(lambda val: poisson.pmf(val, lambda_)).prod()

同样适用于几何分布:

# mean = 1 / p  # this form fits the scipy definition
p = 1 / mean

likelihoods['geometric'] = x.map(lambda val: geom.pmf(val, p)).prod()

最后，让我们获得最佳拟合：

best_fit = max(likelihoods, key=lambda x: likelihoods[x])
print("Best fit:", best_fit)
print("Likelihood:", likelihoods[best_fit])

如果您有任何疑问，请告诉我

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

scipy

statistics

distribution

离散数据拟合：负二项式、泊松分布、几何分布的相关文章

使用 MongoDB 作为我们的主数据库，我应该使用单独的图数据库来实现实体之间的关系吗？

我们目前正在为一家专业公司内部实施类似 CRM 的解决方案由于存储信息的性质以及信息的不同值和键我们决定使用文档存储数据库因为它完全适合目的在本例中我们选择 MongoDB 作为此 CRM 解决方案的一部分我们希望存储实体之间的关
让 VoiceChannel.members 和 Guild.members 返回完整列表的问题

每当我尝试使用 VoiceChannel members 或 Guild members 时它都不会提供适用成员的完整列表我从文本命令的上下文中获取 VoiceChannel 和 Guild 如下所示 bot command name
在 Python 中将列表元素作为单独的项目返回

Stackoverflow 的朋友们大家好我有一个计算列表的函数我想单独返回列表的每个元素如下所示接收此返回的函数旨在处理未定义数量的参数 def foo my list 1 2 3 4 return 1 2 3 4 列表中的元素数
matplotlib 图中点的标签

所以这是一个关于已发布的解决方案的问题我试图在我拥有的 matplotlib 散点图中的点上放置一些数据标签我试图在这里模仿解决方案是否有与 MATLAB 的 datacursormode 等效的 matplotlib https s
多输出堆叠回归器

一次性问题我正在尝试构建一个多输入堆叠回归器添加到 sklearn 0 22 据我了解我必须结合StackingRegressor and MultiOutputRegressor 经过多次尝试这似乎是正确的顺序 import nu
Django Rest Framework 是否有第三方应用程序来自动生成 swagger.yaml 文件？

我有大量的 API 端点编写在django rest framework并且不断增加和更新如何创建和维护最新的 API 文档我当前的版本是 Create swagger yaml文件并以某种方式在每次端点更改时自动生成然后使用此文件作
嵌套列表的重叠会产生不必要的间隙

我有一个包含三个列表的嵌套这些列表由 for 循环填充并且填充由 if 条件控制第一次迭代后它可能类似于以下示例 a 1 2 0 0 0 0 0 0 4 5 0 0 0 0 0 0 6 7 根据条件它们不重叠在第二次迭代之后新
使用 Python Oauthlib 通过服务帐户验证 Google API

我不想使用适用于 Python 的 Google API 客户端库但仍想使用 Python 访问 Google APIOauthlib https github com idan oauthlib 创建服务帐户后谷歌开发者控制台 http
无法导入 langchain.agents.load_tools

我正在尝试使用 LangChain Agents 但无法导入 load tools 版本 langchain 0 0 27 我尝试过这些 from langchain agents import initialize agent from
通过Python连接到Bigquery：ProjectId和DatasetId必须非空

我编写了以下脚本来通过 SDK 将 Big Query 连接到 Python 如下所示 from google cloud import bigquery client bigquery Client project My First Pr
Django 视图中的“请求”是什么

在 Django 第一个应用程序的 Django 教程中我们有 from django http import HttpResponse def index request return HttpResponse Hello world
尽管我已在 python ctypes 中设置了信号处理程序，但并未调用它

我尝试过使用 sigaction 和 ctypes 设置信号处理程序我知道它可以与python中的信号模块一起使用但我想尝试学习当我向该进程发送 SIGTERM 时但它没有调用我设置的处理程序只打印终止为什么它不调用处理程序
如何将 ascii 值列表转换为 python 中的字符串？

我在 Python 程序中有一个列表其中包含一系列数字这些数字本身就是 ASCII 值如何将其转换为可以在屏幕上回显的常规字符串您可能正在寻找 chr gt gt gt L 104 101 108 108 111 44 32 1
Python GTK+ 画布

我目前正在通过 PyGobject 学习 GTK 需要画布之类的东西我已经搜索了文档发现两个小部件似乎可以完成这项工作 GtkDrawingArea 和 GtkLayout 我需要一些基本函数如 fillrect 或 drawline
Protobuf 如何编码 oneof 消息结构

对于这个 python 程序在编码时运行 protobuf 编码会给出以下输出 0a 10 08 7f8a 0104 08 02 10 0392 0104 08 02 10 03 18 01 我不明白的是为什么8a后面有一个01 为什么9
Spider 必须返回 Request、BaseItem、dict 或 None，已“设置”

我正在尝试从以下位置下载所有产品的图像我的蜘蛛看起来像 from shopclues items import ImgData import scrapy class multipleImages scrapy Spider name m
python 中的“槽包装器”是什么？

object dict 和其他地方的隐藏方法设置为这样的
pandas.read_csv 将列名移动一倍

我正在使用位于的 ALL zip 文件here http www fec gov disclosurep PDownload do 我的目标是用它创建一个 pandas DataFrame 但是如果我跑 data pd read csv
pytest找不到模块[重复]

这个问题在这里已经有答案了我正在关注pytest 良好实践 https docs pytest org en latest explanation goodpractices html test discovery或者至少我认为我是但是
如何将Python3设置为Mac上的默认Python版本？

有没有办法将 Python 3 8 3 设置为 macOS Catalina 版本 10 15 2 上的默认 Python 版本我已经完成的步骤看看它安装在哪里 ls l usr local bin python 我得到的输出是这样的

随机推荐

如何在 selenium-webdriver 中获取窗口标题、id 和名称？

我正在尝试实施以下方法硒网络驱动程序 ruby 获取所有窗口 ID 获取所有窗口标题获取所有窗口名称我运行 Selenium IDE 并将脚本导出到 Ruby Test Unit 将其另存为 rb 使用 Aptana Studio 3
为什么 Delphi 说“无法解析单位名称 xxx”？

我正在使用 Delphi2010 Enterprise Update 4 当我在 IDE 中打开项目并显示主窗体代码时有2个单位名称用红色下划线表示 xxx http img268 imageshack us img268 6475 un
如何将宽度设置为 50%

我有一个水平方向的 LinearLayout 和 2 个 ImageView 我想让 ImagesView 填充屏幕宽度的 50 以便在不同尺寸的每部手机或平板电脑上工作像这样的东西 50 50 迄今为止最好的
从析构函数中调用虚函数

这样安全吗 class Derived public PublicBase private PrivateBase Derived FunctionCall virtual void FunctionCall PrivateBase Fun
C# 问题：如何将 DataGridView 中所做的更改保存回所使用的 DataTable？

我从 DataSet 获取 DataTable 然后将该 DataTable 绑定到 DataGridView 一旦用户编辑了 DataGridView 上的信息我如何获取这些更改并将它们放回到使用过的 DataTable 中然后我可以
为什么 SonarQube 重新打开标记为误报的问题？

我们的组织刚刚开始使用 SonarQube 我们看到了一些对我们来说似乎很奇怪的东西我们有一个插件允许用户将问题标记为误报但我们标记为误报的任何问题都会在下次 SonarQube 运行时将其状态重置为打开对于标记为无法修复
使用 Python 以编程方式检测 Windows XP 上的系统代理设置

我开发了一家跨国公司使用的关键应用程序全球各地办公室的用户都需要能够安装此应用程序该应用程序实际上是 Excel 的一个插件我们有一个基于 Setuptools 的 easy install 的自动安装程序可确保用户每次打开 Exc
将导航控制器与选项卡栏控制器相结合

正如我在标题中提到的我想添加Navigation Controller到我的应用程序已经有一个Tab Controller 所以尝试给员工做一些类似的事情page 无论如何有些事情是错误的 UINavigationController正
将块内的变量分配给块外的变量

我收到错误变量不可分配缺少 block 类型说明符在线上aPerson participant 我怎样才能确保该块可以访问aPerson变量和aPerson变量可以返回吗 Person aPerson nil participants
.NET 4.0 和 .NET 4.7.2 标头选择之间 DataGridView 的重大变化

我最近迁移了一个项目 NET 4 to NET 4 7 2其中引入了 WinForms DataGridView 标头的更改 Pre Migration looks like this As you can see the Header o
在 Spring MVC 中将文件路径作为 @PathVariable 发送

有一个任务将文件路径传递为 PathVariable在 Spring MVC 到 REST 服务中GET要求我们可以轻松地做到这一点POST发送 JSON 格式的文件路径字符串我们可以怎样做GET请求和 Controller像这样 Re
iOS应用审核流程：应用需要外部硬件（通过WiFi连接）

我们为客户编写了一个应用程序通过 Wifi 连接到外部硬件由我们客户设计的硬件我的问题是我们如何提交此供审核没有硬件软件就起不到多大作用需要明确的是该硬件并不通过电缆直接连接到 iPad 而是仅通过 WiFi 连接我只是想
解析logstash列表中的json

我有一个 json 形式的 foo bar 我正在尝试使用logstash 中的json 过滤器来过滤它但这似乎不起作用我发现我无法使用logstash中的json过滤器解析列表json 有人可以告诉我这个问题的任何解决方法吗 UPDA
带 bootstrap 的水平按钮切换

我试图获得一个按钮来水平展开折叠其他元素共享按钮并使用引导框架内联我在两件事上失败了该按钮不会展开内联和实际按钮之后的其他元素当它向后折叠时其中的元素会打破行并堆叠在一起我准备了一把小提琴 http jsfiddle ne
SSRS 的性能问题[关闭]

很难说出这里问的是什么这个问题模棱两可含糊不清不完整过于宽泛或言辞激烈无法以目前的形式合理回答如需帮助澄清此问题以便重新打开访问帮助中心大家好最近我加入了一家公司他们给我分配的一项任务是提高现有 SSRS 报告的性能我
历史记录replaceState不再在Chrome中为本地文件工作

我正在使用 window history replaceState 更改使用 file C 访问的 HTML 文件的查询字符串这曾经适用于 Chrome Internet Explorer 和 FireFox 但不再适用于 Chrome
如何从 Java 漂亮地打印 XML？

我有一个包含 XML 的 Java 字符串没有换行或缩进我想将其转换为具有格式良好的 XML 的字符串我该怎么做呢 String unformattedXml
如何解决DTS_E_OLEDBERROR。在ssis中

在一个ssis包中由数据流任务组成包含 OLEDB 源和 OLDB 目标 provider 是 sql 本机客户端这曾经运行良好但现在出现错误如下所示请告诉我如何解决它将其更改为ado net 操作系统 windows 7 pr
使用 Python 读取文件并绘制 CDF

我需要读取带有时间戳以秒为单位的长文件并使用 numpy 或 scipy 绘制 CDF 绘图我确实尝试过使用 numpy 但似乎输出不是它应该的样子下面的代码任何建议表示赞赏 import numpy as np import
离散数据拟合：负二项式、泊松分布、几何分布

在 scipy 中不支持使用数据拟合离散分布我知道有很多关于这个的话题例如如果我有一个如下所示的数组 x 2 3 4 5 6 7 0 1 1 0 1 8 10 9 1 1 1 0 0 我无法申请这个数组 from scipy sta

离散数据拟合：负二项式、泊松分布、几何分布

离散数据拟合：负二项式、泊松分布、几何分布 的相关文章

随机推荐

热门标签

离散数据拟合：负二项式、泊松分布、几何分布的相关文章