使用 Scipy 与 Matlab 拟合对数正态分布

2023-12-13

我正在尝试使用 Scipy 拟合对数正态分布。我之前已经使用 Matlab 完成了此操作，但由于需要将应用程序扩展到统计分析之外，我正在尝试在 Scipy 中重现拟合值。

下面是我用来拟合数据的 Matlab 代码：

% Read input data (one value per line)
x = [];
fid = fopen(file_path, 'r'); % reading is default action for fopen
disp('Reading network degree data...');
if fid == -1
    disp('[ERROR] Unable to open data file.')
else
    while ~feof(fid)
        [x] = [x fscanf(fid, '%f', [1])];

    end
    c = fclose(fid);
    if c == 0
         disp('File closed successfully.');
    else
        disp('[ERROR] There was a problem with closing the file.');
    end
end

[f,xx] = ecdf(x);
y = 1-f;

parmhat  = lognfit(x); % MLE estimate
mu = parmhat(1);
sigma = parmhat(2);

这是拟合的图：

enter image description here

现在这是我的 Python 代码，目的是实现相同的目标：

import math
from scipy import stats
from statsmodels.distributions.empirical_distribution import ECDF 

# The same input is read as a list in Python
ecdf_func = ECDF(degrees)
x = ecdf_func.x
ccdf = 1-ecdf_func.y

# Fit data
shape, loc, scale = stats.lognorm.fit(degrees, floc=0)

# Parameters
sigma = shape # standard deviation
mu = math.log(scale) # meanlog of the distribution

fit_ccdf = stats.lognorm.sf(x, [sigma], floc=1, scale=scale)

这是使用 Python 代码的拟合。

enter image description here

正如您所看到的，两组代码都能够产生良好的拟合，至少从视觉上来说是这样。

问题是估计参数 mu 和 sigma 存在巨大差异。

来自 Matlab：mu = 1.62 sigma = 1.29。来自 Python：mu = 2.78 sigma = 1.74。

为什么会有这样的差异呢？

注意：我已经仔细检查了两组数据是否符合exactly相同。点数相同，分布相同。

非常感谢您的帮助！提前致谢。

其他信息：

import scipy
import numpy
import statsmodels

scipy.__version__
'0.9.0'

numpy.__version__
'1.6.1'

statsmodels.__version__
'0.5.0.dev-1bbd4ca'

Matlab的版本是R2011b。

Edition:

正如下面的答案所示，问题出在 Scipy 0.9 上。我能够使用 Scipy 11.0 从 Matlab 重现 mu 和 sigma 结果。

更新 Scipy 的一个简单方法是：

pip install --upgrade Scipy

如果你没有 pip（你应该！）：

sudo apt-get install pip

有一个错误fitscipy 0.9.0 中的方法已在更高版本的 scipy 中修复。

下面脚本的输出应该是：

Explicit formula:   mu = 4.99203450, sig = 0.81691086
Fit log(x) to norm: mu = 4.99203450, sig = 0.81691086
Fit x to lognorm:   mu = 4.99203468, sig = 0.81691081

但对于 scipy 0.9.0，它是

Explicit formula:   mu = 4.99203450, sig = 0.81691086
Fit log(x) to norm: mu = 4.99203450, sig = 0.81691086
Fit x to lognorm:   mu = 4.23197270, sig = 1.11581240

以下测试脚本显示了获得相同结果的三种方法：

import numpy as np
from scipy import stats


def lognfit(x, ddof=0):
    x = np.asarray(x)
    logx = np.log(x)
    mu = logx.mean()
    sig = logx.std(ddof=ddof)
    return mu, sig


# A simple data set for easy reproducibility
x = np.array([50., 50, 100, 200, 200, 300, 500])

# Explicit formula
my_mu, my_sig = lognfit(x)

# Fit a normal distribution to log(x)
norm_mu, norm_sig = stats.norm.fit(np.log(x))

# Fit the lognormal distribution
lognorm_sig, _, lognorm_expmu = stats.lognorm.fit(x, floc=0)

print "Explicit formula:   mu = %10.8f, sig = %10.8f" % (my_mu, my_sig)
print "Fit log(x) to norm: mu = %10.8f, sig = %10.8f" % (norm_mu, norm_sig)
print "Fit x to lognorm:   mu = %10.8f, sig = %10.8f" % (np.log(lognorm_expmu), lognorm_sig)

随着选项ddof=1在标准。开发人员。使用无偏方差估计的计算：

In [104]: x
Out[104]: array([  50.,   50.,  100.,  200.,  200.,  300.,  500.])

In [105]: lognfit(x, ddof=1)
Out[105]: (4.9920345004312647, 0.88236457185021866)

matlab里有注释lognfit 文档这就是说，当不使用审查时，lognfit 使用方差无偏估计量的平方根来计算 sigma。这对应于上面代码中使用 ddof=1 。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

MATLAB

statistics

scipy

curvefitting

使用 Scipy 与 Matlab 拟合对数正态分布的相关文章

Matlab 的 imresize 函数中用于插值的算法是什么？

我正在使用 Matlab Octaveimresize 对给定的二维数组重新采样的函数我想了解如何使用特定的插值算法imresize works 我在Windows上使用八度 e g A 1 2 3 4 是一个二维数组然后我使用命令 b
在 python 程序中合并第三方库的最佳实践是什么？

下午好我正在为我的工作编写一个中小型Python程序该任务需要我使用 Excel 库xlwt and xlrd 以及一个用于查询 Oracle 数据库的库称为CX Oracle 我正在通过版本控制系统即CVS 开发该项目我想知道围
SQLAlchemy 通过关联对象声明式多对多自连接

我有一个用户表和一个朋友表它将用户映射到其他用户因为每个用户可以有很多朋友这个关系显然是对称的如果用户A是用户B的朋友那么用户B也是用户A的朋友我只存储这个关系一次除了两个用户 ID 之外 Friends 表还有其他字段因此
为 Anaconda Python 安装 psycopg2

我有 Anaconda Python 3 4 但是每当我运行旧代码时我都会通过输入 source activate python2 切换到 Anaconda Python 2 7 我的问题是我为 Anaconda Python 3 4 安
Python（Selenium）：如何通过登录重定向/组织登录登录网站

我不是专业程序员所以请原谅任何愚蠢的错误我正在做一些研究我正在尝试使用 Selenium 登录数据库来搜索大约 1000 个术语我有两个问题 1 重定向到组织登录页面后如何使用 Selenium 登录 2 如何检索数据库在我解决
通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
Python - StatsModels、OLS 置信区间

在 Statsmodels 中我可以使用以下方法拟合我的模型 import statsmodels api as sm X np array 22000 13400 47600 7400 12000 32000 28000 31000 6
Flask 会话变量

我正在用 Flask 编写一个小型网络应用程序当两个用户在同一网络下尝试使用应用程序时我遇到会话变量问题这是代码 import os from flask import Flask request render template
从字符串中删除识别的日期

作为输入我有几个包含不同格式日期的字符串例如彼得在16 45 我的生日是1990年7月8日 On 7 月 11 日星期六我会回家 I use dateutil parser parse识别字符串中的日期在下一步中我想从字符串中删除
python 相当于 R 中的 get() （= 使用字符串检索符号的值）

在 R 中 get s 函数检索名称存储在字符变量向量中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数尽管花了一些时间翻
根据列值突出显示数据框中的行？

假设我有这样的数据框 col1 col2 col3 col4 0 A A 1 pass 2 1 A A 2 pass 4 2 A A 1 fail 4 3 A A 1 fail 5 4 A A 1 pass 3 5 A A 2 fail 2
是否可以忽略一行的pyright检查？

我需要忽略一行的pyright 检查有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
如何加速Python中的N维区间树？

考虑以下问题给定一组n间隔和一组m浮点数对于每个浮点数确定包含该浮点数的区间子集这个问题已经通过构建一个解决区间树 https en wikipedia org wiki Interval tree 或称为范围树或线段树已经针对一
如何使用Python创建历史时间线

So I ve seen a few answers on here that helped a bit but my dataset is larger than the ones that have been answered prev
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
将图像分割成多个网格

我使用下面的代码将图像分割成网格的 20 个相等的部分 import cv2 im cv2 imread apple jpg im cv2 resize im 1000 500 imgwidth im shape 0 imgheight i
类型错误：预期单个张量时的张量列表 - 将 const 与 tf.random_normal 一起使用时

我有以下 TensorFlow 代码 tf constant tf random normal time step batch size 1 1 我正进入状态TypeError List of Tensors when single Te
检测数据集中线性行为的算法

我已经发布了一个关于对数据集的一部分进行多项式拟合的算法 https stackoverflow com q 17595932 2320757前一段时间收到一些建议去做我想做的事但我现在面临另一个问题我尝试应用答案中建议的想法我的目标
使用 Python 的 matplotlib 选择在屏幕上显示哪些图形以及将哪些图形保存到文件中

我想用Python创建不同的图形matplotlib pyplot 然后我想将其中一些保存到文件中而另一些则应使用show 命令然而 show 显示all创建的数字我可以通过调用来避免这种情况close 创建我不想在屏幕上显示的绘图
如何使用 Pycharm 安装 tkinter？ [复制]

这个问题在这里已经有答案了 I used sudo apt get install python3 6 tk而且效果很好如果我在终端中打开 python Tkinter 就可以工作但我无法将其安装在我的 Pycharm 项目上 pip

随机推荐

在 PHP 中显示关联数组

我正在尝试构建一个函数该函数从数据库中提取信息并将其插入到 PHP 中的关联数组中mysql fetch assoc 并返回数组以便另一个函数可以显示它我需要一种方法来显示返回的关联数组这应该是与第一个不同的函数 print r a
Fortran 到 C 库的链接器错误 - /usr/lib/libf2c.so：对“MAIN__”的未定义引用

所以我在使用 fortran 到 C 库时遇到了一些麻烦现在在讨论这个问题之前我可以告诉你我不能像某些论坛网站所建议的那样使用 g2c 现在解决问题当我尝试编译一个非常大的项目时我得到以下信息 from the makefil
在 Python 中读取 .mat 文件

是否可以在 Python 中读取二进制 MATLAB mat 文件我看到 SciPy 声称支持读取 mat 文件但我没有成功我安装了SciPy版本0 7 0 但找不到loadmat method 需要进口 import scipy i
如何将 xml 文件的“自定义工具”属性设置为 T4 文件？

我们知道 asp net resx 文件有一个自定义工具用于生成一些 C 代码 ResX文件代码生成器我有一个 xml 文件我想将其自定义工具属性设置为T4 file 如何将 T4 文件绑定到 xml 文件你可以这样做T4工具箱在
如何在ios中从Facebook SDK 4.0获取用户名

如何获得username来自 iOS 中的 facebook sdk 4 0 IBAction LoginWithFacebook id sender if FBSDKAccessToken currentAccessToken self
C++ 中的编译器版本、名称和操作系统检测

我需要使用 C 检测操作系统名称编译器名称和编译器版本因为我需要更改每种情况的设置我怎样才能做到这一点对于大多数编译器您可以找到预定义宏的列表 VS http msdn microsoft com en us library b0
在 Windows 上使用 Cygwin64 编译器和调试器为 C 设置 VS Code（错误：无法启动调试）

我正在尝试将 VSCODE 设置为debugWindows 上使用 Cygwin64 的 C 程序我使用了 stephw建议的配置在 Windows 上使用 Cygwin64 编译器和调试器为 C 设置 VS Code 但它对我不起作用
将 dplyr 查询保存到 dbplyr 中的不同架构

我有一个 JDBC 连接想要从一个模式查询数据并保存到另一个模式 library tidyverse library dbplyr library rJava library RJDBC access the temp table in
Plotly R：根据折线图中的不同线条更改悬停信息字体颜色

我想更改一些折线图线的悬停信息字体颜色但不是全部这是一些与我的代码类似的代码 number lt rep c 00 01 02 each 4 animal lt rep c cat dog mouse each 4 year lt re
按钮上的长文本会弄乱 GridLayout 行

我有一个 GridLayout 用于承载多个按钮按两列排序所有按钮都有固定的高度和宽度如果其中一个按钮包含太多文本布局就会混乱我希望布局能够正确维护行无论按钮是否有太多文本我将在稍后处理显示太多文本的情况使用文本的自动大小
T/F：在过程中使用 IF 语句会产生多个计划

在回应this问题 KM 说如果您使用的是 SQL Server 2005 或更高版本则可以使用 IF 在同一过程中进行多个查询并且每个查询都会为其保存一个查询计划相当于旧版本上的每个查询的过程请参阅我的答案中的文章或此链接到正确
如何在查询字符串中安全地包含密码

是否可以在 C asp net 站点的查询字符串中安全地包含密码我所知道的一些假设和事情该网站没有也不会有与其他网站的链接图像 javascript 分析因此无需担心引用链接与 Web 浏览器的所有通信都将通过 https 进行
如何在Python中动态添加If Else语句？

目前我开发了一个脚本该脚本将读取传入最新的电子邮件并根据某些条件例如电子邮件主题和文本过滤电子邮件当用户选择subject or text 他们可以选择要过滤电子邮件的条件等于不包含等我的问题我有一个演示网站可以让用户添
如何阻止 X Window 接收用户输入？

我想在 Linux 桌面上创建一些窗口以用于简单的布局我需要避免用户输入到这些窗口并且我认为避免窗口获得焦点就足以实现这种情况我认为我可以用xprop命令通过设置WM HINTS属性但我还没有找到有关如何执行此操作的具体文档顺便
Passport.js - 使用 Passport-local 对来自 MongoDB 的用户进行身份验证

我的 MongoDB 中有一个简单的用户集合我使用 mongo native 驱动程序 email email protected password 123456 id oid 50658c835b821298d3000001 当我通过电
将参数传递给 main

我知道这是相当基本的但我仍然被困住所以我有一个需要接受变量 n 的函数所以这是我的主要函数 int main int argc char argv sort argv 1 我这样调用该程序 sort 4
Typescript 枚举作为指定对象中的键预期会出现错误，但没有

在使用枚举作为对象键时我遇到了 TS 的一些奇怪行为我期望 TS 错误但事实并非如此我不明白为什么 enum List sm sm md md export interface Dictionary
mpatches.FancyArrowPatch 太短

我想用mpatches FancyArrowPatch绘制许多路径单个图中数百条我以前用过plt arrow 但它使绘图窗口变慢并且比补丁方法花费更长的时间无论如何当我开始使用时mpatches Arrow我在大尺度上得到了很好的
错误：.net 中的 db.SaveChanges() 发生引用完整性约束违规？

我创建了一个 WPF 应用程序Entity framework 4 0 当我尝试插入记录时PhoneNumber表成功插入第一条记录但是当我循环遍历某个列表并尝试将另一个项目插入到PhoneNumber表插入记录但显示错误为 Inval
使用 Scipy 与 Matlab 拟合对数正态分布

我正在尝试使用 Scipy 拟合对数正态分布我之前已经使用 Matlab 完成了此操作但由于需要将应用程序扩展到统计分析之外我正在尝试在 Scipy 中重现拟合值下面是我用来拟合数据的 Matlab 代码 Read input da

使用 Scipy 与 Matlab 拟合对数正态分布

使用 Scipy 与 Matlab 拟合对数正态分布 的相关文章

随机推荐

热门标签

使用 Scipy 与 Matlab 拟合对数正态分布的相关文章