解释 scipy.stats.entropy 值

2024-05-08

我正在尝试使用scipy.stats.熵来估计库尔巴克-莱布勒(KL) 两个分布之间的散度。更具体地说，我想使用 KL 作为衡量标准来确定两个分布的一致性。

但是，我无法解释 KL 值。例如：

t1=numpy.random.normal(-2.5,0.1,1000)

t2=numpy.random.normal(-2.5,0.1,1000)

scipy.stats.熵(t1,t2)

0.0015539217193737955

Then,

t1=numpy.random.normal(-2.5,0.1,1000)

t2=numpy.random.normal(2.5,0.1,1000)

scipy.stats.熵(t1,t2)

= 0.0015908295787942181

基本上没有重叠的完全不同的分布怎么可能有相同的KL值呢？

t1=numpy.random.normal(-2.5,0.1,1000)

t2=numpy.random.normal(25.,0.1,1000)

scipy.stats.熵(t1,t2)

= 0.00081111364805590595

这个给出了更小的 KL 值（即距离），我倾向于将其解释为“更一致”。

关于如何在这种情况下解释 scipy.stats.entropy （即 KL 散度距离）有什么见解吗？

numpy.random.normal(-2.5,0.1,1000) is a sample从正态分布。它只是按随机顺序排列的 1000 个数字。这文档 http://docs.scipy.org/doc/scipy-dev/reference/generated/scipy.stats.entropy.html for entropy says:

pk[i]是事件的（可能是非标准化的）概率i.

因此，为了获得有意义的结果，您需要“对齐”数字，以便相同的索引对应于分布中的相同位置。在你的例子中t1[0]与以下没有关系t2[0]。您的示例没有提供任何有关如何进行的直接信息probable每个值是 KL 散度所需的值；它只是为您提供一些从分布中获取的实际值。

获得对齐值的最直接方法是在某些固定值集上评估分布的概率密度函数。为此，您需要使用scipy.stats.norm（这会产生一个可以通过多种方式操作的分布对象）而不是np.random.normal（仅返回采样值）。这是一个例子：

t1 = stats.norm(-2.5, 0.1)
t2 = stats.norm(-2.5, 0.1)
t3 = stats.norm(-2.4, 0.1)
t4 = stats.norm(-2.3, 0.1)

# domain to evaluate PDF on
x = np.linspace(-5, 5, 100)

Then:

>>> stats.entropy(t1.pdf(x), t2.pdf(x))
-0.0
>>> stats.entropy(t1.pdf(x), t3.pdf(x))
0.49999995020647586
>>> stats.entropy(t1.pdf(x), t4.pdf(x))
1.999999900414918

您可以看到，随着分布进一步远离，它们的 KL 散度会增加。（事实上，使用你的第二个例子将会给出 KL 散度inf因为它们重叠得很少。）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

解释 scipy.stats.entropy 值的相关文章

使用 pythonbrew 编译 Python 3.2 和 2.7 时出现问题

我正在尝试使用构建多个版本的 python蟒蛇酿造 http pypi python org pypi pythonbrew 0 7 3 但我遇到了一些测试失败这是在运行的虚拟机上 Ubuntu 8 04 32 位当我使用时会发生这种情
在 python 程序中合并第三方库的最佳实践是什么？

下午好我正在为我的工作编写一个中小型Python程序该任务需要我使用 Excel 库xlwt and xlrd 以及一个用于查询 Oracle 数据库的库称为CX Oracle 我正在通过版本控制系统即CVS 开发该项目我想知道围
Django 管理员在模型编辑时间歇性返回 404

我们使用 Django Admin 来维护导出到我们的一些站点的一些数据有时当单击标准更改列表视图来获取模型编辑表单而不是路由到正确的页面时我们会得到 Django 404 页面模板它是偶尔发生的我们可以通过重新加载三次来重现它
将 saxon 与 python 结合使用

我需要使用 python 处理 XSLT 目前我正在使用仅支持 XSLT 1 的 lxml 现在我需要处理 XSLT 2 有没有办法将 saxon XSLT 处理器与 python 一起使用有两种可能的方法设置一个 HTTP 服务接受
Python - StatsModels、OLS 置信区间

在 Statsmodels 中我可以使用以下方法拟合我的模型 import statsmodels api as sm X np array 22000 13400 47600 7400 12000 32000 28000 31000 6
PyUSB 1.0：NotImplementedError：此平台不支持或未实现操作

我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位并从以下地址下载 z
根据列值突出显示数据框中的行？

假设我有这样的数据框 col1 col2 col3 col4 0 A A 1 pass 2 1 A A 2 pass 4 2 A A 1 fail 4 3 A A 1 fail 5 4 A A 1 pass 3 5 A A 2 fail 2
是否可以忽略一行的pyright检查？

我需要忽略一行的pyright 检查有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
基于代理的模拟：性能问题：Python vs NetLogo & Repast

我正在 Python 3 中复制一小段 Sugarscape 代理模拟模型我发现我的代码的性能比 NetLogo 慢约 3 倍这可能是我的代码的问题还是Python的固有限制显然这只是代码的一个片段但 Python 却花费了三分
绘制方程

我正在尝试创建一个函数它将绘制我告诉它的任何公式 import numpy as np import matplotlib pyplot as plt def graph formula x range x np array x rang
如何在Python中获取葡萄牙语字符？

我正在研究葡萄牙语角色看起来很奇怪我怎样才能解决这个问题代码 import feedparser import random Vou definir os feeds feeds conf feedurl http pplware s
BeautifulSoup 中的嵌套标签 - Python

我在网站和 stackoverflow 上查看了许多示例但找不到解决我的问题的通用解决方案我正在处理一个非常混乱的网站我想抓取一些数据标记看起来像这样 table tbody tr tr tr td td td table tr t
添加不同形状的 numpy 数组

我想添加两个不同形状的 numpy 数组但不进行广播而是将缺失值视为零可能最简单的例子是 1 2 3 2 gt 3 2 3 or 1 2 3 2 1 gt 3 2 3 1 0 0 我事先不知道形状我正在弄乱每个 np shape
使用 \r 并打印一些文本后如何清除控制台中的一行？

对于我当前的项目有一些代码很慢并且我无法使其更快为了获得一些关于已完成必须完成多少的反馈我创建了一个进度片段您可以在下面看到当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
每个 X 具有多个 Y 值的 Python 散点图

我正在尝试使用 Python 创建一个散点图其中包含两个 X 类别 cat1 cat2 每个类别都有多个 Y 值如果每个 X 值的 Y 值的数量相同我可以使用以下代码使其工作 import numpy as np import mat
对年龄列进行分组/分类

我有一个数据框说df有一个柱子 Ages gt gt gt df Age 0 22 1 38 2 26 3 35 4 35 5 1 6 54 我想对这个年龄段进行分组并创建一个像这样的新专栏 If age gt 0 age lt 2 the
为字典中的一个键附加多个值[重复]

这个问题在这里已经有答案了我是 python 新手我有每年的年份和值列表我想要做的是检查字典中是否已存在该年份如果存在则将该值附加到特定键的值列表中例如我有一个年份列表并且每年都有一个值 2010 2 2009 4 1989
有人用过 Dabo 做过中型项目吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我们正处于一个新的 ERP 风格的客户端服务器应用程序的开始阶段该应用程序是作为 Python 富客户端开发的我们目前正在评估 Dabo
NotImplementedError：无法将符号张量 (lstm_2/strided_slice:0) 转换为 numpy 数组。时间

张量流版本 2 3 1 numpy 版本 1 20 在代码下面 define model model Sequential model add LSTM 50 activation relu input shape n steps n fe
Statsmodels.formula.api OLS不显示截距的统计值

我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

如何确定地址是否在地图上的某些边界内？

我正在对此进行一些初步研究但我对这个主题知之甚少我需要创建一个解决方案可以获取一个地址然后确定该地址是否在某些预定义的边界内可能是一系列相连的街道有人对从哪里开始有一些建议吗首先您需要对地址进行地理编码 http code
加拿大人口普查地图分区 R

我对 R 和映射非常陌生我想创建某些数据的映射我有一组名为 D Montreal 的数据显示 2010 年前往蒙特利尔的加拿大人口普查部门游客来自哪个国家我想使用此数据创建一个地图以显示有多少人来自不同地区也许可以通过对根据人数
更改 Logger 实例的全局设置

我在用着java util logging Logger http download oracle com javase 1 4 2 docs api java util logging Logger html作为我的应用程序的日志引擎每
Android 布局崩溃

I use a XWalkView https crosswalk project org 加载网页和视频查看器 https github com Bilibili ijkplayer在我的应用程序中播放实时视频我希望 IjkVideoV
当存在外键但引用的行不存在时，是否可以避免NHibernate.ObjectNotFoundException？

我正在使用 NHibernate 从遗留数据库中提取一些数据并且我发现了几种存在外键的情况但引用的行已被删除当我制作 NHibernate 映射时使用 Fluent NHibernate 如下所示 References d gt d
如何使用 HTML5 和 Angularjs 正确显示日期 yyyy-MM-dd hh:mm:ss？

我正在尝试创建一个包含日期和时间的输入但我不知道如何做到这一点我尝试过输入datetime tr td Date td td td tr
ListView.SelecctedItems 显示 0 个选定项 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 好吧让我以更好的方式解释我的要求很
Java 统一编码

A Java char is 2 bytes http java sun com docs books tutorial java nutsandbolts datatypes html 最大大小为 65 536 但有95 221 http
Django 与 mod_wsgi 在 apache - 500 错误：Authtype 未设置？

尝试在 Dreamhost 上部署我的第一个 django 站点我的这个工作正常然后我不确定我做了什么让它停止工作这是错误消息 crit client 74 72 99 26 configuration error couldn t
Java中如何对整数除法进行四舍五入并得到int结果？ [复制]

这个问题在这里已经有答案了我刚刚写了一个小方法来计算手机短信的页数我没有选择使用Math ceil 老实说它看起来很丑陋这是我的代码 public class Main param args the command line arg
覆盖现有 CSS 表规则的最佳方法是什么？

我们正在使用 joomla 模板其中创建者在constant css 中定义了规则 table border collapse collapse border 0px width 100 当我需要我自己的带有自定义参数宽度边框等的表
对同一域发出 get 请求，出现 CORS 错误

在浏览器扩展中这是我的 ajax 调用 var xhr new XMLHttpRequest xhr open GET window location href true xhr responseType arraybuffer xhr
如何将整个流读入 std::string ？

我正在尝试将整个流多行读入字符串中我正在使用这段代码它有效但它冒犯了我的风格感当然有更简单的方法吗也许使用字符串流 void Obj loadFromStream std istream stream std string s
为什么Android和IOS11无法通过NFC通信

目前正在使用 React Native 并尝试使用反应本机 NFC ios https www npmjs com package react native nfc ios and 反应本机 NFC https github com Nov
使用变量名调用 Handlebars {{render}}

有没有办法将变量上下文传递给 render helper 例如我的模型具有多态关系我想为每种不同类型呈现适当的视图无需编写一整串if声明 my events模板看起来像这样 ul each event in model li even
Python docker 容器在完成运行应用程序后立即关闭，即使指定保留在 -d -t 中

我有一个 dockerfile FROM python 3 WORKDIR app ADD venv venv ADD data file1 csv gz data file1 csv gz ADD data file2 csv gz da
Serilog 滚动日志仅记录在一个文件中

有没有办法设置 Serilog 以在保持最大文件大小的同时继续登录同一文件换句话说如果我将最大文件大小指定为 100MB 则该进程应在添加新条目之前从文件中删除较早的条目 TL DR 号这File 或其RollingFile前身不
C 中经过的时间

include
消除 ffmpeg 和 image-magic 命令中的慢速因素

这些命令的基本思想是创建一个比较比较定义了过去的一张 jpeg 和现在的一张 jpeg 组合起来例如它们将相互滑动并显示前后图像 e g https media evercam io v1 cameras 1lowe scnoe com
解释 scipy.stats.entropy 值

我正在尝试使用scipy stats 熵来估计库尔巴克莱布勒 KL 两个分布之间的散度更具体地说我想使用 KL 作为衡量标准来确定两个分布的一致性但是我无法解释 KL 值例如 t1 numpy random normal 2 5

解释 scipy.stats.entropy 值

解释 scipy.stats.entropy 值 的相关文章

随机推荐

热门标签

解释 scipy.stats.entropy 值的相关文章