为什么 numpy.random.choice 不使用算术编码？

2023-11-29

如果我评估类似：

numpy.random.choice(2, size=100000, p=[0.01, 0.99])

使用一个均匀分布的随机数float, say r，并决定是否r < 0.01可能会浪费许多生成的随机位（熵）。我听说（二手）生成伪随机数的计算成本很高，所以我假设numpy不会这样做，而是会使用类似的方案算术编码在这种情况下。

然而，一开始glance看起来choice确实生成了float对于每个需要的样品。此外，快速timeit实验表明，生成n均匀浮动实际上比n样本来自p=[0.01, 0.99].

>>> timeit.timeit(lambda : numpy.random.choice(2, size=100000, p=[0.01, 0.99]), number=1000)
1.74494537999999
>>> timeit.timeit(lambda : numpy.random.random(size=100000), number=1000)
0.8165735180009506

Does choice真正生成一个float对于每个样本，它会出现什么？在某些情况下（特别是如果size很大并且p分布不均匀）？如果没有，为什么不呢？

从 NumPy 1.17 开始，原因很大程度上是向后兼容性。也可以看看这个问题 and 这个问题.

从 NumPy 1.17 开始，numpy.random.*功能，包括numpy.random.choice，是遗留功能，并且“应保持与当前相同”，根据NumPy 的新 RNG 政策，其中还引入了NumPy 的新随机生成系统。使它们成为遗留功能的原因包括避免全局状态的建议。然而即便如此，NumPy 并没有弃用任何numpy.random.*尽管 NumPy 的未来版本可能会在 1.17 版本中起作用。

回想一下，在你的例子中，numpy.random.choice需要一个数组floats 作为权重。整数权重数组将导致更精确的随机数生成。并且虽然任何float可以转换为有理数（导致有理值权重，从而产生整数权重），旧的 NumPy 版本似乎不这样做。这些和其他实施决定numpy.random.choice在不破坏向后兼容性的情况下无法更改。

顺便说一句，算术编码并不是唯一试图避免浪费比特的算法。也许离散分布采样的规范算法是 Knuth 和 Yao 算法（1976），该算法根据所涉及概率的二元展开精确地选择一个随机整数，并将问题视为二叉树上的随机游走。（该算法平均使用距理论下界最多 2 位的数据。）任何其他整数生成算法最终都可以用相同的方式描述，即二叉树上的随机游走。例如，快速加载骰子滚轴是一种最新算法，其使用的平均位数有一个有保证的界限（在本例中，距理论下限不超过 6 位）。 Han 和 Hoshi 算法（1997 年）是另一种此类算法，但使用累积概率。另请参阅我的部分，“加权选择与替换".

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么 numpy.random.choice 不使用算术编码？的相关文章

如何在 Sublime Text 2 的 OSX 终端中显示构建结果

我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它让我困扰的一件事是默认的构建结果显示在 ST2 的底部我的程序产生一些很长的结果显示它的理想方式如在 TM2 中是并排查看它们如何在 Mac 操作系统
如何在Windows上模拟socket.socketpair

标准Python函数套接字套接字对 https docs python org 3 library socket html socket socketpair不幸的是它在 Windows 上不可用从 Python 3 4 1 开始我
Python tcl 未正确安装

我刚刚为 python 安装了graphics py 但是当我尝试运行以下代码时 from graphics import def main win GraphWin My Circle 100 100 c Circle Point 50
将 github 上的包安装到 Spyder 中

我一直在尝试安装并导入mpl finance来自 github 的包在我的 Spyder 环境中没有成功我努力了 pip install e git https github com matplotlib mpl finance git
从 scikit-learn 导入 make_blobs [重复]

这个问题在这里已经有答案了我收到下一个警告 D Programming Python ML venv lib site packages sklearn utils deprecation py 77 DeprecationWarning
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
IRichBolt 在storm-1.0.0 和 pyleus-0.3.0 上运行拓扑时出错

我正在运行风暴拓扑 pyleus verbose local xyz topology jar using storm 1 0 0 pyleus 0 3 0 centos 6 6并得到错误线程 main java lang NoClass
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
Abaqus 将曲面转化为集合

我一直试图在模型中找到两个表面的中心参见照片但未能成功它们是元素表面面查询中没有选项可以查找元素表面的中心只能查找元素集的中心找到节点集的中心也很好但是我的节点集没有出现在工具 gt 查询 gt 质量属性选项中而且我找不到
Python：字符串不会转换为浮点数[重复]

这个问题在这里已经有答案了我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
ExpectedFailure 被计为错误而不是通过

我在用着expectedFailure因为有一个我想记录的错误我现在无法修复但想将来再回来解决我的理解expectedFailure是它会将测试计为通过但在摘要中表示预期失败的数量为 x 类似于它如何处理跳过的 tets 但是当我
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
从 Python 中的类元信息对 __init__ 函数进行类型提示

我想做的是复制什么SQLAlchemy确实以其DeclarativeMeta班级有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
如何使用google colab在jupyter笔记本中显示GIF？

我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点我正在使用下面的代码它并没有在笔记本中为 gif 制作动画我希望笔记本是交互式的这样人们就可以看到代码的动画效果而无需运行它我发现很多方法在 Goo
为什么C++代码执行速度比java慢？

我最近用 Java 编写了一个计算密集型算法然后将其翻译为 C 令我惊讶的是 C 的执行速度要慢得多我现在已经编写了一个更短的 Java 测试程序和一个相应的 C 程序见下文我的原始代码具有大量数组访问功能测试代码也是如此 C 的
协方差矩阵的对角元素不是 1 pandas/numpy

我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar
Spark.read 在 Databricks 中给出 KrbException

我正在尝试从 databricks 笔记本连接到 SQL 数据库以下是我的代码 jdbcDF spark read format com microsoft sqlserver jdbc spark option url jdbc sql

随机推荐

使用 Ipython 退出脚本时不调用 atexit 函数

下面是在 test atexit py 脚本中编写的代码 def exit function print I am in exit function import atexit atexit register exit function p
便携式 C SWAP 宏，不需要“type”参数，也不使用 memcpy

采用某种类型的交换宏是众所周知的 define SWAP type a b do type SWAP a a b b SWAP a a b b SWAP while 0 also 宏 SWAP t x y 交换两个类型 t 的参数是否可以
如何检查电话号码是否是 Android 中有效的 Whatsapp 号码？

所以我有一个编辑文本将用作从用户获取电话号码的视图假设电话号码是 6123456789 我想检查这个号码是否有whatsapp号码我想避免用户输入假的whatsapp号码怎么办更新 2022 年 11 月 Whatsapp 从 v
线程有多贵？

操作系统本机线程有多贵主机操作系统为线程堆栈分配一些虚拟内存并为线程控制结构分配一点内核内存我错过了什么吗它会增加调度程序的工作负载具体取决于线程的繁忙程度以及调度程序的类型它还将为堆栈的第一页分配物理内存在许多情况下主要成
是否存在从 HTML 属性名称到 DOM 属性名称的映射？

in HTML td style background color pink hello world td 但在 Javascript DOM 中 var td document createElement td td colSpan 3
如何从接口访问嵌套的可选索引

鉴于以下接口描述这个TS游乐场 export type GetTestimonialsSectionQuery typename Query testimonialsSection typename TestimonialsSection
无法实例化类...；没有空构造函数

当我运行我的PaintView java 我在 logcat 中收到以下错误即无法实例化类com example connectthedots PaintView 没有空的构造函数 07 22 18 47 43 453 D dalvikv
无法关闭 Tomcat web 应用程序中的 Neo4j Jetty 服务器

目前我正在开发一个使用 Neo4j 的网络应用程序我们的应用需要部署在Tomcat环境中客户要求我们决定嵌入 Neo4j 因为这样我们就可以使用 Neo4j 提供的 Java API 更容易部署并且性能得到提高但是我们还需要访问
Android：闹钟每 30 分钟播放一次，从 12:30 开始

这里我将使用闹钟服务每 30 分钟播放一次闹钟现在我已将其设置为从 Every start 开始每 10 秒播放一次这是代码 Override public void onCreate Bundle savedInstanceState
将非常大的 JSON 文件转换为 CSV

我有一个大小约为 8GB 的 JSON 文件当我尝试使用此脚本转换文件时 import csv import json infile open filename json r outfile open data csv w writer
如何在 php 中创建安全的 mysql 准备语句？

我是在 mysql 和 php 中使用准备好的语句的新手我需要一些帮助来创建准备好的语句来检索列我需要从不同的列获取信息目前对于测试文件我使用完全不安全SQL语句 qry SELECT FROM mytable where user
有什么方法可以使用给定的索引节点号搜索文件或文件名吗？

我正在从用户那里获取索引节点号并且必须在文件系统中搜索该文件如何搜索 inode 编号我必须使用 C 和 unix 来完成此操作到目前为止这是我的代码 include
链接命名范围未按预期工作

我有两个简单的命名范围定义如下 class Numbers lt ActiveRecord Base named scope even conditions gt title gt 2 4 6 named scope odd conditi
通过 grep 两次管道尾部输出

使用典型的 Apache 访问日志您可以运行 tail f access log grep 127 0 0 1 它只会显示指定 IP 地址的日志创建时但是为什么当你通过管道传输时会失败grep第二次进一步限制结果例如 css 的简
移动平均查询 MS Access

我正在尝试计算数据的移动平均值我用谷歌搜索并在这个网站和其他网站上找到了很多例子但我仍然感到困惑我需要计算为特定产品选择的记录的前 5 个流量的平均值我的表如下所示 TMDT Prod Flow 8 21 2017 12 01 00
使用图像模块（python）将希伯来语文本绘制为图像

这是我已经问过的一个问题并且有几个得到了答案但问题仍然存在当我尝试使用图像模块用希伯来语写入图像时我得到的不是希伯来语字母而是其他 ascii 字母如果我转换为 unicode 或 ascii 我会收到一个它不支持的错误我在这里
Windows TCP 套接字默认启用 SO_KEEPALIVE 吗？

我在 TCP 套接字方面遇到了一个奇怪的错误看起来SO KEEPALIVE默认情况下在所有套接字上启用我编写了一个简短的测试用例来创建套接字并连接到服务器连接后我立即检查SO KEEPALIVE with getsockopt 该值
转换元组类型

所以我是提升 MPL 的新手我不知道如何将它与标准类型一起使用我想要一个隐藏这种类型的元函数 std tuple
FLOT 趋势线

包括我jquery flot trendline js 从这里这是我的代码 plot placeholder seriesdata series trendline show true lineWidth 2 fill true fill
为什么 numpy.random.choice 不使用算术编码？

如果我评估类似 numpy random choice 2 size 100000 p 0 01 0 99 使用一个均匀分布的随机数float say r 并决定是否r lt 0 01可能会浪费许多生成的随机位熵我听说二手生成伪随机

为什么 numpy.random.choice 不使用算术编码？

为什么 numpy.random.choice 不使用算术编码？ 的相关文章

随机推荐

热门标签

为什么 numpy.random.choice 不使用算术编码？的相关文章