为什么洗牌 list(range(n)) 比洗牌 [0]*n 慢？

2023-12-25

Using random.shuffle，我注意到洗牌list(range(n))比洗牌多花费约 25% 的时间[0] * n。这是尺寸的时间n从 100 万到 200 万：

为什么是洗牌list(range(n))慢点？与对列表进行排序（需要查看对象）或复制列表（增加对象内部的引用计数器）不同，对象在这里不重要。这应该只是重新排列列表内的指针。

我也尝试过numpy.random.shuffle，其中洗牌list(range(n))比洗牌慢三倍（！）[0] * n:

我还尝试了第三种方法来重新排列列表中的元素，即list.reverse。正如预期的那样，两个列表花费的时间相同：

以防万一洗牌顺序很重要，我也尝试过list.reverse重新整理列表后。同样，正如预期的那样，两个列表花费的时间相同，并且与没有事先进行改组的时间相同：

那么有什么区别呢？混排和反转都只需要重新排列列表内的指针，为什么对象对于混排很重要，而对于反转则不重要？

我的基准代码生成时间：

import random
import numpy
from timeit import repeat, timeit
from collections import defaultdict

shufflers = {
    'random.shuffle(mylist)': random.shuffle,
    'numpy.random.shuffle(mylist)': numpy.random.shuffle,
    'list.reverse(mylist)': list.reverse,
    }

creators = {
    'list(range(n))': lambda n: list(range(n)),
    '[0] * n': lambda n: [0] * n,
    }

for shuffler in shufflers:
    print(shuffler)
    for creator in creators:
        print(creator)
        times = defaultdict(list)
        for _ in range(10):
            for i in range(10, 21):
                n = i * 100_000
                mylist = creators[creator](n)
                # Uncomment next line for pre-shuffling
                # numpy.random.shuffle(mylist)
                time = timeit(lambda: shufflers[shuffler](mylist), number=1)
                times[n].append(time)
                s = '%.6f ' * len(times[n])
        # Indent next line further to see intermediate results
        print([round(min(times[n]), 9) for n in sorted(times)])

（注意：我没有时间完成这个答案，所以这是一个开始——这绝对不适合评论，希望它可以帮助其他人完成这个问题！）

这似乎是由于引用的局部性（也许是 cpython 实现细节——例如，我在 pypy 中没有看到相同的结果）

在尝试解释之前先看几个数据点：

random.shuffle https://github.com/python/cpython/blob/61ac612e78e4f2625977406fb6f366e0a644673a/Lib/random.py#L304-L324是用纯 python 实现的，适用于任何可变序列类型——它不是专门用于列表的。

这意味着每次交换都涉及__getitem__，增加商品的重新计数，__setitem__，减少项目的重新计数

list.reverse https://github.com/python/cpython/blob/61ac612e78e4f2625977406fb6f366e0a644673a/Objects/listobject.c#L1023-L1037用 C 实现，仅适用于list（使用列表的实现细节）

这意味着每次交换都在不调用的情况下发生__getitem__或更改引用计数。列表的内部项目直接重新排列

重要的是引用计数

在 cpython 中，引用计数与对象本身一起存储 https://github.com/python/cpython/blob/61ac612e78e4f2625977406fb6f366e0a644673a/Include/object.h#L105-L109，并且几乎所有对象都存储在堆中。为了调整引用计数（即使是暂时的）写入ob_refcnt将分页在PyObject结构到缓存/内存/等中。

（这是我没时间的地方——我可能会做一些内存故障分析来证实这个假设）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么洗牌 list(range(n)) 比洗牌 [0]*n 慢？的相关文章

Python PAM 模块的安全问题？

我有兴趣编写一个 PAM 模块该模块将利用流行的 Unix 登录身份验证机制我过去的大部分编程经验都是使用 Python 进行的并且我正在交互的系统已经有一个 Python API 我用谷歌搜索发现pam python http pa
Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

据我了解 distinct 哈希分区 RDD 来识别唯一键但它是否针对仅移动每个分区的不同元组进行了优化想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上所有重复键
为 pandas 数据透视表中的每个值列定义 aggfunc

试图生成具有多个值列的数据透视表我知道我可以使用 aggfunc 按照我想要的方式聚合值但是如果我不想对两列求和或求平均值而是想要一列的总和同时求另一列的平均值该怎么办那么使用 pandas 可以做到这一点吗 df pd D
安装后 Anaconda 提示损坏

我刚刚安装张量流GPU创建单独的后环境按照以下指示here https github com antoniosehk keras tensorflow windows installation 但是安装后当我关闭提示窗口并打开新航站楼弹出
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

我有一个清单 things A1 B2 C3 我有一个 pandas 数据框其中有一列包含用分号分隔的值某些行将包含与上面列表中的一项的匹配它不会是完美的匹配因为它在其中包含字符串的其他部分该列例如该列中的一行可能有哇这里
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
在 nHibernate 关系中使用实体的 Lite 版本？

在某些情况下出于性能原因创建一个实体的轻量级版本指向同一个表但映射的列较少这是一个好主意吗例如如果我有一个包含 50 列的联系人表并且在一些相关实体中我可能对 FirstName 和 LastName 属性感兴趣那么创建
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
Geopandas 设置几何图形：MultiPolygon“等于 len 键和值”的 ValueError

我有 2 个带有几何列的地理数据框我将一些几何图形从 1 个复制到另一个这对于多边形效果很好但对于任何有效多多边形都会返回 ValueError 请指教如何解决这个问题我不知道是否如何为什么应该更改 MultiPolygon
Python：尝试检查有效的电话号码

我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字现在我有了这个如果启动不正确它将允许您重新输入正确的数字然后它会翻译输入的原始数字我该如何解决 def main phon
用于选择特定 div 中具有特定类的锚元素的 jQuery 选择器是什么

我有一些这样的代码我想选择每个 a 带有类的标签status在 div 中foo div a class status a div 你可以这样做 foo find status a
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
glpk.LPX 向后兼容性？

较新版本的glpk没有LPXapi 旧包需要它我如何使用旧包例如COBRA http opencobra sourceforge net openCOBRA Welcome html 与较新版本的glpk 注意COBRA适用于 MATL
从 Python 中的类元信息对 __init__ 函数进行类型提示

我想做的是复制什么SQLAlchemy确实以其DeclarativeMeta班级有了这段代码 from sqlalchemy import Column Integer String from sqlalchemy ext declar
使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce
在 Python 类中动态定义实例字段

我是 Python 新手主要从事 Java 编程我目前正在思考Python中的类是如何实例化的我明白那个 init 就像Java中的构造函数然而有时 python 类没有 init 方法在这种情况下我假设有一个默认构造函数就像
协方差矩阵的对角元素不是 1 pandas/numpy

我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar

随机推荐

添加 androidx.fragment:fragment-testing 依赖项后 AndroidTests 停止构建

我添加后fragment testing对我的项目的依赖 Testing dependencies espressoVersion 3 2 0 beta01 testCoreVersion 1 1 0 runnerVersion 1 1 0
如何在 C# 中使用 SevenZipSharp/Unrar 知道哪个 rar 是多个 rar 存档中的第一个？

我正在尝试在 C WinForms NET 3 5 中使用 SevenZipSharp 或和 Unrar 库我遇到了具有不同命名的多个 rar 存档的问题例如 rar r01 r02 r03 等这很简单 somefile01 rar
“免费”的冲突类型

我收到错误免费的冲突类型打电话给free 下面的函数 int main char fx x 2 5 x 1 node fxNode buildTree fx sizeof fx sizeof char printf deriveFro
Portlet 桥有什么作用？

在今天的一次采访中我提到我在 portlet 中完成了一些 jsf 工作面试官询问了 portlet bridge 的具体功能我从来没有深入研究过它只是使用它因为我被告知它可以让 jsf 在 portlet 中工作我真正能说的是
“CSV 不存在”-Pandas DataFrame [重复]

这个问题在这里已经有答案了我在将 csv 文件读入 pandas 数据框中时遇到困难我是 pandas 的新手这阻碍了我的进步我已阅读文档并搜索解决方案但无法继续我已经尝试过以下方法但无济于事 import pandas as
POCO、DTO、DLL 和贫血域模型

我正在看POCO和DTO的区别 https stackoverflow com questions 725348 poco vs dto 看起来 POCO 是具有行为方法的 dto 并遇到本文 http www martinfowler
在 VS2008 中调试 Windows x64 上的 x86 .NET 应用程序

我使用 x64 版本的 Windows 7 我的应用程序使用一些无法在 x64 上下文中加载的 COM 服务器通常是本机 x86 COM 服务器所以我决定将其作为 x86 应用程序运行WOW http en wikipedia org
Oracle SQL如何找出哪个表有以下两列？

我知道我可以发出一个声明来查找包含我正在查找的列的表 SELECT DISTINCT table name FROM all tab cols WHERE column name EMP ID 但是我应该如何修改它以便我可以找到两者都说
SQL Server：根据提供的行值为每行运行函数

我仍在学习 SQL 我在想如何将行值传递到一个函数中cross apply query 假设这是我的第一张桌子 SELECT Project emp id Allocation start Allocation end FROM First
Next Auth.js 令牌长度和 Cognito 的问题

我正在尝试使用 NextAuth js 和 Cognito 在我的 Next js 应用程序中实现身份验证这是我的问题当调用 jwt 回调时我想在会话中存储 3 个令牌和其他内容但令牌最大长度为 4096 字节我怎样才能实现这个
添加单个字符以在 Counter 中添加键

如果 Counter 对象的键的类型是str i e 我可以这样做 gt gt gt vocab counter Counter the lazy fox jumps over the brown dog split gt gt gt vo
Python：打印一个简单的函数[重复]

这个问题在这里已经有答案了我是 Python 和一般编程的绝对初学者而且我刚刚第一次接触函数我在下面定义了两个简单的函数 def output1 print Hello world def output2 print Hello th
ValueError：操作数无法与形状 (5,) (30,) 一起广播

我正在尝试像这样合并数组 If a 1 2 1 3 4 b 0 0 0 0 c 0 0 0 0 a a b c 那么结果应该是 0 0 0 0 1 2 1 3 4 0 0 0 0 我所做的是提取数组的直方图并将其与普通数组合并 x1 bi
找不到文件 mysql-connector-java-5.1.13-bin.jar

您好当我尝试从 netbeans 站点运行 sakila 数据库示例时https netbeans org projects samples downloads download Samples JavaEE DVDStoreEE6 zi
TIdHTTP：选择 HTTP 请求的传出 IP？

我有一台机器有几个不同的静态IP 是否可以通过以下方式选择 HTTP 请求的传出 IP 地址TIdHTTP Indy 印地的新版本有BoundIP idHttp1 BoundIP 144 33 34 212
在类型系统的上下文中什么是“种类”？

我已经阅读了维基百科文章并搜索了明显的地方但我被困住了有人可以简单地告诉我 Kind 到底是什么吗它是干什么用的 Scala 示例最受欢迎简而言之 kind is to types what a type is to values
禁止系统使用 Meteor 帐户？

我正在使用 Meteor 开发一个聊天应用程序它使用 account ui 和 account twitter 我希望能够禁止人们滥用该网站但我不确定如何做到这一点或者是否可能有没有办法做到这一点这是我用来运行聊天应用程序部分的代
ScrollView 布局或其RelativeLayout 父级可能没用

我正在开发 Android 4 及以上版本的应用程序一层生成此警告此 ScrollView 布局或其relativelayout 父级可能是无用的将背景属性传输到另一个视图
使用 css 设置表格中最后一个 td 的样式

我想设置表中最后一个 TD 的样式而不在特定 TD 上使用 CSS 类 table tbody tr td One td td Two td td Three td td Four td td Five td tr tbody table
为什么洗牌 list(range(n)) 比洗牌 [0]*n 慢？

Using random shuffle 我注意到洗牌list range n 比洗牌多花费约 25 的时间 0 n 这是尺寸的时间n从 100 万到 200 万为什么是洗牌list range n 慢点与对列表进行排序需要查看对象

为什么洗牌 list(range(n)) 比洗牌 [0]*n 慢？

为什么洗牌 list(range(n)) 比洗牌 [0]*n 慢？ 的相关文章

随机推荐

热门标签

为什么洗牌 list(range(n)) 比洗牌 [0]*n 慢？的相关文章