为什么将列表转换为集合比将生成器转换为集合更快？

2023-12-06

这是一个例子

>>> from timeit import timeit
>>> print(timeit('[y for y in range(100)]', number=100000))
0.7025867114395824
>>> print(timeit('(y for y in range(100))', number=100000))
0.09295392291478244
>>> print(timeit('set([y for y in range(100)])', number=100000))
1.0864544935180334
>>> print(timeit('set((y for y in range(100)))', number=100000))
1.1277489876506621

这很令人困惑。生成器创建所需的时间更少（这是可以理解的），但是为什么将生成器转换为集合比转换列表慢，而它应该（至少据我所知）相反。

首先，对生成器表达式的创建进行计时是没有意义的。创建生成器不会迭代内容，因此速度非常快。找出针对一个元素创建生成器表达式与针对超过 1000 万个元素创建生成器表达式之间的差异：

>>> print(timeit('(y for y in range(1))', number=100000))
0.060932624037377536
>>> print(timeit('(y for y in range(10000000))', number=100000))
0.06168231705669314

与列表对象相比，生成器需要更多时间进行迭代：

>>> from collections import deque
>>> def drain_iterable(it, _deque=deque):
...     deque(it, maxlen=0)
...
>>> def produce_generator():
...     return (y for y in range(100))
...
>>> print(timeit('drain_iterable(next(generators))',
...              'from __main__ import drain_iterable, produce_generator;'
...              'generators=iter([produce_generator() for _ in range(100000)])',
...              number=100000))
0.5204695729771629
>>> print(timeit('[y for y in range(100)]', number=100000))
0.3088444779859856

在这里，我通过以下方式测试了生成器表达式的迭代尽快丢弃所有元素.

这是因为生成器本质上是一个正在执行的函数，直到它产生一个值，然后暂停，然后再次激活下一个值，然后再次暂停。看“yield”关键字有什么作用？以获得良好的概览。参与此过程的管理需要时间。相反，列表理解不必花费这个时间，它会完成所有循环，而无需为每个生成的值重新激活和停用函数。

发电机是记忆效率高，执行效率不高。它们可以节省执行时间，有时，但通常是因为您避免分配和释放较大的内存块。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

performance

python3x

listcomprehension

generatorexpression

为什么将列表转换为集合比将生成器转换为集合更快？的相关文章

NLTK 2.0分类器批量分类器方法

当我运行此代码时它会抛出一个错误我认为这是由于 NLTK 3 0 中不存在batch classify 方法我很好奇如何解决旧版本中的某些内容在新版本中消失的此类问题 def accuracy classifier gold resu
我应该使用 Python 双端队列还是列表作为堆栈？ [复制]

这个问题在这里已经有答案了我想要一个可以用作堆栈的 Python 对象使用双端队列还是列表更好元素数量较少还是数量较多有什么区别您的情况可能会根据您的应用程序和具体用例而有所不同但在一般情况下列表非常适合堆栈 append is
PHP 与 MySQL 查询性能（ if 、函数）

我只看到这个artice http www onextrapixel com 2010 06 23 mysql has functions part 5 php vs mysql performance 我需要知道在这种情况下什么是最好的表
PyQt 使用 ctrl+Enter 触发按钮

我正在尝试在我的应用程序中触发确定按钮我当前尝试的代码是这样的 self okPushButton setShortcut ctrl Enter 然而它不起作用这是有道理的我尝试查找一些按键序列here http ftp ics
MongoEngine 查询具有以列表中指定的前缀开头的属性的对象的列表

我需要在 Mongo 数据库中查询具有以列表中任何前缀开头的特定属性的元素现在我有一段这样的代码 query mymodel terms term in query terms 并且这会匹配在列表 term 上有一个项目的对象该列表中的
Tensorboard SyntaxError：语法无效

当我尝试制作张量板时出现语法错误尽管开源代码我还是无法理解我尝试搜索张量板的代码但不清楚即使我不擅长Python 我这样写路径C Users jh902 Documents logs因为我正在使用 Windows 10 但我不确定
矩形函数的数值傅里叶变换

本文的目的是通过一个众所周知的分析傅里叶变换示例来正确理解 Python 或 Matlab 上的数值傅里叶变换为此我选择矩形函数这里报告了它的解析表达式及其傅立叶变换https en wikipedia org wiki Rectan
GUI（输入和输出矩阵）？

我需要创建一个 GUI 将数据输入到矩阵或表格中并读取此表单数据完美的解决方案是限制输入表单仅允许float 例如 A 1 02 0 25 0 30 0 515 0 41 1 13 0 15 1 555 0 25 0 14 1 21 2
从 Powershell 脚本安装 Python

当以管理员身份从 PowerShell 命令行运行以下命令时可以在 Windows 11 上成功安装 Python c temp python 3 11 4 amd64 exe quiet InstallAllUsers 0 Instal
未知错误：Chrome 无法启动：异常退出

当我使用 chromedriver 对 Selenium 运行测试时出现此错误 selenium common exceptions WebDriverException Message unknown error Chrome fail
pandas - 包含时间序列数据的堆积条形图

我正在尝试使用时间序列数据在 pandas 中创建堆积条形图 DATE TYPE VOL 0 2010 01 01 Heavy 932 612903 1 2010 01 01 Light 370 612903 2 2010 01 01 Me
Pandas 组合不同索引的数据帧

我有两个数据框df 1 and df 2具有不同的索引和列但是有一些索引和列重叠我创建了一个数据框df索引和列的并集因此不存在重复的索引或列我想填写数据框df通过以下方式 for x in df index for y in df
Protobuf 如何编码 oneof 消息结构

对于这个 python 程序在编码时运行 protobuf 编码会给出以下输出 0a 10 08 7f8a 0104 08 02 10 0392 0104 08 02 10 03 18 01 我不明白的是为什么8a后面有一个01 为什么9
SignalR 似乎正在减慢我的 MVC/Azure 应用程序的启动速度

我有一个 MVC 应用程序在 Windows Azure 上的 WebRole 上的 NET 4 5 下运行使用 SignalR 1 0 alpha2 并使用 ServiceBus 底板在我的 App Start 文件夹中我有 Reg
重新分配唯一值 - pandas DataFrame

我在尝试着assign unique值在pandas df给特定的个人 For the df below Area and Place 会一起弥补unique不同的价值观jobs 这些值将分配给个人总体目标是使用尽可能少的个人诀窍在于这
pandas.read_csv 将列名移动一倍

我正在使用位于的 ALL zip 文件here http www fec gov disclosurep PDownload do 我的目标是用它创建一个 pandas DataFrame 但是如果我跑 data pd read csv
如何将Python3设置为Mac上的默认Python版本？

有没有办法将 Python 3 8 3 设置为 macOS Catalina 版本 10 15 2 上的默认 Python 版本我已经完成的步骤看看它安装在哪里 ls l usr local bin python 我得到的输出是这样的
JSON：TypeError：Decimal（'34.3'）不是JSON可序列化的[重复]

这个问题在这里已经有答案了我正在运行一个 SQL 查询它返回一个小数列表当我尝试将其转换为 JSON 时出现类型错误查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS
NLTK：查找单词大小为 2k 的上下文

我有一个语料库我有一个词对于语料库中该单词的每次出现我想获取一个包含该单词之前的 k 个单词和该单词之后的 k 个单词的列表我在算法上做得很好见下文但我想知道 NLTK 是否提供了一些我错过的功能来满足我的需求 def size
如何在Python脚本中从youtube-dl中提取文件大小？

我是 python 编程新手我想在下载之前提取视频音频大小任何 YouTube 视频 gt gt gt from youtube dl import YoutubeDL gt gt gt url https www youtube c

随机推荐

将 4 个原始字节转换为 32 位浮点数

我正在尝试从 eeprom 重新构造 32 位浮点值 eeprom 存储器 0 4 中的 4 个字节是 B4 A2 91 4D PC VS Studio 将其正确重建为 3 054199 10 8 我知道应该在那里的浮点值现在我正在移动这
如何对 simplexml_load_file 进行错误检查？

我正在使用 Tumbrl API 将一些帖子加载到我的主页上我有以下电话 xml simplexml load file request url 有时它加载得很好但有时我会得到以下输出 Warning simplexml load fi
hbase 和 hive 有什么区别？（Hadoop）

根据我的理解 Hbase是Hadoop数据库 Hive是数据仓库 Hive 允许创建表并在其中存储数据您还可以将现有的 HBase 表映射到 Hive 并对其进行操作如果 hive 能做到这一切为什么我们应该使用 hbase 我们可以
尝试将第三个项目添加到过滤器时，“参数数据类型 ntext 对于上层函数的参数 1 无效”

我一直在关注 ASP NET 网站上的 Contoso 大学教程我正在尝试扩展我的技能因此决定尝试向过滤器添加第三个选项该教程提供 if String IsNullOrEmpty searchString students stude
在 PHP 中用换行符替换文字字符串 \r\n 时出现问题

我有一个包含文字字符串的文本文件 r n在里面我想用实际的换行符 n 替换它我知道正则表达式 r n 应该匹配它我已经在Reggy 但我无法让它在 PHP 中工作我尝试过以下变体 preg replace r n n line pr
将参数传递给 boost::thread 没有重载函数需要 2 个参数

从 boost thread 文档看来我可以通过这样做将参数传递给线程函数 boost thread myThread new boost thread callbackFunc param 然而当我这样做时编译器抱怨说没有重载函数
preg_match() 未知修饰符 '[' 帮助

我有这个正则表达式来获取 YouTube 视频 ID lt v a zA Z0 9 lt 0 9 n lt v n 我从那里得到它正则表达式解析 youtube yid 问题是我得到preg match Unknown modifier
OrientDB ETL 加载 CSV，其中顶点在一个文件中，边在另一个文件中

我有一些数据位于 2 个 CSV 文件中一个包含顶点另一个文件包含另一个文件中的边我正在研究如何使用 ETL 来设置它已经接近但还没有完全实现它基本上可以工作但我的边缘有属性我不确定它们是否正确加载这个问题很有帮助但我仍然
CorePlot MonoMac 绑定崩溃

我正在尝试使用 Monomac 的 CorePlot 0 9 绑定但这似乎是一项艰巨的任务 monotouch 示例的构建和运行没有任何问题但我不需要那个由于绑定中仅存在 CorePlotiOS dll 因此我必须自己为 osx 构建
在 asp.net 中获取 BIOS 日期

我检查管理员是否有许可证所以我每月检查一次登录现在我使用系统日期进行检查但管理员更改系统日期所以我想要日期 BIOS 日期 string crt val crt mont crt year dt v objdata select u
Powershell - 等待输入 10 秒 [重复]

这个问题在这里已经有答案了 inputYN Read Host defaults to y in 10 sec y n 如果用户在 10 秒内没有提供任何输入则默认 inputYN应转到是并继续执行下一个任务你的问题引起了我的兴趣
java swing JTextField 设置 PlaceHolder [重复]

这个问题在这里已经有答案了我创建了一个 JTextField 现在我想在该 JTextField 上设置占位符但我不知道如何请帮忙这是我的代码 JTextField database new JTextField Enter Dat
使用 PyAudio 进行流式传输时修改音量

我正在尝试流式传输 WAV 文件同时剥离其中一个声道因此它仅在一个扬声器上播放同时降低音量我使用 PyAudio 的原因是我必须能够一次传输多个文件从特定扬声器左右播放声音中断声音文件的播放并且无法找到任何其他允许这些
Visual Studio 2015 社区中缺少通用应用程序模板

我仍然无法在已安装的 Visual Studio 2015 Community 中创建新的通用应用程序我认为原因是我运行的是 Windows 8 1 今天我升级到Windows 10 但没有可用的通用应用程序模板我已经安装了 Win
使用 Grails 在电子邮件中发送图像

我正在使用 Grails邮件插件发送电子邮件我想在电子邮件正文中发送图像而不是作为附件我想要的是图像显示在电子邮件正文本身中就像在新闻通讯中一样我试过 img style display block height 100px wi
git push --force，在幕后

当你使用 force 进行 git push 时到底会发生什么我已经在网上搜索了大约一个小时我能找到的最相关的答案是 Same as git push but force the push even if it results in a
如何将列表项从字符串转换为整数？

我有一个字符串列表列表如下所示l 1 2 3 4 5 6 2 3 2 3 4 我想从第 2 项开始将列表视为 int 以下代码实现了目的但没有将列表项转换为 int gt gt gt l i 2 for i in range len l
在管理中列出过滤器和搜索结果

在我覆盖之后get search results方法 list filter不起作用但搜索字段按我的预期工作 class NaruceniProduktiAdmin admin ModelAdmin search fields broj
使用 Eloquent/Raw Laravel 查询的 Group Concat

我有一个以 Eloquent 形式存储的对象结构 item id 2 item color Black item size L item Quantity 5 item id 2 item color Black item size M i
为什么将列表转换为集合比将生成器转换为集合更快？

这是一个例子 gt gt gt from timeit import timeit gt gt gt print timeit y for y in range 100 number 100000 0 7025867114395824 gt

为什么将列表转换为集合比将生成器转换为集合更快？

为什么将列表转换为集合比将生成器转换为集合更快？ 的相关文章

随机推荐

热门标签

为什么将列表转换为集合比将生成器转换为集合更快？的相关文章