在 Python 中，为什么单独的字典字符串值要通过“in”相等性检查？（弦实习实验）

2024-03-05

我正在构建一个 Python 实用程序，它将涉及将整数映射到单词字符串，其中许多整数可能映射到同一个字符串。根据我的理解，Python 默认情况下会实习短字符串和大多数硬编码字符串，从而通过在表中保留字符串的“规范”版本来节省内存开销。我认为通过实习字符串值我可以从中受益，尽管字符串实习更多的是为了键散列优化而构建的。我编写了一个快速测试，检查长字符串的字符串相等性，首先仅将字符串存储在列表中，然后将字符串作为值存储在字典中。这种行为出乎我意料：

import sys

top = 10000

non1 = []
non2 = []
for i in range(top):
    s1 = '{:010d}'.format(i)
    s2 = '{:010d}'.format(i)
    non1.append(s1)
    non2.append(s2)

same = True
for i in range(top):
    same = same and (non1[i] is non2[i])
print("non: ", same) # prints False
del non1[:]
del non2[:]


with1 = []
with2 = []
for i in range(top):
    s1 = sys.intern('{:010d}'.format(i))
    s2 = sys.intern('{:010d}'.format(i))
    with1.append(s1)
    with2.append(s2)

same = True
for i in range(top):
    same = same and (with1[i] is with2[i])
print("with: ", same) # prints True

###############################

non_dict = {}
non_dict[1] = "this is a long string"
non_dict[2] = "this is another long string"
non_dict[3] = "this is a long string"
non_dict[4] = "this is another long string"

with_dict = {}
with_dict[1] = sys.intern("this is a long string")
with_dict[2] = sys.intern("this is another long string")
with_dict[3] = sys.intern("this is a long string")
with_dict[4] = sys.intern("this is another long string")

print("non: ",  non_dict[1] is non_dict[3] and non_dict[2] is non_dict[4]) # prints True ???
print("with: ", with_dict[1] is with_dict[3] and with_dict[2] is with_dict[4]) # prints True

我认为非字典检查会导致“False”打印输出，但我显然错了。有人知道发生了什么事吗？就我而言，字符串实习是否会产生任何好处？我可以有很多，many如果我合并来自多个输入文本的数据，则键比单个值更多，因此我正在寻找一种节省内存空间的方法。（也许我必须使用数据库，但这超出了这个问题的范围。）先感谢您！

字节码编译器执行的优化之一与实习类似但不同，是它将在同一代码块中使用相同的对象来表示相同的常量。这里的字符串文字：

non_dict = {}
non_dict[1] = "this is a long string"
non_dict[2] = "this is another long string"
non_dict[3] = "this is a long string"
non_dict[4] = "this is another long string"

位于同一代码块中，因此相同的字符串最终由同一字符串对象表示。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 Python 中，为什么单独的字典字符串值要通过“in”相等性检查？（弦实习实验）的相关文章

Python 多处理示例不起作用

我正在尝试学习如何使用multiprocessing但我无法让它发挥作用这是代码文档 http docs python org 2 library multiprocessing html from multiprocessing imp
如何在Windows上模拟socket.socketpair

标准Python函数套接字套接字对 https docs python org 3 library socket html socket socketpair不幸的是它在 Windows 上不可用从 Python 3 4 1 开始我
如何使用包含代码的“asyncio.sleep()”进行单元测试？

我在编写 asyncio sleep 包含的单元测试时遇到问题我要等待实际的睡眠时间吗 I used freezegun到嘲笑时间当我尝试使用普通可调用对象运行测试时这个库非常有用但我找不到运行包含 asyncio sleep 的测
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

我有一个清单 things A1 B2 C3 我有一个 pandas 数据框其中有一列包含用分号分隔的值某些行将包含与上面列表中的一项的匹配它不会是完美的匹配因为它在其中包含字符串的其他部分该列例如该列中的一行可能有哇这里
Python 中的二进制缓冲区

在Python中你可以使用StringIO https docs python org library struct html用于字符数据的类似文件的缓冲区内存映射文件 https docs python org library mmap
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
Abaqus 将曲面转化为集合

我一直试图在模型中找到两个表面的中心参见照片但未能成功它们是元素表面面查询中没有选项可以查找元素表面的中心只能查找元素集的中心找到节点集的中心也很好但是我的节点集没有出现在工具 gt 查询 gt 质量属性选项中而且我找不到
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
如何将 numpy.matrix 提高到非整数幂？

The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
Python：尝试检查有效的电话号码

我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字现在我有了这个如果启动不正确它将允许您重新输入正确的数字然后它会翻译输入的原始数字我该如何解决 def main phon
shell中如何分割字符串

我有一个变量作为 string ABC400p2q4 我怎样才能分开ABC400 and p2q4 我需要将它分成两个变量结果我得到 echo var1 ABC400 echo var2 p2q4 可以用任何字母字符代替 ABC 可以用任
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
循环标记时出现“ValueError：无法识别的标记样式 -d”

我正在尝试编码pyplot允许不同标记样式的绘图这些图是循环生成的标记是从列表中选取的为了演示目的我还提供了一个颜色列表版本是Python 2 7 9 IPython 3 0 0 matplotlib 1 4 3 这是一个简单的代
使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce
C# 中最小化字符串长度

我想减少字符串的长度喜欢这串 string foo Lorem ipsum dolor sit amet consectetur adipiscing elit Aenean in vehicula nulla Phasellus li
协方差矩阵的对角元素不是 1 pandas/numpy

我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar
Python - 字典和列表相交

给定以下数据结构找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出我可以将列表不是 dict1 组织到任何其他数
Pandas 与 Numpy 数据帧

看这几行代码 df2 df copy df2 1 df 1 df 1 values 1 df2 ix 0 0 我们的教练说我们需要使用 values属性来访问底层的 numpy 数组否则我们的代码将无法工作我知道 pandas Data

随机推荐

secItemCopyMatching 返回 nil 数据

首先我观看了 WWDC 2013 关于使用钥匙串保护秘密的会议我想做一个基本的密码存储看完了整个视频但在视频的前 10 分钟找到了我需要的东西这看起来很简单但我不完全理解数据编码和检索是如何工作的问题在 secItemCop
有没有办法跟踪 API 网关限制的调用？

我一直在使用 CloudWatch 跟踪 API Gateway 和 Lambda 的指标它显示 Lambda 的受限制的调用但是有什么方法可以查看 API Gateway 之前限制的调用数量还没有但我们计划在不久的将来解决这个问题
自动委托java类的所有方法

假设我有一个包含许多公共方法的类 public class MyClass public void method1 public void method2 public void methodN 现在我想创建一个wrapper类它将所有方
使用 javascript 旋转 div

我想单击一个 div 并旋转另一个 div 然后当再次单击第一个 div 时另一个 div 旋转回其原始位置如果需要我可以参考这个库http ricostacruz com jquery transit http ricostacruz
创建新的 SQLCommand 或重复使用相同的 SQLCommand

我需要使用 ADO NET 将一系列命令发送到 SQL 2008 以便逐个执行我应该为我发送的每个 SQL 创建一个新的 SQLCommand 吗或者重用相同的 SQLCommand 并仅更改 CommandText 属性谢谢内斯特
动态构建表达式树

我正在遵循这个很好的例子将 Linq to Sql 表达式转换为表达式树 https stackoverflow com questions 5225416 convert linq to sql expression to expres
暂时禁用 SelectItems

我有一个
如何查找该月的最后一天？

我正在尝试新的 Google Dart 语言但我不知道如何获取当月的最后一天这给了我当前日期 var now new DateTime now 为下个月提供零的日期值可得出上个月的最后一天 var date new DateTime 2
如何在不使用 Windows 任务计划程序的情况下安排运行 bat 文件？ [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我有一个触发 Python 脚本的批处理 bat 文件该脚本需要大约 25 分钟才能交互完成通过命令提示符手动完成该批处理文件需要每天
为什么捆绑程序不会在 OS X 10.8 上安装 json 1.7.4 gem？

我使用的是 OS X 10 8 XCode 4 4 Ruby 1 9 3 和 Rails 3 2 当我从 git 克隆我的 Rails 项目并运行时 bundle install I get 安装 json 1 7 4 Errno EPER
如何在play框架2.1中使用wro4j

有一种方法可以包含 wro4jhttp code google com p wro4j http code google com p wro4j 在java play框架2 1中我需要编译 hogan js 模板并执行更多操作无需重新发
Storm 如何知道消息何时“完全处理”？

还有一些关于超时和 maxSpoutPending 的问题我在 Storm 文档中看到很多关于消息被完全处理的参考资料但是我的 KafkaSpout 如何知道消息何时被完全处理希望它能够识别我的 Bolt 的连接方式以便当我的 St
热衷于仅在 datagridview 中更改特定的列标题颜色？

使用 VS 2005 C DataGridView WinForms 我需要为特定列的标题部分的字体背景着色我发现它只能对整个列列表的标题而不是单个列进行非常感谢任何帮助首先在 DataGridView 中您需要将 Enable
Coq 中的 Modus Ponens 和 Modus Tollens

我想要针对这些简单的推理规则使用 Ltac 策略在 Modus Ponens 中如果我有H P gt Qand H1 P Ltac mp H H1将添加Q到上下文为H2 Q 在 Modus Tollens 中如果我有H P gt Qa
让 FTP 在 Azure VM 上运行，克服 ftp 客户端上的“连接关闭”问题

我正在努力连接到 Azure 中新 VM 上的 FTP 我从默认映像 Windows Server 2012 Datacenter 创建了一个新的虚拟机并通过 RDP 连接到新的虚拟机中然后我启用了 Web 服务器 IIS 角色包括
将Excel上传控件添加到网格工具栏

有没有一种方法可以让网格控件允许从 Excel 工作表上传数据我还没有找到可以将此控件放在工具栏上的命令您需要装饰数据视图PXImportAttribute Example PXViewName Messages SOLine PXIm
使用selenium：如何在Python中关闭Driver后保持登录状态

我想在第二次在 chrome 驱动程序上打开 Whatsapp 网站时登录我的 Whatsapp 网站 web whatsapp com 以下是我基于Python的代码需要您的帮助 from selenium import webdriv
SVN 上的 HG Convert 给出“看起来不像 Subversion 存储库”

我刚刚安装了 TortoiseHG v2 11 和 Mercurial 2 9 我正在尝试转换使用 TortoiseSVN 1 8 创建的本地 Subversion 存储库 4 颠覆1 8 5 为了确保我的旧 Subversion 存储库没
从本地主机连接到 Xero OAuth2 出现 CORS 错误

我正在连接到 Xero oauth 服务器 https login xero com identity connect authorize https login xero com identity connect authorize 通过
在 Python 中，为什么单独的字典字符串值要通过“in”相等性检查？（弦实习实验）

我正在构建一个 Python 实用程序它将涉及将整数映射到单词字符串其中许多整数可能映射到同一个字符串根据我的理解 Python 默认情况下会实习短字符串和大多数硬编码字符串从而通过在表中保留字符串的规范版本来节省内存开销我认

在 Python 中，为什么单独的字典字符串值要通过“in”相等性检查？ （弦实习实验）

在 Python 中，为什么单独的字典字符串值要通过“in”相等性检查？ （弦实习实验） 的相关文章

随机推荐

热门标签

在 Python 中，为什么单独的字典字符串值要通过“in”相等性检查？（弦实习实验）

在 Python 中，为什么单独的字典字符串值要通过“in”相等性检查？（弦实习实验）的相关文章