对于超过 64 个字符的字符串，什么会影响 Python 字符串比较性能？

2024-03-01

我正在尝试评估比较两个字符串是否会随着长度的增加而变慢。我的计算表明比较字符串应该花费摊销常数时间，但我的 Python 实验产生了奇怪的结果：

这是字符串长度（1 到 400）与时间（以毫秒为单位）的关系图。自动垃圾收集已禁用，并且gc.collect在每次迭代之间运行。

我每次比较 100 万个随机字符串，按如下方式计算匹配项。在取所有测量时间的最小值之前，该过程会重复 50 次。

for index in range(COUNT):
    if v1[index] == v2[index]:
        matches += 1
    else:
        non_matches += 1

长度 64 附近突然增加的原因可能是什么？

Note：以下代码片段可用于尝试重现问题，假设v1 and v2是两个长度随机字符串的列表nCOUNT 是它们的长度。

timeit.timeit("for i in range(COUNT): v1[i] == v2[i]",
  "from __main__ import COUNT, v1, v2", number=50)

进一步说明：我做了两个额外的测试：将字符串与is代替==完全抑制了该问题，性能对比约为210ms/1M。由于已经提到了实习，我确保在每个字符串后面添加一个空格，这应该可以防止实习；这不会改变任何事情。那除了实习还有别的事吗？

Python can“实习生”短字符串；将它们存储在特殊的缓存中，并重新使用该缓存中的字符串对象。

然后比较字符串时，它首先测试它是否是相同的指针（例如内部字符串）：

if (a == b) {
    switch (op) {
    case Py_EQ:case Py_LE:case Py_GE:
        result = Py_True;
        goto out;
// ...

仅当指针比较失败时，它才会使用大小检查并memcmp比较字符串。

驻留通常仅针对标识符（函数名称、参数、属性等）进行，但不适用于运行时创建的字符串值。

另一个可能的罪魁祸首是字符串常量；代码中使用的字符串文字在编译时存储为常量并在整个过程中重复使用；同样，只创建一个对象，并且对这些对象的身份测试速度更快。

对于不相同的字符串对象，Python 会测试长度是否相等、第一个字符是否相等，然后使用memcmp()内部 C 字符串上的函数。如果你的字符串是not被拘留或以其他方式重复使用相同的对象，所有其他速度特性都归结为memcmp()功能。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

对于超过 64 个字符的字符串，什么会影响 Python 字符串比较性能？的相关文章

如何生成给定范围内的回文数列表？

假设范围是 1 X 120 这是我尝试过的 gt gt gt def isPalindrome s check if a number is a Palindrome s str s return s s 1 gt gt gt def ge
Python 多处理示例不起作用

我正在尝试学习如何使用multiprocessing但我无法让它发挥作用这是代码文档 http docs python org 2 library multiprocessing html from multiprocessing imp
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

我有一个清单 things A1 B2 C3 我有一个 pandas 数据框其中有一列包含用分号分隔的值某些行将包含与上面列表中的一项的匹配它不会是完美的匹配因为它在其中包含字符串的其他部分该列例如该列中的一行可能有哇这里
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
在pyyaml中表示具有相同基类的不同类的实例

我有一些单元测试集希望将每个测试运行的结果存储为 YAML 文件以供进一步分析 YAML 格式的转储数据在几个方面满足我的需求但测试属于不同的套装结果有不同的父类这是我所拥有的示例 gt gt gt rz shorthand for
Abaqus 将曲面转化为集合

我一直试图在模型中找到两个表面的中心参见照片但未能成功它们是元素表面面查询中没有选项可以查找元素表面的中心只能查找元素集的中心找到节点集的中心也很好但是我的节点集没有出现在工具 gt 查询 gt 质量属性选项中而且我找不到
Python：字符串不会转换为浮点数[重复]

这个问题在这里已经有答案了我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
ExpectedFailure 被计为错误而不是通过

我在用着expectedFailure因为有一个我想记录的错误我现在无法修复但想将来再回来解决我的理解expectedFailure是它会将测试计为通过但在摘要中表示预期失败的数量为 x 类似于它如何处理跳过的 tets 但是当我
循环中断打破tqdm

下面的简单代码使用tqdm https github com tqdm tqdm在循环迭代时显示进度条 import tqdm for f in tqdm tqdm range 100000000 if f gt 100000000 4 b
如何改变Python中特定打印字母的颜色？

我正在尝试做一个简短的测验并且想将错误答案显示为红色欢迎来到我的测验您想开始吗是的祝你好运法国的首都是哪里法国随机答案不正确的答案我正在尝试将其显示为红色我的代码是 print Welcome to my Quiz be
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
在python中，如何仅搜索所选子字符串之前的一个单词

给定文本文件中的长行列表我只想返回紧邻其前面的子字符串例如单词狗描述狗的单词例如假设有这些行包含狗 hotdog big dog is dogged dog spy with my dog brown dogs 在这种情况下期望
协方差矩阵的对角元素不是 1 pandas/numpy

我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar
如何修复：“无法解析类型 java.lang.CharSequence。它是从所需的 .class 文件间接引用的”消息？ [复制]

这个问题在这里已经有答案了我正在尝试使用这个字符串 amountStr amountStr replace replace replace 但我收到一条错误消息我知道我收到的错误消息是因为我刚刚发布的字符串已过时所以我想知道该字符串的
PyAudio ErrNo 输入溢出 -9981

我遇到了与用户相同的错误 Python 使用 Pyaudio 以 16000Hz 录制音频时出错 https stackoverflow com questions 12994981 python error audio recording

随机推荐

NodeJS：如何调试“检测到 EventEmitter 内存泄漏。添加了 11 个侦听器”

如何调试引发此错误的应用程序 node warning possible EventEmitter memory leak detected 11 listeners added Use emitter setMaxListeners to
是否可以在 Service 类中使用 AsyncTask？

一切都在标题中官方文件中指出Note that services like other application objects run in the main thread of their hosting process而AsyncTa
当应用于表格单元格时，如何使内联块一致地呈现？

我有一个简单的 HTML 表格我想在每个现代浏览器 IE9 最新的 FF Chrome Safari 上一致地呈现它如果我仅将宽度和 display inline block 应用于表格单元格 FireFox 4 和 Chrome 将允
在 phpMyAdmin 中查看 Blob 的内容

Sorry for the Noob Question but what does the circled button mean and how can I view the content of a blob source rigel2
elasticsearch NEST 客户端，当搜索关键字包含连字符时，仍会分析属性“not_analyzed”

我有一个名为 IndexModel 的类 public class IndexModel ElasticProperty Index FieldIndexOption NotAnalyzed Store true public string
如何在 MacOS 下的 Julia 中使用 set precision？

我是这个的作者question https stackoverflow com questions 76023305 how to use setprecision in julia Bogumi Kami ski 帮助我解决了这个问题但
.\key.p12：打开失败：ENOENT（没有这样的文件或目录）

在我的 Android 应用程序中我正在访问 Google 云存储我已经生成了私钥xxxxxxkey p12 我已将密钥文件放在资产文件夹中但在运行项目时它不会打开 key p12 文件我已经尝试将其放在资产文件夹之外仍然没有结
继承位于另一个文件中的css类

我正在使用引导程序并且更少我希望我的一个类继承自引导类问题是我正在使用 CDN 的引导程序并且不想在本地有任何引导程序文件是否可以使用 less 从 cdn 文件导入 css 类或继承文件中没有的类您无需安装任何东西只需下载您
Android LiveData/StateFlow 列表项属性更新问题

所以我正在更新我的RecylerView with StateFlow
IE 的 document.selection.createRange 不包含前导或尾随空白行

我正在尝试从文本区域中提取确切的选择和光标位置与往常一样在大多数浏览器中容易的事情在 IE 中却并不容易我正在使用这个 var sel document selection createRange var temp sel dupli
使用 Apps 脚本将链接表从 Google Sheets 插入 Google Docs

我想使用 Google Apps 脚本来做从 Google 表格转换为 Google 文档我知道这很容易手动完成Copy gt Paste gt 链接到电子表格但是有没有办法使用 Apps 脚本以编程方式执行此操作此功能目前不可用尽
如果用户登录，Angular 2 重定向

我有这样的路线 const routes Routes path redirectTo login pathMatch full path login component LoginComponent path dashboard comp
从 Android 中的 google plus 登录的登录用户个人资料中检索电话号码

我需要在登录 Android 后从 google plus 登录的用户个人资料中检索电话号码目前通过参考https developers google com mobile android people retrieve profile
修改firefox扩展中请求的post数据

我试图捕获一个http请求更改它的一些post参数并发送修改后的请求我尝试使用上传流的setData方法来修改请求但发送的原始请求相同我在 http on modify request 上执行以下代码 rewind the requ
我们如何获得顶部有凹口的屏幕尺寸

有一些设备例如华为 p20 运行 android 8 8 1 内置了notch在顶端目前获取屏幕大小的方法是 Display display getWindow getWindowManager getDefaultDisplay Po
GraalVM 无法使用数据库连接

我正在尝试使用 Graalvm 构建本机映像但每次尝试使用 mvn gluonfx build 并在项目中使用数据库连接构建它时都会出现错误例如 H2 DB 正常运行就可以了无需任何数据库连接本机映像已成功构建这是pom文件的代
尝试在所有 Excel 工作表上运行代码

我正在尝试在一个 Excel 文件中的所有工作表上运行此代码但这不起作用它仅合并第一张纸上的单元格这是我的代码 Sub MergeColumns Dim ws As Worksheet For Each ws In ActiveWor
如何从代码中获取 ComboBox 的 SelectedValue？

我正在尝试构建类似的东西TLookupComboBox使用LiveBindings 我已经放置了一个普通的TComboBox在 VCL 形式上我还有一个数据集其中一些行具有两个字段id and text 然后我使用 LiveBindin
JavaFX 在鼠标悬停时显示一个窗格

我有一个JavaFX我想展示的应用程序pane on mousehover事件在Button 我期望的输出类似于 Windows 任务栏预览样式将鼠标悬停在TaskBar图标预览窗格显示在顶部如下所示我怎样才能使用JavaFX达到这种
对于超过 64 个字符的字符串，什么会影响 Python 字符串比较性能？

我正在尝试评估比较两个字符串是否会随着长度的增加而变慢我的计算表明比较字符串应该花费摊销常数时间但我的 Python 实验产生了奇怪的结果这是字符串长度 1 到 400 与时间以毫秒为单位的关系图自动垃圾收集已禁用并且gc c

对于超过 64 个字符的字符串，什么会影响 Python 字符串比较性能？

对于超过 64 个字符的字符串，什么会影响 Python 字符串比较性能？ 的相关文章

随机推荐

热门标签

对于超过 64 个字符的字符串，什么会影响 Python 字符串比较性能？的相关文章