字符串性能 - Windows 10 下的 Python 2.7 与 Python 3.4 对比 Ubuntu


Use case
一个简单的函数,用于检查特定字符串是否在另一个字符串中的位置为 3 的倍数(请参阅此处现实世界的例子 https://en.wikipedia.org/wiki/Stop_codon,在 DNA 序列中寻找终止密码子)。

sliding_window:取长度为 3 的字符串与搜索字符串进行比较,如果相同则向前移动 3 个字符。



  • Python 2.7: 最初的sliding_window使用该函数可以将函数提高约 39 倍incremental_startWindows 10 上的 Python2.7 中。Ubuntu 上的性能改进略有下降,约 34 倍、约 37 倍、约 18 倍(VM、AWS、本机),但仍在同一范围内。
  • Python 3.4: sliding_window比 Python2.7 慢(在 Windows 上为 1.8 倍,在所有 Ubuntu 上为 1.4 倍或 1.5 倍),但是incremental_start在所有 Ubuntu 上性能下降了 4、5、1.7 倍(VM、AWS、本机),而在 Windows 上几乎没有变化。
  • Windows 与 Ubuntu
    Python2.7:虚拟化的 Ubuntu 实现这两个功能所需的时间更少(约 20-30%),原生 Ubuntu 的速度慢了大约 25%incremental_start, while sliding_window速度提高了 40%。
    Python3: the sliding_window函数完成所需的时间更少 (~50%),而incremental_start速度变慢约 2-3 倍。


  • 是什么导致 Python 2 与 Python 3 在 Linux 和 Windows 上的性能差异?
  • 如何预测这种行为并调整代码以获得最佳性能?


import timeit

text = 'ATG' * 10**6
word = 'TAG'

def sliding_window(text, word):
    for pos in range(0, len(text), 3):
        if text[pos:pos + 3] == word:
            return False
    return True

def incremental_start(text, word):
    start = 0
    while start != -1:
        start = text.find(word, start + 1)
        if start % 3 == 0:
            return False
    return True

#sliding window
time = timeit.Timer(lambda: sliding_window(text, word), setup='from __main__ import text, word').timeit(number=10)
print('%3.3f' % time)

#incremental start
time = timeit.Timer(lambda: incremental_start(text, word), setup='from __main__ import text, word').timeit(number=500)
print('%3.3f' % time)


Ubuntu vs Windows    VM     AWS    Native   
Python2.7-Increment  79%    73%    126% 
Python2.7-Sliding    70%    70%    60%                  
Python3.4-Increment  307%   346%   201% 
Python3.4-Sliding    54%    59%    48%  

Py2 vs 3    Windows    VM    AWS    Native
Increment   105%       409%  501%   168%
Sliding     184%       143%  155%   147%

Absolute times in seconds
                 Win10   Ubuntu  AWS     Native
Py2.7-Increment  1.759   1.391   1.279   2.215 
Py2.7-Sliding    1.361   0.955   0.958   0.823 

Py3.4-Increment  1.853   5.692   6.406   3.722 
Py3.4-Sliding    2.507   1.365   1.482   1.214 

Windows 10:本机 Windows、32 位 Python 3.4.3 或 2.7.9、i5-2500、16GB RAM
Ubuntu虚拟机:14.04,运行在Windows主机上,64位Python 3.4.3,Python 2.7.6,4核,4GB RAM
AWS:14.04、AWS 微实例、64 位 Python 3.4.3、Python 2.7.6
原生 Ubuntu:14.04、64 位 Python 3.4.3、Python 2.7.6、i5-2500、16GB 内存 [与 Win10 机器相同]


正如英加兹所建议的xrange and bytes使用Python3.4后,性能略有提高,但在Ubuntu上性能仍然大幅下降。罪魁祸首似乎是find当 Ubuntu 和 Py3.4 组合时,速度要慢得多(与从源代码编译的 Py3.5 相同)。这似乎与 Linux 风格相关,在 Debian 上 Py2.7 和 Py3.4 表现相同,在 RedHat 上 Py2.7 比 Py3.4 快得多。
为了更好的比较,Py3.4现在在Windows10和Ubuntu上的64位中使用。 Win10上仍然使用Py27。

import timeit, sys

if sys.version_info >= (3,0):
    from builtins import range as xrange

def sliding_window(text, word):
    for pos in range(0, len(text), 3):
        if text[pos:pos + 3] == word:
            return False
    return True

def xsliding_window(text, word):
    for pos in xrange(0, len(text), 3):
        if text[pos:pos + 3] == word:
            return False
    return True

def incremental_start(text, word):
    start = 0
    while start != -1:
        start = text.find(word, start + 1)
        if start % 3 == 0:
            return False
    return True

text = 'aaa' * 10**6
word = 'aaA'
byte_text = b'aaa' * 10**6
byte_word = b'aaA'

time = timeit.Timer(lambda: sliding_window(text, word), setup='from __main__ import text, word').timeit(number=10)
print('Sliding, regular:      %3.3f' % time)

time = timeit.Timer(lambda: incremental_start(text, word), setup='from __main__ import text, word').timeit(number=500)
print('Incremental, regular:  %3.3f' % time)

time = timeit.Timer(lambda: sliding_window(byte_text, byte_word), setup='from __main__ import byte_text, byte_word').timeit(number=10)
print('Sliding, byte string:  %3.3f' % time)

time = timeit.Timer(lambda: incremental_start(byte_text, byte_word), setup='from __main__ import byte_text, byte_word').timeit(number=500)
print('Incremental, bytes:    %3.3f' % time)

time = timeit.Timer(lambda: xsliding_window(byte_text, byte_word), setup='from __main__ import byte_text, byte_word').timeit(number=10)
print('Sliding, xrange&bytes: %3.3f' % time)

time = timeit.Timer(lambda: text.find(word), setup='from __main__ import text, word').timeit(number=1000)
print('simple find in string: %3.3f' % time)

Win10-py27  Wi10-py35   VM-py27  VM-py34
1.440       2.674       0.993    1.368 
1.864       1.425       1.436    5.711 
1.439       2.388       1.048    1.219 
1.887       1.405       1.429    5.750 
1.332       2.356       0.772    1.224 
3.756       2.811       2.818    11.361 


A. range2.7 中是type 'list',3.4 中的范围是class 'range'

B. 'ATG' * 10**6 在 2.7 中是字节字符串,在 3.4 中是 unicode 字符串

如果满足以下条件,您可以尝试生成更兼容的结果:a) 对 2.7 变体使用 xrange,b) 使用bytes两个示例中的字符串:b'ATG'或两个示例中的 unicode 字符串。


我怀疑性能差异源于主要因素:a) 32 位与 64 位,b) C 编译器。


  1. ActiveState Python 2.7.10 32位
  2. ActiveState Python 2.7.10 64位
  3. 官方发行版Python 2.7.11 32位
  4. 官方发行版Python 2.7.11 64位
  5. Python 2.7.6 64位上Windows 10 上的 Ubuntu https://blogs.windows.com/buildingapps/2016/03/30/run-bash-on-ubuntu-on-windows/
  6. pypy-5.1.1-win32



  • 64位版本会比较慢
  • ActiveState会快一点
  • PyPy 速度更快
  • Windows 10 上的 Ubuntu - ???


Test                    as32b   as64b   off32b   off64b  ubw64b  pypy5.1.1
Sliding, regular:       1.232   1.230   1.281    1.136   0.951   0.099  
Incremental, regular:   1.744   1.690   2.219    1.647   1.472   2.772
Sliding, byte string:   1.223   1.207   1.280    1.127   0.926   0.101
Incremental, bytes:     1.720   1.701   2.206    1.646   1.568   2.774
Sliding, xrange&bytes:  1.117   1.102   1.162    0.962   0.779   0.109
simple find in string:  3.443   3.412   4.607    3.300   2.487   0.289

Windows 10 上的获胜者是……由 GCC 4.8.2 为 Linux 编译的 Ubuntu Python!


32 vs 64:变得无关紧要。




