首先,我无法重现与您在我的 Linux 机器上看到的性能差异几乎一样大的性能差异。我一直看到线程版本大约需要 20-25 秒,而线程版本大约需要 24-34 秒。asyncio
版本。
现在,为什么是asyncio
慢点?有几件事促成了这一点。首先,asyncio
版本必须按顺序打印,但线程版本则不需要。打印是 I/O,因此可以在打印时释放 GIL。这意味着两个或更多线程可能会同时打印,尽管实际上这种情况可能不会经常发生,并且可能不会对性能产生太大影响。
其次,也是更重要的一点是,the asyncio
的版本getaddrinfo
实际上是只是打电话socket.getaddrinfo in a ThreadPoolExecutor https://hg.python.org/cpython/file/6d91c4f40ba1/Lib/asyncio/base_events.py#l461:
def getaddrinfo(self, host, port, *,
family=0, type=0, proto=0, flags=0):
if self._debug:
return self.run_in_executor(None, self._getaddrinfo_debug,
host, port, family, type, proto, flags)
else:
return self.run_in_executor(None, socket.getaddrinfo,
host, port, family, type, proto, flags)
这是使用默认的ThreadPoolExecutor
为了这,只有五个线程 https://hg.python.org/cpython/file/6d91c4f40ba1/Lib/asyncio/base_events.py#l40*:
# Argument for default thread pool executor creation.
_MAX_WORKERS = 5
对于这个用例来说,这远没有您想要的那么多并行性。为了让它表现得更像threading
版本,你需要使用ThreadPoolExecutor
有 1000 个线程,通过将其设置为默认执行器loop.set_default_executor
:
loop = asyncio.get_event_loop()
loop.set_default_executor(ThreadPoolExecutor(1000))
coroutines = asyncio.wait([getaddr(loop, i+site) for i in create_host(char)])
loop.run_until_complete(coroutines)
现在,这将使行为更加等同于threading
,但现实是你真的没有使用异步 I/O - 你只是使用threading
使用不同的 API。所以你在这里能做的最好的就是与threading
例子。
最后,您并没有在每个示例中真正运行等效的代码 -threading
版本正在使用一个工作池,它们共享一个queue.Queue
,而asyncio
version 正在为 url 列表中的每个项目生成一个协程。如果我做asyncio
版本使用asyncio.Queue
和协程池,除了删除打印语句和创建更大的默认执行器之外,我在两个版本中获得了基本相同的性能。这是新的asyncio
code:
import asyncio
import string
import time
from concurrent.futures import ThreadPoolExecutor
start = time.time()
def create_host(char):
for i in char:
yield i
for i in create_host(char):
if len(i)>1:
return False
for c in char:
yield c + i
char = string.digits + string.ascii_lowercase
site = '.google.com'
@asyncio.coroutine
def getaddr(loop, q):
while True:
url = yield from q.get()
if not url:
break
try:
res = yield from loop.getaddrinfo(url,80)
except:
pass
@asyncio.coroutine
def load_q(loop, q):
for host in create_host(char):
yield from q.put(host+site)
for _ in range(NUM):
yield from q.put(None)
NUM = 1000
q = asyncio.Queue()
loop = asyncio.get_event_loop()
loop.set_default_executor(ThreadPoolExecutor(NUM))
coros = [asyncio.async(getaddr(loop, q)) for i in range(NUM)]
loop.run_until_complete(load_q(loop, q))
loop.run_until_complete(asyncio.wait(coros))
end = time.time()
print(end-start)
以及每个的输出:
dan@dandesk:~$ python3 threaded_example.py
20.409344911575317
dan@dandesk:~$ python3 asyncio_example.py
20.39924192428589
但请注意,由于网络原因,存在一些变化。两者有时都会比这慢几秒钟。
* 注意,在Python 3.8及以上版本中,默认ThreadPoolExecutor
创造min(32, os.get_cpu_count() + 4)
线程。根据您的机器有多少个核心,这可能会导致创建足够的线程以提高性能asyncio
为了更紧密地匹配threading
例子。你必须测试一下才能看到。