我想用Python编写一个脚本,它可以从数据库中获取url,并同时下载网页以加快速度,而不是等待每个页面一个接一个地下载。
根据这个线程,Python 不允许这样做,因为称为全局解释器锁这可以防止多次启动相同的脚本。
在投入时间学习 Twisted 框架之前,我想确保没有更简单的方法来完成我上面需要做的事情。
感谢您的任何提示。
不用担心吉尔。在你的情况下,这并不重要。
做你想做的事情的最简单方法是创建线程池,使用线程模块和线程池实现之一ASPN。该池中的每个线程都可以使用httplib下载您的网页。
另一种选择是使用PyCURL模块——它本身支持并行下载,因此您不必自己实现。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)