在云服务器中运行 python 脚本的最简单方法是什么？

2024-05-05

我有一个网络爬行 python 脚本，需要几个小时才能完成，并且无法在我的本地计算机上完整运行。有没有一种方便的方法可以将其部署到简单的 Web 服务器？该脚本基本上将网页下载到文本文件中。如何最好地实现这一点？谢谢！

既然你说性能是一个问题并且你正在进行网络抓取，那么首先要尝试的是Scrapy http://scrapy.org/框架 - 这是一个非常快速且易于使用的网络抓取框架。scrapyd http://scrapyd.readthedocs.org/en/latest/工具将允许您分发爬行 - 您可以有多个scrapyd服务运行在不同的服务器上，并在每个服务器之间分配负载。看：

分布式抓取 http://doc.scrapy.org/en/latest/topics/practices.html#distributed-crawls
在 Amazon EC2 上运行 Scrapy http://seminar.io/2013/03/26/running-scrapy-on-amazon-ec2/

还有一个Scrapy Cloud http://scrapinghub.com/scrapy-cloud那里的服务：

Scrapy Cloud 搭建高效Scrapy开发的桥梁环境具有强大的、功能齐全的生产环境部署并运行您的爬网。它就像 Scrapy 的 Heroku，不过其他技术将在不久的将来得到支持。它运行于 Scrapinghub 平台的顶部，这意味着您的项目可以扩展需求，根据需要。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在云服务器中运行 python 脚本的最简单方法是什么？的相关文章

翠儿。让流永远运行

我对 tweepy python 库比较陌生我想确保我的流 python 脚本始终在远程服务器上运行因此如果有人能够分享如何实现这一目标的最佳实践那就太好了现在我正在这样做 if name main while True try
为什么 .setGeometry() 不改变 QWidget 实例的大小？

我想使用 QWidget 更改 QPushButton 的大小 setGeometry https doc qt io qtforpython 5 PySide2 QtWidgets QWidget html PySide2 QtWidge
在 Numpy 中切片后确定结果数组的形状

我很难理解在 numpy 中切片后如何确定结果数组的形状例如我使用以下简单代码 import numpy as np array np arange 27 reshape 3 3 3 slice1 array 1 2 1 slice2
python - 是否可以扩展 xml-rpc 可以序列化的事物集？

我看到几个问题询问如何发送numpy ndarray通过 xml rpc 调用这不能开箱即用因为正如 xml rpc 中所述docs https docs python org 2 library xmlrpclib html 有一组固
在python中将文本文件解析为列表

我对 Python 完全陌生我正在尝试读取包含单词和数字组合的 txt 文件我可以很好地读取 txt 文件但我正在努力将字符串转换为我可以使用的格式 import matplotlib pyplot as plt import num
如何在没有 openshift 的情况下托管 Django localhost 应用程序？

我已经在本地主机中创建了一个 Django 应用程序现在我需要在互联网上托管我已经尝试过开档 https www openshift com and 任何地方的Python https www pythonanywhere com也但
Paramiko - 使用私钥连接 - 不是有效的 OPENSSH 私钥/公钥文件

我正在尝试找到解决方案但无法理解我做错了什么在我的 Linux 服务器上我运行了以下命令 ssh keygen t rsa 这产生了一个id rsa and id rsa pub file 然后我将它们复制到本地并尝试运行以下代码 s
Pandas重置索引未生效[重复]

这个问题在这里已经有答案了我不确定我在哪里误入歧途但我似乎无法重置数据帧上的索引当我跑步时test head 我得到以下输出正如您所看到的数据帧是一个切片因此索引超出范围我想做的是重置该数据帧的索引所以我跑test rese
sudo pip install python-Levenshtein 失败，错误代码 1

我正在尝试在 Linux 上安装 python Levenshtein 库但每当我尝试通过以下方式安装它时 sudo pip install python Levenshtein 我收到此错误命令 usr bin python c 导入
创建一个类似于 Tkinter 的表

我希望创建类似于 Tkinter 中的表格的东西但它不一定是这样的例如我想创建标题 Name1 Name2 Value 并在每个标题下面有几个空白行然后我希望稍后用我计算的值或名称的字符串值填充这些行因此是标签对于 Name2
在径向（树）网络x图中查找末端节点（叶节点）

给定下图是否有一种方便的方法来仅获取末端节点我所说的端节点是指那些具有一个连接边的到节点我认为这些有时被称为叶节点 G nx DiGraph fromnodes 0 1 1 1 1 1 2 3 4 5 5 5 7 8 9 10 ton
如何列出 python PDB 中的当前行？

在 perl 调试器中如果重复列出离开当前行的代码段可以通过输入命令返回到当前行点我无法使用 python PDB 模块找到任何类似的东西如果我list如果我自己离开当前行并想再次查看它似乎我必须记住当前正在执行的行号对我来说
无法截取宽度为 0 的屏幕截图

我正在尝试截取 Bootstrap 模态内元素的屏幕截图经过一番努力我终于想出了这段代码 driver get https enlinea sunedu gob pe driver find element by xpath div c
张量流：注册 numpy bfloat16 扩展

正如我所见 tensorflow 中有 bfloat16 的 numpy 扩展 https github com tensorflow tensorflow blob 24ffe9f729160a095a5cab8f592392018280
为什么我们应该在 def __init__(self, n) -> None: 中使用 -> ？

我们为什么要使用 gt in def init self n gt None 我读了以下摘录来自 PEP 484 https www python org dev peps pep 0484 the meaning of annotatio
全局变量是 None 而不是实例 - Python

我正在处理Python 中的全局变量代码应该可以正常工作但是有一个问题我必须使用全局变量作为类的实例Back 当我运行应用程序时它说 back is None 这应该不是真的因为第二行setup 功能 back Back Back
如何在sphinx中启用数学？

我在用sphinx http sphinx pocoo org index html与pngmath http sphinx pocoo org ext math html module sphinx ext pngmath扩展来记录我的代
如何禁止 celery 中的 pickle 序列化

Celery 默认使用 pickle 作为任务的序列化方法如中所述FAQ http ask github com celery faq html isn t using pickle a security concern 这代表一个安全漏
TypeError：无法使用抽象方法实例化抽象类 <...>

这是我的代码 from abc import ABC from abc import abstractmethod class Mamifiero ABC docstring for Mamifiero def init self self
来自 django 教程 was_published_recently.admin_order_field = 'pub_date'

From Django 教程 https www jetbrains com help pycharm 2017 1 creating and running your first django project html d28041e21

随机推荐

在 package.json 中声明时 Reactify 转换未运行

我正在尝试将reactify 转换与browserify 和gulp 结合使用这个 gulp 任务有效 return browserify paths node modules app scripts entries app script
如何将json从android发送到php？

为了将 json 从 android 发布到 php 我使用了 Volley 库StringRequest目的 StringRequest sr new StringRequest Request Method POST url new R
如何按日期属性对对象数组进行排序？

假设我有一个由几个对象组成的数组 var array id 1 date Mar 12 2012 10 00 00 AM id 2 date Mar 8 2012 08 00 00 AM 如何按日期元素从最接近当前日期和时间的日期开始对该数
require未定义nodejs

尝试使用此 smartsheet api http smartsheet platform github io api docs javascript node js sample code http smartsheet platform
具有多个参数的 JavaScript 函数

我有一个将数组作为输入的函数我如何修改它以使用变量参数和数组例如我想要arrSum 1 2 3 arrSum 1 2 3 回来true即两者都应该返回 6 const arrSum arr gt arr reduce a b gt a
处理 Cloud Run 容器关闭

在编写 Cloud Run 服务时我们开发一个容器来监听PORT用于处理传入 HTTP 请求的环境变量容器的实例会启动并处理请求然后在完成原始请求后存活一段时间以防有更多请求到达如果没有进一步的请求 GCP关闭容器我在这方面有一
查看登录设备

我想查看Log在设备上即System out println 我可以查看DDMS但如何在运行时在设备屏幕上查看APK文件还有一个适用于 Android 的 Logcat 应用程序 code google com p android ra
如何安装适用于 Windows C++ 的最新版本 OpenGL？

我正在使用 Visual Studio 2010 运行 Windows 7 包含的 OpenGL 版本 include 是版本 1 1 我希望使用合理的当前版本某种版本 3 或 4 我需要做什么才能达到该状态 OpenGL SDK 页面位
在 x86 Intel VT-X 非根模式下，是否可以在每个指令边界传递中断？

除了不将中断传送到虚拟处理器的某些正常指定条件 cli if 0 等之外客户机中的所有指令实际上都是可中断的吗也就是说当传入的硬件中断先传递给 LAPIC 然后传递给处理器时据说会发生一些内部魔法将其转换为虚拟中断给来宾使用虚
Java 拖放图像并在拖动时显示图像缩略图

我有一个带有图像节点的网格布局我想在我的应用程序中添加 dnd 功能例如当我将图像节点拖放到目标 JPanel 时进行一些操作例如以原始大小显示删除等我已经实现了这与一种使用 Transferhandler 的方法和一种使用
如何在 Jboss 7.1 中配置简单身份验证

我正在从事由以下人员编写的项目纯jsps 脚本不使用任何框架 jboss版本 jboss as 7 1 0 Final 我现在正在尝试在其上添加简单的身份验证因此当用户尝试浏览 jsp 时比如说 http localhost myC
只在一个文件上应用 git merge stategy 吗？

当将一个分支合并到另一个分支时可以定义合并策略例如 git merge release X ours 当将发布分支中的内容合并到当前分支时这会在全局范围内应用我们的策略是否可以仅对一个特定文件应用此策略例如 git merge
如何将javascript变量放入php echo [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我想将 JavaScript 变量添
模拟器的窗口比手机屏幕太大

我做了一个小例子来测试我的Android环境当我在AVD上启动执行时它看起来太大了就好像它是平板电脑屏幕一样如何调整大小使其看起来像手机屏幕 Android Studio 2 2更新后就没有了Emulator Tab in Edit
Firefox 中缺少表格边框

我有一个包含数据的表格当我在 Firefox 中查看它时某些边框没有显示请参阅随附的屏幕截图在任何其他浏览器中都不会发生这种情况在 Firefox IE Safari 和 Chrome 中测试知道为什么以及如何解决它吗我使用样
Tuple.Create() 与 new Tuple

考虑以下表达式 new Tuple
iOS CorePlot如何安装

我正在尝试在我的一个 iOS 项目中使用 CorePlot 但即使按照说明并在网上查找后我仍无法正确安装该框架我觉得文档没有发展不再描述安装框架的正确方法我跟着这些说明 https code google com p core pl
yup - 逗号后允许两位数字，小数的最小值和最大值

const validationSchema yup object amount yup number positive min 5 minimum 5 max 10 maximum 10 如何添加对逗号后两位数字的小数的验证像这样解决
资产预编译正常，但尝试获取文件时出现 404

好的编译我的资产工作正常但是当我运行时 thin start e production 我的 javascript 或 css 都没有加载我的浏览器也取消了获取我的资产的请求我不确定为什么会这样但我怀疑是因为它认为对它们进行了 4
在云服务器中运行 python 脚本的最简单方法是什么？

我有一个网络爬行 python 脚本需要几个小时才能完成并且无法在我的本地计算机上完整运行有没有一种方便的方法可以将其部署到简单的 Web 服务器该脚本基本上将网页下载到文本文件中如何最好地实现这一点谢谢既然你说性能是一个问题

在云服务器中运行 python 脚本的最简单方法是什么？

在云服务器中运行 python 脚本的最简单方法是什么？ 的相关文章

随机推荐

热门标签

在云服务器中运行 python 脚本的最简单方法是什么？的相关文章