如何创建 python selenium 应用程序及其驱动程序?

2023-12-27

我刚刚开始使用 python 和爬行。我使用selenium和beautifulsoup来解析和抓取页面。我的问题是我是否必须用它制作一个应用程序或将其部署在某些iis服务器上(或我不知道的任何其他方式,比如它是如何工作的)我不知道即使确定它是否以这种方式工作,就像我从移动应用程序方法中用文字表达的那样:)除了我安装的软件包之外,我还需要两个外部东西。 Chrome 驱动程序和 Chrome 二进制文件。 Chrome 驱动程序可用,但 chrome 二进制文件是我安装 chrome 后才获得的。在我用谷歌搜索的少数内容中,我发现我需要使用 docker 来运送它。那么是不是服务器上必须安装chrome才能让这个爬虫工作?如何随应用程序发送该二进制文件?同样,我使用的是linux,所以要部署的服务器必须是linux的?或者我如何实现它。有人可以帮助我创建此爬虫的应用程序并将其提供给其他人吗?谢谢 :)


好吧,我自己尝试了一下,结果成功了。那么服务器只不过是虚拟机,对吗?
因此,您可以做的是将脚本转换为可执行文件,或者不打包而保留它。另外,将 chrome 驱动程序保存在同一目录中,然后运行它python.
另外,如果您使用的是新的虚拟机,那么只需在那里安装 chrome 即可。如果您的虚拟机在 Ubuntu 上运行,那么您可以键入以下命令来安装 chrome。

wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
sudo dpkg -i google-chrome-stable_current_amd64.deb

您可以发表评论以获取进一步的说明。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何创建 python selenium 应用程序及其驱动程序? 的相关文章

随机推荐

  • Python - 从串行端口数据逐行读取到可用的列表中

    我的目标是编写一个代码 该代码将无限期地监听和读取串行端口 每隔几秒就会产生此输出 串口输出 aaaa abcd 0 0 0 printf d n data 0 2387 printf d n data 1 14 9 244 44 108
  • Mongoose 按日期查询

    我想用这样的文档结构查询 mongoDB var ExampleSchema mongoose Schema createdAt type Date default Date now validUntil Date name String
  • 具有自定义高度的自定义 UINavigationBar 会导致 UIBarButtonItem 的位置错误

    我创建了自己的 UINavigationBar 子类 以便启用高于 44 像素的自定义背景 我通过重写这两种方法来做到这一点 void drawRect CGRect rect self backgroundImage drawInRect
  • 使用java对整数进行加密

    我正在尝试使用 java security 和 javax crypto 加密 java 中的一些整数 问题似乎是 Cipher 类仅加密字节数组 我无法直接将整数转换为字节字符串 或者可以吗 做这个的最好方式是什么 我应该将整数转换为字符
  • Angular Fire - 没有 InjectionToken 的提供者(angularfire2.app.options)

    Context 我正在与Ionic 和 Angular Angularfire 和 Firebase 我已经做了一个连接成功 to the Firestore数据库我能够操纵数据 规格 Ionic CLI 6 18 1 Ionic Fram
  • Three.js 不拉伸网格纹理(图像) - 使其覆盖其容器

    我有一个容器 我使用 Three js 和网格应用图像 这就是我将网格应用到场景的方式 this els el el image el querySelector ch image lt size of container image is
  • Keras - 如何使用 KerasRegressor 执行预测?

    我是机器学习新手 我正在尝试处理 Keras 来执行回归任务 我已经实现了这段代码 基于this http machinelearningmastery com regression tutorial keras deep learning
  • 如何执行缺失值的 RMSE?

    我有一个巨大的数据集 有 679 行和 16 列 其中有 30 的缺失值 因此 我决定使用 impute 包中的函数 impute knn 来估算缺失值 并得到一个包含 679 行和 16 列但没有缺失值的数据集 但现在我想使用 RMSE
  • 未为子资源调用 JAX-RS DynamicFilter

    根据文档 应该可以使用DynamicFeature https docs oracle com javaee 7 api javax ws rs container DynamicFeature html对于资源和子资源 作为效果 我希望每
  • 从关闭的 NetworkStream 读取不会导致任何异常

    我正在尝试创建一个相当简单的客户端服务器应用程序 但为了进行通信 我想使用二进制序列化对象 通信本身看起来相当不错 但是当我关闭客户端的流时 服务器并没有真正注意到它并继续尝试读取流 服务器端 Server 类 在单独的线程中执行 监听连接
  • _AppStart.cshtml、PackageManager、WebMatrix

    我认为将 SimpleMembersihp 添加到 MVC4 Web 是一件简单的事情 并非如此 模板化代码 例如 C 非常适合支持它 但 web config 大多是不可知的 缺乏配置任何特定安全机制的元素 我正在关注 Scott All
  • 在 XSL 翻译中更改 XML 文件的命名空间

    所以我有一个输入文件 它在默认命名空间中使用我公司的命名空间 xmlns companyURL 但我希望我的输出文件使用默认命名空间以外的其他内容 xmlns cmp companyURL 所以我使用以下方法构建我的文件cmp命名空间 但我
  • numpy 数组到文件,np.savetxt

    当我使用 np savetxt file txt arr1 arr2 arr3 时 将多个 numpy 数组保存到文件的最佳方法是什么 数组按列保存 而不是按行保存 因此很难导入到 Excel 中 如何以更标准的方式保存数组 Thanks
  • 如何屏蔽文本中的信用卡号掩码?

    我的网站上有一个表格 我的客户用此表格向我发送消息 有时他们会在消息上写下信用卡号码 所以这非常关键 我想屏蔽这些信用卡号码 但卡号当然不会定期出现 示例1 1111222233334444 示例2 4444 3333 2222 1111
  • 更改传单中标记的大小

    我在传单的地图上有一个标记 var centerMarker L marker centerPoint title unselected bindLabel schools i 0 centerMarker on click selectM
  • 为什么应该在 Android 中使用自定义内容提供程序?

    使用自定义内容提供商有哪些优势 为什么这样的内容提供者优于包装 SQL 查询的普通类 内容提供程序可以从其他进程中使用 并且是 Android 上的某些机制 例如全局搜索 所需要的 还有一些可用的类可以帮助您处理内容提供 者 从而节省您管理
  • .NET 6:如何在控制台应用程序启动中使用方法重载?

    NET 6 在控制台应用程序 Startup 类中提供了样板删除功能 我尝试运行这个简单的测试代码 Console WriteLine Hello World static void Test int a int b static void
  • 对数时间并行减少

    Given n部分和 可以在 log2 并行步骤中对所有部分和进行求和 例如 假设有八个线程 有八个部分和 s0 s1 s2 s3 s4 s5 s6 s7 这可以减少log2 8 3像这样的连续步骤 thread0 thread1 thre
  • 我可以让 html.HiddenFor / Html.Hidden 创建一个 id 还是应该手动创建它?

    我这样做 它创建了一个隐藏的输入 但没有id just name 我需要id 我可以让它创建一个id also atm 我这样做 一种更干净的方法是 但除此之外 你现有的方法就可以了 如果您确实想要一个简单的语法 您可以创建一个调用 Hid
  • 如何创建 python selenium 应用程序及其驱动程序?

    我刚刚开始使用 python 和爬行 我使用selenium和beautifulsoup来解析和抓取页面 我的问题是我是否必须用它制作一个应用程序或将其部署在某些iis服务器上 或我不知道的任何其他方式 比如它是如何工作的 我不知道即使确定