使用 python、requests 和 bs4 进行亚马逊价格网络抓取

2023-12-29

我有一个关于网络抓取亚马逊文章价格的问题。我试图获取一篇文章的价格，但不幸的是并不总是有效。我随机收到状态代码 503（服务器不可用）。我可以用一个 while 循环来解决这个问题，如果状态码 == 200 则结束。我想了解服务器不可用的主要问题，这样我也许可以解决主要问题而不是解决它。到目前为止，该问题仅出现在亚马逊上。

这是我的 10 次测试代码。请求通常会失败 2/10 次

import requests
from bs4 import BeautifulSoup


for i in range(10):
    page = requests.get("https://www.amazon.de/Bloodborne-Game-Year-PlayStation-4/dp/B016ZU4FIQ/ref=sr_1_3?ie=UTF8&qid=1519566642&sr=8-3&keywords=bloodborne+ps4")

    if page.status_code != 200:
        print("Error status code: " + str(page.status_code))
        continue

    soup = BeautifulSoup(page.content, "html.parser")

    price = soup.find(id="priceblock_ourprice", class_="a-size-medium a-color-price")


    price_string = price.get_text()

    print(price_string)

尝试下面的脚本。应该可以给你价格。

import requests
from bs4 import BeautifulSoup

URL = "https://www.amazon.de/Bloodborne-Game-Year-PlayStation-4/dp/B016ZU4FIQ/ref=sr_1_3?ie=UTF8&qid=1519566642&sr=8-3&keywords=bloodborne+ps4"
page = requests.get(URL,headers={"User-Agent":"Defined"})
soup = BeautifulSoup(page.content, "html.parser")
price = soup.find(id="priceblock_ourprice").get_text()
print(price)

Output:

EUR 34,99

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

beautifulsoup

pythonrequests

使用 python、requests 和 bs4 进行亚马逊价格网络抓取的相关文章

熊猫按 n 最大总和分组

我正在尝试使用groupby nlargest and sum在 Pandas 中一起运行但在运行时遇到困难 State County Population Alabama a 100 Alabama b 50 Alabama c 40
如何把父母和孩子联系起来？

有两个简单的类一个只有parent属性并且两者兼而有之parent and children属性这意味着同时具备两者的人parent and children继承自唯一的parent 这是只有parent属性我们就这样称呼它吧Chi
为什么 Mypy 在 __init__ 中分配已在类主体中进行类型提示的属性时不给出键入错误？

这是我的示例 python 文件 class Person name str age int def init self name age self name name self age age p Person 5 5 但当我跑步时myp
如何通过 python 中的函数运行列表？

我试图通过我创建的函数运行我的列表但不断收到错误我不知道出了什么问题温度 F temp f 19 21 21 21 23 功能 def fahrToCelsius tempFahrenheit return tempFahrenhei
pyCUDA无法打印结果

最近我使用 pip 为我的 python3 4 3 安装 pyCUDA 但我在测试示例代码时发现 https documen tician de pycuda tutorial html getting started https doc
Python：json_normalize pandas 系列给出 TypeError

我在 pandas 系列中有数万行像这样的 json 片段df json IDs lotId 1 Id 123456 date 2009 04 17 bidsCount 2 IDs lotId 2 Id 123456 date 2009 0
Python Selenium 打印另存为 PDF 等待文件名输入

我正在尝试通过打印对话框将网站另存为 PDF 我的代码允许我另存为pdf 但要求我输入文件名我不知道如何将文件名传递到弹出框附上我的代码 import time from selenium import webdriver import
使用 Pandas 从 csv 文件读取标题信息

我有一个包含 14 行标题的数据文件在标头中有经纬度坐标和时间的元数据我目前正在使用 pandas read csv filename delimiter header 14 读取文件但这只是获取数据我似乎无法获取元数据有人知道
如何用函数记录一个文件？

我有一个带有函数 lib py 但没有类的python 文件每个函数都有以下样式 def fnc1 a b c This fonction does something param a lalala type a str param b
在 Python 中从 Excel 复制 YEARFRAC() 函数

因此我使用 python 来自动执行一些必须在 Excel 中执行的重复任务我需要做的计算之一需要使用yearfrac 这在Python中被复制了吗 I found this https lists oasis open org arc
Pandas 字典键到列[重复]

这个问题在这里已经有答案了我有一个像这样的数据框 index column1 e1 u c680 5 u c681 1 u c682 2 u c57 e2 u c680 6 u c681 2 u c682 1 u c57 e3 u c68
在 django 中导入设置时出现奇怪的错误

我有很多项目在 ubuntu 中使用 python2 7 和 virtualenv virtualenvwrapper 工作在我的工作中一些开发人员使用 macosx 和 windows 通常我像往常一样创建项目 django admi
哪种方式最适合Python工厂注册？

这是一个关于这些方法中哪一种被认为是最有效的问题 Pythonic 我不是在寻找个人意见而是在寻找惯用的观点我的背景不是Python 所以这会对我有帮助我正在开发一个可扩展的 Python 3 项目这个想法类似于工厂模式只不过它是
如何将 URL 添加到 Telegram Bot 的 InlineKeyboardButton

我想制作一个按钮可以从 Telegram 聊天中在浏览器中打开 URL 外部超链接目前我只开发了可点击的操作按钮 update message reply text Subscribe to us on Facebook and Te
在Python中使用pil读取tif图像时出现值错误？

我必须读取尺寸的tif图像2200 2200并输入 uint16 我将 PIL 库与 anaconda python 一起使用如下所示 from PIL import Image img Image open test tif img i
将 Django 中的所有视图限制为经过身份验证的用户

我是 Django 新手我正在开发一个项目该项目有一个登录页面作为其索引和一个注册页面其余页面都必须仅限于登录用户如果未经身份验证的用户尝试访问这些页面则必须将他她重定向到登录页面我看到 login required装饰器会将
如何在引发异常时将变量传递给异常并在异常时检索它？

现在我只有一个空白的异常类我想知道如何在引发变量时给它一个变量然后在 try except 中处理它时检索该变量 class ExampleException Exception pass 为其构造函数提供一个参数将其存储为属性然后
Chrome 驱动程序和 Chromium 二进制文件无法在 aws lambda 上运行

我陷入了一个问题我需要在 AWS lambda 上做一些抓取工作所以我按照下面提到的博客及其代码库作为起点这非常有帮助并且在运行时环境 Python 3 6 的 AWS lambda 上对我来说工作得很好 https manivan
PyObjC + Python 3.0 问题

默认情况下 Cocoa Python 应用程序使用默认的 Python 运行时版本 2 5 如何配置我的 Xcode 项目以便它使用较新的 Python 3 0 运行时我尝试用新版本替换项目中包含的Python framework 但它不
使用 python 将 CSV 文件上传到 Microsoft Azure 存储帐户

我正在尝试上传一个 csv使用 python 将文件写入 Microsoft Azure 存储帐户我已经发现C sharp https blogs msdn microsoft com jmstall 2012 08 03 convert

随机推荐

Postgres子查询，按子查询排序

如果我有一个查询例如 select from tbl where id in 10 20 9 4 返回的结果可能按以下顺序排列 4 9 10 20 但是如果想要维护传递到初始查询中的列表的顺序怎么办你会如何处理这个问题最终我在这里使
哪里可以下载Python3.3的Scipy？ [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我想在Windows中安装Scipy for Python3 3 但我在以下链接中只找到了Python 3 2版本之前的Scipy安装文件 http
Django 1.7：如何使ManyToManyField成为必需的？

我有一个 Django 模型ManyToManyField在里面我需要要求用户在此字段中至少选择一个 M2M 值我尝试设置blank False到M2M领域但没有帮助 class Skill models Model name mod
无法在 .NET Framework 4.7.2 项目中安装 Nuget 包

In my WPF项目使用 NET Framework 4 7 2 in VS2017 我正在尝试安装互操作MSUtil dll https www nuget org packages Interop MSUtil dll 按照建议的 N
@ActiveProfile 和 spring.profiles.active

这是我的 applicationContext 定义的一部分用于检索一些属性
用于检测 Objective-C 中类属性可用性的宏

Xcode 8 引入了 Objective C 类属性我想向 Objective C 库添加一个不过我希望该库仍然可以使用 Xcode 7 进行编译我可以在编译时进行可用性检查吗就像是 if hasFeature objc cla
将 PHP 数组字符串转换为数组

我有一个数组 myArray array key1 gt value1 key2 gt value2 我将其保存为变量 fileContents var dump myArray 如何将变量转换回用作常规数组 echo fileConten
隔离存储文件异常

我尝试创造IsolatedStorageFile使用以下代码 IsolatedStorageFile isf IsolatedStorageFile GetUserStoreForApplication 但我得到以下异常 IsolatedS
Pandas，带有 datetime64 列的数据框，按小时查询

我有一个熊猫数据框df其中有一列由datetime64 e g
当我将鼠标悬停在使用 jquery 的图标上时如何显示简单的文本框

我在 html 中有一个输入字段该字段旁边有一个帮助图标当我将鼠标悬停在图标上时我希望显示一条简单的文本消息并且该文本消息应该在悬停时消失有什么方法可以使用 jquery 来做到这一点吗图标将是一个简单的图像上面写着一个小问号
如何使用 C# 连接到 Azure MySQL In App localdb

我尝试了几种方法都没有成功 OdbcConnection MySqlConnection 使用 PHP 它在一分钟之内就可以工作但我想使用 Web 服务 asmx 访问数据库 Web 服务正在返回正确的信息 MYSQLCONNSTR lo
从 XML 文件中提取内容

我有一个 C 应用程序它使用按钮生成文件目前我想使用 C 从 XML 文件中提取内容并将其作为字符串传递例如在我的 XML 文件中我有一个标签名称我想使用 C 从 XML 文件中提取名称我应该如何去实现它以下是我当前拥有的
无法替换 Python pandas 数据框中的特殊字符

我正在 Windows 中使用 Python 3 5 我有一个数据框其中 titles str类型列包含标题的标题其中一些具有特殊字符例如我正在尝试用空格替换这些 using pandas replace 我尝试过各种迭代但没有任
在我的 Onsenui 应用程序中添加登录页面

我想在进入主页之前设置一个登录页面我怎样才能在这条指令之前做到这一点
如何根据文化信息获取日期和时间格式？

我想要的是如果文化是 en US 那么 string dateFormat MM dd yyyy string timeFormat 24 00 hrs 如果文化是 en GB 那么 string dateFormat dd mmyyyy
我们应该从 featuretools 的 DFS 中排除目标变量吗？

当将数据帧作为实体集中的实体传递并对其使用 DFS 时我们是否应该从 DFS 中排除目标变量我有一个模型在手动尝试传统的特征选择方法并使用特征工具来查看是否提高了分数后该模型的 roc auc 分数为 0 76 因此在包含目标变量
支持重叠 I/O（对于 IOCP）的定时器？

我需要在基于 I O 完成端口 IOCP 的应用程序中添加计时器支持我想避免使用特定线程来管理计时器在 Linux 上您可以创建一个通过文件描述符传递过期通知的计时器请参阅timerfd h man 因此如果您的应用程序基于 epo
spring中jdbctemplate和事务管理的Java配置

我正在使用 spring jdbc 和 spring jdbc 事务支持这是我的配置 Configuration EnableTransactionManagement mode AdviceMode ASPECTJ EnableGlob
为什么 substr-lvalue 比四参数 substr 更快？

From 这个问题 https stackoverflow com questions 61668990 is it faster to prepend to a string with substr 61668991 noredirect
使用 python、requests 和 bs4 进行亚马逊价格网络抓取

我有一个关于网络抓取亚马逊文章价格的问题我试图获取一篇文章的价格但不幸的是并不总是有效我随机收到状态代码 503 服务器不可用我可以用一个 while 循环来解决这个问题如果状态码 200 则结束我想了解服务器不可用的主要问题

使用 python、requests 和 bs4 进行亚马逊价格网络抓取

使用 python、requests 和 bs4 进行亚马逊价格网络抓取 的相关文章

随机推荐

热门标签

使用 python、requests 和 bs4 进行亚马逊价格网络抓取的相关文章