Python爬虫入门实例一之淘宝商品页面的爬取

2023-05-16

文章目录

- 1.爬取原界面
- 2.代码解析
- 3.完整代码
- 引用源自

1.爬取原界面

今天给大家介绍第一个爬虫小例子，使用requests库爬取淘宝商品信息，首先想要爬取的内容如下图。
在这里插入图片描述

2.代码解析

使用交互环境给大家带来代码解析

（1）首相导入requests库，然后将网页url地址保存到变量中

在这里插入图片描述
（2）使用requests库的get()方法得到地址，并用r.raise_for_status函数判断是否连接正常，正常则返回200，其他值则为错误

在这里插入图片描述
（3）将从网页内容中解析出的编码方式赋值给r.encoding，之后以字符串的方式将爬取内容输出

在这里插入图片描述
（4）输出内容如下

在这里插入图片描述

3.完整代码

import requests
url = "https://item.taobao.com/item.htm?id=625588903252&ali_refid=a3_430673_1006:1123185872:N:5Li%2BA5zGU7Aqz5docyZENQ%3D%3D:6620fa14ff820a1fe33c8d19bbbd1752&ali_trackid=1_6620fa14ff820a1fe33c8d19bbbd1752&spm=a2e15.8261149.07626516002.2"
try:
    r = requests.get(url)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text)
except:
    print("爬取失败")

所有编程实践中，代码最终的效果固然很重要，但更重要的还是代码的稳定性，所以使用try except代码块捕获异常

本篇完，如有错误欢迎指出~

引用源自

中国大学MOOC Python网络爬虫与信息提取
https://www.icourse163.org/course/BIT-1001870001

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python爬虫入门实例一之淘宝商品页面的爬取的相关文章

C语言系列（六）：函数与预编译处理

模块化程序设计方法在程序设计与开发中 xff0c 随着解决问题的复杂化 xff0c 编写程序的代码也更加复杂一方面 xff0c 大量的程序语句会使程序的逻辑结构产生混乱 xff0c 给程序的编写阅读和维护带来困难 xff1b 另一方面
Linux驱动开发经典面试简答题

1 Linux设备中字符设备与设备有什么主要的区别 xff1f 请分别举例一些实际的设备说出它们是哪一类设备字符设备 xff1a 字符设备是个能够像字节流 xff08 类似文件 xff09 一样被访问的设备 xff0c 由字符设备驱动程序
CMake中cmake_host_system_information的使用

CMake中的cmake host system information命令用于查询各种主机系统信息 xff0c 其格式如下 xff1a cmake host system information RESULT lt variable gt
一文知晓嵌入式Linux

嵌入式Linux是什么嵌入式Linux跟桌面Linux一样 xff0c 是一个操作系统从单片机走过来的童鞋往往习惯于直接控制寄存器 xff0c 事必躬亲 xff0c 从零开始实现想要的功能而在嵌入式Linux的世界里 xff0c 我们
修改i.mx6ull Linux内核启动logo

1 制作Linux内核需要的开机logo xff08 ppm格式 xff09 1 1在Ubuntu系统上安装netpdm工具命令如下 xff1a span class token macro property sudo apt get i
keil5编译错误error: #5: cannot open source input file “core_cm3.h“: No such file or directory

用Keil vision5编译时出现 xff1a error 5 cannot open source input file core cm3 h No such file or directory 可能是MDK版本太新了 xff0c 我装
IPv6基础详解

IPv6 由于internet规模的扩大 xff0c IPv4地址空间已经消耗殆尽 xff0c IETF在90年代提出了下一代互联网协议IPv6 xff0c IPv6支持几乎无限的地址空间 xff0c 并且配置更加简单 xff0c IPv6
Pycharm中debug使用学习

1 运行环境 1 1 运行 xff1a 先确认项目运行环境点击右下角python查看向任务中添加环境 xff0c 一般加入anaconda的环境 xff0c 配置方便切换到自己所需环境添加运行环境初次搭建 xff0c 哔哩哔哩中新
对项目的梳理、流程和总结

过程我在制作中国汽车技术研究中心的一个演讲PPT前 xff0c 也已经有第一版的基础了 xff0c 不过 xff0c 第一版的PPT客户并不满意 xff0c 因为这个风格不是客户想要的 xff0c 所以客户对第一版的PPT并不是很满意
【ROS】xxx is neither a launch file in package xxx nor is xxx a launch file name……解决

在ros中新增加一个功能包时 xff0c 如果没有处理得当的话 xff0c 在执行时很有可能报如下错误 xff1a xxx is neither a launch file in package xxx nor is xxx a launc
FreeRTOS——流和消息缓冲区

FreeRTOS 基础系列文章基本对象 FreeRTOS 任务 FreeRTOS 队列 FreeRTOS 信号量 FreeRTOS 互斥量 FreeRTOS 任务通知 FreeRTOS 流和消息缓冲区 FreeRTOS 软件定时器 Fre
FreeRTOS——静态与动态内存分配

FreeRTOS 基础系列文章基本对象 FreeRTOS 任务 FreeRTOS 队列 FreeRTOS 信号量 FreeRTOS 互斥量 FreeRTOS 任务通知 FreeRTOS 流和消息缓冲区 FreeRTOS 软件定时器 Fre
CAS 6.5.5项目初始化搭建运行

一项目背景介绍公司项目重构 xff0c 决定使用CAS中央认证系统在GitHub上找到最新的稳定版本6 5 5 CAS项目在5 x版本的运行环境是jdk8 xff0c 使用maven做的项目管理 6 x使用的是jdk11作为运行环境
GoogleTest中gMock的使用

GoogleTest中的gMock是一个库 xff0c 用于创建mock类并使用它们当你编写原型或测试 prototype or test 时 xff0c 完全依赖真实对象通常是不可行或不明智的 not feasible or wise
基于Autoware制作高精地图（一）

基于Autoware制作高精地图 xff08 一 xff09 开始进入正题 xff0c 也是最近在忙的一件事 xff0c 制作高精地图高精地图的制作大概分为以下四个流程 xff08 不一定完全正确 xff09 xff1a 1 构建点云地图
Ubuntu sh文件编写，开多终端，自动读取密码

Ubuntu sh文件编写 xff0c 开多终端 xff0c 自动读取密码开启多个终端自动读取密码在最近的项目调试中经常需要开多个终端启动多个launch xff0c 这样的操作多了难免会感到烦躁并且时间一长再回去使用一些功能包的时候就
控制理论——自动控制原理若干概念

1 对自动控制系统的基本要求稳定性被控量因扰动偏离期望值后 xff0c 经过过渡过程可以恢复到原来的期望值状态快速性包含两方面 xff1a 过渡过程的时间最大超调量 xff08 震荡幅度 xff09 准确性指稳态误差 xff1a
Optitrack下通过mavros实现offbord控制

参考文章 xff1a 树莓派通过MAVROS与Pixhawk PX4通信 PX4使用Optitrack进行室内定位通过optitrack与妙算连接在同一局域网下 xff0c 关闭防火墙 xff0c 并设置刚体发布 vrpn安装 cd ca
【场景图生成】Unbiased Scene Graph Generation from Biased Training

文章下载地址 xff1a https arxiv org pdf 2002 11949 pdf 代码地址 xff1a GitHub KaihuaTang Scene Graph Benchmark pytorch 发表地点 xff1a CV
【场景图生成】Graphical Contrastive Losses for Scene Graph Parsing

文章下载地址 xff1a Graphical Contrastive Losses for Scene Graph Parsing 代码地址 xff1a https github com NVIDIA ContrastiveLosses4V

随机推荐

jquery无法获取到textarea中的值详解

问题描述 xff1a 今天在springboot中jquery读取前端的值通过jquery打包为json传入后端 xff0c 发现其中textarea区域中的内容无法获取解决办法 xff1a 首先看你的textarea中是否有 name属
阿里云大学——Java语言基础自测考试 - 初级难度

1 假设有如下程序 xff1a span class token keyword public span span class token keyword class span span class token class name Dem
could not transfer artifact org.springframework.boot:spring-boot-starter-parent

Springboot异常 could not transfer artifact org springframework boot spring boot starter parent pom 2 3 0 RELEASE from to c
阿里云ECS搭建个人简历网站

能在自己的网站上搭建简历是不是很酷 xff0c 今天我就教大家如何在自己的服务器上搭建一个个人简历网站因为主流网站的搭站环境是LAMP环境 xff0c 所以第一步就是先去把服务器环境一修改为LAMP环境停止ECS实例运行点击使用就
GitHub加速神器FastGithub的使用

clone GitHub上的项目时经常超时 pull或push的时候也有类似情况有时GitHub也打不开 xff0c 这里推荐GitHub上的一个工具FastGithub xff0c 开启它后 xff0c 可大大减少超时情况的发生这里介
阿里云ECS打造属于自己的WEB——IDE编程环境

首先感谢 64 1430059860老哥的指导 xff0c 在阿里的官方视频卡着以后就一直进去入不了下一步了 xff0c 特向我的组长老哥带带 xff0c 最终搭建成功停止实例选择更换操作系统 xff08 如果使用centoS建议更换ub
给阿里云服务器装一个图形化界面——Gnome

我这里使用的是ubantu系统第一步 xff1a apt get update更新一下源第二步下载Gnome图形化界面 apt get install gnome shell ubuntu gnome desktop第三步下载完成 a
0基础使用阿里云打造自己的私人云盘

平时我们使用云盘例如有百度云 xff0c 蓝奏云 xff0c 小米云盘 xff0c 虽然给我们带来不少的便利 xff0c 但是也存在私人数据泄露和文件下载速度过慢的风险 xff0c 所以 xff0c 打造一款属于自己的私人云盘是一个很好的选
Redis无法加载配置文件中日志文件的解决方法

Can t open the log file Permission denied logfile usr local redis etc redis6380 log Can t open the log file Permission d
Request method ‘PUT‘ not supported

今天写后端接口出现问题 xff0c 出现Request method PUT not supported 可能是springboot的bug xff0c 在修改无果后 xff0c 关闭程序 xff0c 进行rebuild多次后 xff0c
关于前端传值，springboot后端的参数处理方式汇总

对于前端传值情况 xff0c 后端接收的几种情况 1 对于此类链接 http localhost 7398 order userPage page 61 1 amp pageSize 61 1 http localhost 7398 ord
Could not autowire. No beans of ‘xxxMapper‘ type found.

Could not autowire No beans of xxxMapper type found 的三种解决办法出现Could not autowire No beans of xxxMapper type found 的解决办法
后端对象数据为空的情况

后端对象数据为空的情况后端与前端对接数据形式不一致 xff0c 前端传入数据的方式 xff08 url post请求 xff0c 直接作为对象进行传递 xff09 xff0c 导致后端拿不到数据对接数据一致 xff0c request请
C-动态内存和运算符重载

titledatetagscategoriesdescription C 43 43 动态内存和运算符重载 2019 11 12 13 34 50 0800 动态内存运算符重载 C C 43 43 简单了解一下
高版本Ubuntu(如22.02)修改apt源，快速安装低版本gcc/g++

Ubuntu不同版本默认apt install gcc安装的gcc和g 43 43 版本不同 xff0c 如Ubuntu22 04默认安装gcc g 43 43 为11版本 xff0c 高版本Ubuntu无法直接通过apt install
COLMAP简介及通过2D序列图像进行3D重建操作流程

COLMAP是一种通用的运动结构 Structure from Motion SfM 和多视图立体 Multi View Stereo MVS 管道 pipeline xff0c 具有图形和命令行界面它为重建有序和无序图像集合提供了广泛的
我踩了所有ESP8266的坑，现在来个最终总结

STM32 43 ESP8266 协议接入IOT平台必成功 1 移植到STM32前先检查你的esp8266能不能用1 1 大概率你手里的esp8266是官方固件刷MQTT固件1 2 ESP8266 MQTT固件 AT指令列表 xff1a
进阶HAL开发——第二集-FreeRTOS

大三了 xff0c 在保研考研保研加分政策改变的焦虑中渡过了2021的前5个月好久没有认真学东西了不管了 xff0c 先学点东西把手里的比赛做完 xff0c 加不加分都随缘 FreeRTOS HAL库一简介二理解三使用3 1
百度easydl数据标注

一百度easydl数据标注脚本 1 官方标注工具 xff0c 链接如下 xff0c 由lableme改进而形成 GitHub Baidu AIP Easyyibiao 2 官网数据导入格式三种分别为 xff1a 布局如图所示 2 1js
Python爬虫入门实例一之淘宝商品页面的爬取

文章目录 1 爬取原界面2 代码解析3 完整代码引用源自 1 爬取原界面今天给大家介绍第一个爬虫小例子 xff0c 使用requests库爬取淘宝商品信息 xff0c 首先想要爬取的内容如下图 2 代码解析使用交互环境给大家带来代码解析