python爬虫商品信息，并生成Excel

2023-05-16

刚开始学习爬虫，记录一下。
我爬了一页的数据，想要爬取多页的，只需要遍历，改变url中最后的数字，44是一页显示的条数，第二页就是2*44，以此类推。
url中q后面是你要搜索的关键字，可以根据自己需求更改

import requests
import re
import xlwt


url = 'https://s.taobao.com/search?q=%E5%92%96%E5%95%A1&imgfile=&js=1&stats_click=search_radio_all%3A1&initiative_id=staobaoz_20180920&ie=utf8&style=grid&sort=sale-desc&s=44'
heads = {
    'User-Agent': '从浏览器复制',
    'cookie': 'cokie从浏览器登录后复制就可以了'
}

response = requests.get(url, headers=heads)
content = response.text


img_pat='"pic_url":"(//.*?)"'#商品图片
name_pat='"raw_title":"(.*?)"'#商品名字
nick_pat='"nick":"(.*?)"'#淘宝店铺名称
price_pat='"view_price":"(.*?)"'#商品价格
fee_pat='"view_fee":"(.*?)"'#运费
sales_pat='"view_sales":"(.*?)人收货'#收货人数
comment_pat='"comment_count":"(.*?)"'#商品评论数，
city_pat='"item_loc":"(.*?)"'#淘宝店所在城市
detail_url_pat='detail_url":"(.*?)"'#商品详细地址

nameL=re.compile(name_pat).findall(content)
priceL=re.compile(price_pat).findall(content)
salesL=re.compile(sales_pat).findall(content)
cityL=re.compile(city_pat).findall(content)


wb = xlwt.Workbook()
ws = wb.add_sheet('point')
ws.write(0, 0, "商品名称")
ws.write(0, 1, "价格")
ws.write(0, 2, "销量")
ws.write(0, 3, "发货地")
for j in range(len(nameL)):

    ws.write(j+1, 0, nameL[j])
    ws.write(j+1, 1, priceL[j])
    ws.write(j+1, 2, salesL[j])
    ws.write(j+1, 3, cityL[j])
wb.save('./咖啡.xls')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python爬虫商品信息，并生成Excel 的相关文章

激光雷达Velodyne16配置及录制rosbag

激光雷达Velodyne16配置一配置IP二安装ROS依赖三创建工作空间四录制bag数据包硬件准备 xff1a 连接电源线及网线一配置IP 1 设置有线的IP地址设置 gt 网络 gt 有线连接 gt IPV4 gt 手动
基于can总线的A2L文件解析（3）

文章目录前言MOD COMMONMOD PARXCP数据Common Parameters定义IF DATA定义XCPPROTOCOL LAYERDAQEVENTXCP ON CANCAN Parameters 总结前言在第二篇A2L
功放电路里三极管的工作状态:甲类、乙类和甲乙类怎么区分？

1 甲类功放管的工作点电流设计在放大区的线性区中点 xff0c 所以静态电流较大一般在800mA 1 5A之间 xff0c 不同功率的功放管是其最佳工作点电流是不同的 xff0c 其静态发热量较大 xff0c 所需的散热片也要面积较大 x
文件操作原理

文件描述符文件描述符在形式上是一个非负整数实际上 xff0c 它是一个索引值 xff0c 指向内核为每一个进程所维护的该进程打开文件的记录表当程序打开一个现有文件或者创建一个新文件时 xff0c 内核向进程返回一个文件描述符在程序设
C++头文件和变量的那些事儿

头文件和变量的那些事儿头文件变量在内存中函数与其链接性namespace关键字using声明和using编译指令命名空间的特性未命名空间 new关键字使用new运算符初始化new运算符函数头文件最近在github上拔了一个项目 xf
Ubuntu18系统下采集点云数据（速腾16线激光雷达）与ZED 2 相机进行外参标定（Matlab的LCC工具箱）

这篇是最近的实验记录 xff1a 在Ubuntu系统下读取点云数据并在rviz中显示 xff0c 录制自己的rosbag数据包并离线播放 xff0c 将rosbag文件转化为pcd格式导入MATLAB中 xff0c 和双目相机进行外参标定
基于STM32的高精度超声波模块HC-SR04测距

准备材料超声波模块 H C S R 04 HC SR04 H C
linux系统实现tcp协议通讯

提示 xff1a 文章写完后 xff0c 目录可以自动生成 xff0c 如何生成可参考右边的帮助文档文章目录一 tcp通讯的链接二使用步骤1 引入库2 读入数据注意提示 xff1a 以下是本篇文章正文内容 xff0c 下面案例可供
无人机拉力测试台-无人机拉力、扭矩、转速测试教学

无人机动力系统测试实验实训教学课程 amp nbsp 实验课程3 xff1a 动力系统基础测试参数测试实验课程内容 xff1a 1 amp nbsp 无人机动力系统基础测试参数解读 2 amp nbsp 无人机动力系统基础参数测试实验
无人机拉力测试台-无人机动力系统匹配试验

无人机动力系统测试实验实训教学课程 amp nbsp 实验指引一实验开设背景人社部2020年8月27号在新职业无人机装调检修工就业景气现状分析报告中说明 xff0c 预计未来五年无人机装调检修工需求量约350万人无人机装调检
无人机动力测试-无人机电机、螺旋桨、电调测试

无人机动力系统测试实验实训教学课程实验课程4 xff1a 动力系统基本参数测量与验证课程内容 xff1a 1 amp nbsp 动力系统性能参数及性能特性曲线 2 amp nbsp 动力系统性能参数及性能特性曲线测试实验实验器材 x
ubuntu18.04环境搭建

1 ubuntu安装make xff1a sudo apt install make sudo apt install make guile 2 ubuntu上安装git xff1a 运行Ubuntu的主机打开终端 xff0c 输入 su
从0到1！Ubuntu上搭建Kubernetes Cluster

目录一环境准备二初始化工作 1 设置root用户密码 2 使用xshell连接三台主机 3 设置主机名和修改hosts文件 4 安装依赖软件以及关闭停用不需要使用的软件 5 时间的同步与时区设置 6 关闭swap分区 7 在 kub
傅立叶变换和拉普拉斯变换的区别

傅立叶变换可以看做拉普拉斯变换的特殊形式拉氏变换就是将原时域函数乘上一个与o相关的衰减子因为傅氏变换要求绝对可积 xff0c 但实际上很多函数不满足 xff0c 乘上衰减因子之后就基本都可以了之后做傅氏变换得来假如这个为0就还是
一篇让你完全弄懂GPIO的8种配置模式

前言配置GPIO口是我们软件开发中必须要掌握的 xff0c 每个模式的作用效果也是需要清楚的如果连gpio应该配置成什么模式都不懂 xff0c 是无法进行后面的开发的 1 输入模式 1 1 浮空输入模式 I O端口的电平信号进入输入数据
上位机与下位机的通讯

一概念上位机 xff1a 是指人可以直接发出操作命令的计算机 xff0c 一般指PC 人机界面等发出的命令首先给下位机 xff0c 下位机再根据命令解释成相应的时序信号 xff0c 直接控制相应设备下位机 xff1a 直接控制设备获
OptiTrack Motive 使用教程

相机标定最近在使用Quanser的地面车做实验 xff0c 需要用到OptiTrack系统进行定位 xff0c 记录一下使用过程 xff0c 供需要的人参考本文参考了以下博客 xff1a https blog csdn net banz
一种int型、float型转char型以及回转方法

摘要 xff1a 本文讲述一种可以在STM32F103C8T6上面运行的一种int型 float型转char型以及回转方法 xff0c 一般用于计算好的数据输入到传感器中或物联网器件中 xff1b 把传感器中的数据提取出来计算等等实验时间
Ubuntu18 python多版本管理切换

一背景 Ubuntu18 04电脑 xff0c 安装有python2 7和python3 6 9两个python版本 xff0c 目前像安装另一款软件 xff0c 依赖要求是python gt 61 3 7 xff0c 但又不想删除pyt
解决“E: Package ‘libqtgui4‘ has no installation candidate”无法安装qt4

使用场景 xff1a Ubuntu20 4 xff0c VMware16pro 笔者在安装Ubuntu下的网络调试助手NetAssist xff0c 遇到了 E Package libqtgui4 has no installation c

随机推荐

时序数据插值，对GPS采样数据进行线性插值

此篇为上一篇的接续 xff0c 对时序数据进行插值上篇文章解析kml文件 xff0c 提取经纬度信息存入csv 将kml里面的信息提取了出来 xff0c 但是有些数据间隔太大 xff0c 甚至几十秒才一个采样点 xff0c 需求对这样的
Jetson nano/NX安装Opencv Cuda版

一卸载系统自带的opencv sudo apt span class token operator span get purge libopencv span class token operator span python span c
Jetson Xavier NX-EMMC重装系统

Jetson xavier NX EMMC版本重装系统相对比较麻烦 xff0c 以下方法本人已经试过多次 xff0c 基本没有出现什么问题一安装虚拟机安装虚拟机的步骤我们不多过述 xff0c 网上有许多博客讲述虚拟机安装我们这里主要
JTAG、JLINK、ULINK、ST-LINK

一 JTAG JTAG用的计算机的并口 xff0c JTAG也是一种国际标准测试协议 xff08 IEEE 1149 1兼容 xff09 xff0c 主要用于芯片内部测试现在多数的高级器件都支持JTAG协议如DSP FPGA器件等标准
ubuntu18.04安装Ros(详细)

Ubuntu18 04安装Ros本人已试过多次 xff0c 安装过程基本没出现问题 xff0c 而且该方法也可用在Jetson nano NX 上一设置软件源 xff1a 清华源 xff1a sudo sh c 39 etc lsb r
Jetson Xavier NX安装Mavros

Px4飞控通过USB线连接Jetson Xavier NX xff0c 如果需要进行软连接 xff0c 即通讯 xff0c 需要下载Mavros功能包 xff0c 并通过启动命令进行连接安装Mavros sudo apt install
Jetson Xavier NX 部署Yolov5

大部分过程非原创 xff0c 写这篇文章主要是因为设备不同出的问题也各不相同 xff0c 需要到处去找解决方法 xff0c 因此我把配置过程中遇到的全部问题以及解决方法记录在此注 xff1a 该博客原文来自Jetson nano NX 部
Yolov5 更改识别窗口大小

启动yolov5时 xff0c 会因为像素太大导致占据整个桌面 xff0c 这样非常影响使用和操作 xff0c 我们可以通过opencv中的resize函数来修改识别窗口的像素大小 xff0c 这样操作就方便多了原代码中通过修改cv2
MCS-51系列单片机指令系统分类

51系列单片机共有111条指令 xff0c 这些指令的集合称为指令系统常用的分类为以下几种 xff1a 按位寻址方式 xff1a 1 寄存器寻址 2 直接寻址 3 寄存器间接寻址 4 立即寻址 5 变址寻址 6 相对寻址 7 位寻址按功
ubuntu20.04安装ROS【详细】

Ubuntu20 04安装ROS与Ubuntu18 04大差不差 xff0c 安装过程基本没出现问题按以下教程操作即可一更换源 xff1a 1 备份源文件 sudo cp etc apt sources list etc apt so
Ubuntu 16.04设置开机自启动脚本

1 创建脚本 sh文件可以在 home user Documents scripts路径下建立名为auto run test sh的文件 xff1b auto run test sh里面写上具体要做的事 xff0c 例如我这里 xff1a
ubuntu 修改默认python版本

1 查看当前默认版本和存放位置 2 安装python3 8 2 删除原软连接 xff0c 生成新版本软连接 python V 输出 xff1a Python 2 7 17 whereis python or which python 输入
C语言 strcat方法的使用方式

strcat char str1 char str2 将字符串str2拼接到str1的尾部对于新手来说 xff0c 使用这个方法只要将str1的内存大小给够了 xff0c 这个方法就没有问题 xff0c 当然这个方法在C程序看来是不安全的
STM32_串口中断接收数据_空闲中断

STM32 串口中断接收数据空闲中断引言 xff1a 1 串口中断接收数据首先要保证完整性 xff08 设置串口中断优先级 xff09 2 串口中断接收数据要保证实时性 xff08 打开串口空闲中断空闲时间是2个字节的时间 xff09
STM32调试方式JTAG&SWD的区别

在学习STM32时 xff0c 我们经常会遇到JTAG和SWD的调试方法 xff0c 还涉及到Jlink Ulink Stlink等 xff0c JTAG和SWD是ARM板一种调试模式后面三种都是实现这种模式的一种工具 xff0c 他们之
大端序、小端序和MSB、LSB的区别和举例

大端序小端序和MSB LSB的区别和举例 1 字节序序不同平台上数据存储方式 xff1a 大端字节序小端字节序字节序就是一个多字节数据的低位置一般是低8位放置在存储单元的高有效位高地址还是低有效位低地址的概念 xff1
将word文件中的文本转成字符串

将word文件中的文本转成字符串需要用到apache poi 下面的一些jar包下面是pom文件 xff0c 因为我也是在网上找的 xff0c 所以可能有多余的jar包 xff1a lt dependency gt lt groupId
spring boot线程里bean注入失败

在多线程处理问题时 xff0c 无法通过 64 Autowired注入bean xff0c 报空指针异常 xff0c 在线程中为了线程安全 xff0c 是防注入的 xff0c 如果要用到这个类 xff0c 只能从bean工厂里拿个实例 sp
python生成Excel

import xlwt import random lonlat 61 wb 61 xlwt Workbook ws 61 wb add sheet point for i in range 1000 lon 61 random unifo
python爬虫商品信息，并生成Excel

刚开始学习爬虫 xff0c 记录一下我爬了一页的数据 xff0c 想要爬取多页的 xff0c 只需要遍历 xff0c 改变url中最后的数字 xff0c 44是一页显示的条数 xff0c 第二页就是2 44 xff0c 以此类推 url中

python爬虫商品信息，并生成Excel

python爬虫商品信息，并生成Excel 的相关文章

随机推荐

热门标签