10000+ppt免费下载领取(python爬取全站ppt)

2023-10-30

1.缘由

前几天参加一个活动,需要制作ppt,制作完之后ppt模板死活不能让人满意。然后就去网上找模板,有些比较适合ppt模板还是收费的,这…,有点恶心,哈哈哈!!

今天教大家如何使用python爬虫爬取1万份『ppt模板』,以后制作ppt再也不怕了没有模板了!!!

2.相关介绍

网站:

https://sc.chinaz.com/ppt/free.html

在这里插入图片描述
一共702页,每页20个ppt模板

2.爬虫思路

先遍历每一页,获取每一页ppt模板的url。
根据ppt模板的url获取下载地址。
最后根据下载地址将文件下载到本地。

3.遍历每一页
在这里插入图片描述
获取ppt模板url和类型

# 个人公众号 yk 坤帝
# 后台回复 ppt模板 领取ppt
for i in range(15):
    response = requests.get('https://sc.chinaz.com/ppt/free_' + str(i)  + '.html')
    response.encoding = 'utf-8'

    page_text = response.text

    tree = etree.HTML(page_text)

    div_list = tree.xpath('//div[@class="bot-div"]')
    for div in div_list:
        href ='https://sc.chinaz.com' + div.xpath('./a/@href')[0]
        title = div.xpath('./a/text()')[0]

保存ppt的url和类型
在这里插入图片描述

4.下载保存

获取下载地址:
在这里插入图片描述

# 个人公众号 yk 坤帝
# 后台回复 ppt模板 领取ppt
res = requests.get(href)
tree = etree.HTML(res.text)

url = tree.xpath('//div[@class="download-url"]/a[1]/@href')[0]
print(url)
ppt = requests.get(href).content

if not os.path.exists('ppt模板'):
    os.mkdir('ppt模板')

with open('ppt模板/' + title + '.rar', 'wb') as file:
    file.write(ppt)
print(title + ':下载完毕!!!!!!')

在这里插入图片描述
5.批量下载

for i in range(15):
    response = requests.get('https://sc.chinaz.com/ppt/free_' + str(i)  + '.html')

通过设置遍历的页数,实现批量下载

6.10000+ppt模板素材随用随取

通过python编程实现爬取10000+ppt模板素材,以后再也不用担心制作ppt没有模板了!
在这里插入图片描述

10000+ppt模板下载

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

10000+ppt免费下载领取(python爬取全站ppt) 的相关文章

随机推荐

  • 检错纠错码(奇偶校验码 CRC循环冗余校验码 海明码)

    检错与纠错码在计算机中经常被使用 在此对常用的三种检错纠错码做一个介绍 分别是奇偶校验码 CRC循环冗余校验码和海明码 奇偶校验码 通常所说的奇偶校验码指的是一维奇偶校验码 它只能检错 不能纠错 只有二维奇偶校验码具备纠错能力 校验方法 分
  • 面试题:什么是跨域?出现的原因?如何解决跨域问题?

    跨域 浏览器不能执行其他网页的脚步 由浏览器的同源策略造成的 是浏览器对javascript实施的安全限制 无法跨域是浏览器对用户安全的考虑 如果自己写个没有同源策略的浏览器 完全不用考虑跨域问题 同源策略限制 Cookie localSt
  • 文件操作与IO

    目录 一 什么是文件 二 文件的分类 三 Java中的文件操作 四 文件操作案例 一 什么是文件 平时我们锁说到的文件一般指的都是存储在硬盘上的普通文件 形如txt png jpg 等等这些都是普通文件 都存储在硬盘上 而在计算机中 文件可
  • Apifox 生成接口文档 教程与操作步骤

    接口文档自动生成 本文主要介绍使用 apifox 如何生成接口文档 附上详细的使用教程和操作步骤 使用Apifox 的可以自动生成接口文档 本文会给大家介绍下如何使用Apifox 来自动生成所需的接口文档 Apifox 是一款接口设计 调试
  • C# 在VS里开发Android应用 Xamarin(一)(刚开始接触的菜鸡,有没说好的地方请指出,学习中!!)

    去年寒假把之前做的大大小小所有C 程序项目都重新看了一遍 发现都是些管理系统啥的 想想也没啥桌面程序可做了 有好点子的可以跟我说说 就想去找找还有啥可做的 于是就百度了一番 发现可以写Android的应用 欣喜若狂 赶紧看看若何进行下一步
  • Python3,一篇搞定Numpy与Pandas的差异点及应用场景,妥妥的学到了。

    Numpy 与Pandas的差异比较 1 引言 2 Numpy与Pandas比较 2 1 相同点 2 2 差异点 2 3 应用场景 2 3 1 Numpy应用场景 2 3 2 Pandas 应用场景 2 4 代码示例 2 4 1 Numpy
  • easyexcel导出100w条数据,使用分页查询批量导入

    昨天公司的数据那边的人导出操作日志 一次性导出30w 让服务直接挂掉了 所有有了这篇文章 正常从数据库导出少量数据到execl 直接将符合条件的数据全部查询放到一个List中然后写到execl里即可 但是数据量过大时会导致内存兜不住的情况
  • TPR、FPR、TNR、FNR的理解

    转自 https blog csdn net zhq9695 article details 82909967 TPR True Positive Rate 可以理解为所有正类中 有多少被预测成正类 正类预测正确 即召回率 给出定义如下 F
  • Java 巧妙将音频amr格式转换成MP3(linux 以及windows)

    作为一名技术宅男 没事就上掘金来淘宝 在这学习了很多东西 也一直想开个博客 写写自己的东西 一方面就当是笔记 另一方面也可以作为他人学习的前进的一种参考 本着这样的想法今天来开启我的第一篇博客之路 俗话说前人栽树后人乘凉 我们受益于前人 亦
  • 关于构造广义线性回归模型的glmfit函数

    MATLAB中有glmfit 函数用于构建一个广义的线性回归模型 glmfit 函数属于统计工具箱 如何去使用glmfit 参考help hlmfit中的discription b glmfit X y distr b glmfit X y
  • 【Linux】Nacos 2.1 单机安装

    目录 Nacos 2 1 单机安装 1 从GitHub下载2 1 0的压缩包 2 解压与配置 3 数据库配置 4 单机启动nacos 遇到的一些错误 ErrMsg jmenv tbsite net libstdc so 6 cannot o
  • 文件IO(一.系统IO)

    1 系统IO 1 用户操作寄存器或者操作系统来让计算机反馈不同的现象 在大学期间大家都学过51单片机 我们要利用51单片机去点LED灯 直接去操控单片机内部的寄存器 硬件 这种直接操控单片机的 硬件的方式称之为 裸奔 就是说用户与芯片 硬件
  • golang练手项目监控系统资源项目(二)

    介绍项目 仿写监控系统资源项目 主要功能 监控服务资源可视化 开发环境 windows idea influxdb granfa 主要技术 时序性数据库influxdb 和可视化平台granfa 项目描述 实时监控本机资源 展示成可视化页面
  • 在shell脚本里面调用conda创建的环境

    事情源于 我在写脚本的时候 在脚本里面插入了一句 conda activate 环境名 然后出现如下的报错提示 CommandNotFoundError Your shell has not been properly configured
  • IDEA 2020导入Eclipse项目并运行实战篇

    在刚开始做Java项目的时候 很多人用的IDE都是Eclipse 这就导致了一个问题 那就是后面学习IDEA后 想用IDEA打开以前做的项目时 一时无法下手 现在 我们通过实战来学习如何在IDEA 2020 中导入Eclipse项目并运行
  • 机智的Open3D学习生活(第二集):从pcb文件中读取并可视化展示点云数据

    只作为一个从项目需求衍生的例子进行演示 代码么 从其他处获取并简单修改 import numpy as np import open3d as o3d from pathlib import Path from traceback impo
  • 编程能力训练、常见编程面试题

    编程能力训练 常见编程面试题 案例一 买飞机票 案例二 找素数 案例三 开发验证码 案例四 数组元素的复制 案例五 评委打分 案例六 数字加密 案例七 模拟双色球 练习一 飞机票 需求 机票价格按照淡季旺季 头等舱和经济舱收费 输入机票原价
  • FISCO BCOS 搭建区块链,在SpringBoot中调用合约

    一 搭建区块链 使用的是FISCO BCOS 和 WeBASE Front来搭建区块链 详细教程 https blog csdn net yueyue763184 article details 128924144 spm 1001 201
  • SSRF中利用到的协议

    一dict协议 定义 词典网络协议 在RFC 2009中进行描述 他的目标是超越Webster protocol 并允许客户端在使用过程中访问更多字典 Dict服务器和客户机使用TCP端口2628 dict协议在ssrf中的利用 dict协
  • 10000+ppt免费下载领取(python爬取全站ppt)

    1 缘由 前几天参加一个活动 需要制作ppt 制作完之后ppt模板死活不能让人满意 然后就去网上找模板 有些比较适合ppt模板还是收费的 这 有点恶心 哈哈哈 今天教大家如何使用python爬虫爬取1万份 ppt模板 以后制作ppt再也不怕