python之BeautifulSoup之二带属性值的抓取（find_all（'tag', attrs={'class':'value'}）

2023-05-16

系统：Windows/python 2.7.11

利用BeautifulSoup库抓取页面的一些标签TAG值

再抓取一些特定属性的值

示例标签：

<cc>
<div id="post_content_79076951035" class="d_post_content j_d_post_content "> 进来呀<br>都是自己喜欢的<br>拿图就走你是狗
<br><img class="BDE_Image" src="http://imgsrc.baidu.com/forum/w%3D580/sign=f4a2042b3c87e9504217f3642039531b/55f8e6cd7b899e514d1131fc44a7d933c9950db8.jpg" size="20418" height="852" width="480">
<br><img class="BDE_Image" src="http://imgsrc.baidu.com/forum/w%3D580/sign=914d48d14d36acaf59e096f44cd88d03/6a57b319ebc4b745190bbcfec9fc1e178b8215b8.jpg" size="12400" height="600" width="400">
<br><img class="BDE_Image" src="http://imgsrc.baidu.com/forum/w%3D580/sign=522fecd8bca1cd1105b672288910c8b0/6c318744ebf81a4cfbfce421d12a6059242da60a.jpg" size="21266" height="852" width="479"></div>
<br>
</cc>

===============================以下为代码部分==================================

#coding=utf-8
import urllib2
from bs4 import BeautifulSoup
def getImg(url):
html = urllib2.urlopen(url)
page = html.read()
soup = BeautifulSoup(page, "html.parser")
for s in soup.find_all('cc'): #获取标签为cc的tag值，得到结果：[<cc>xxxxxxxxxxxxxxxxxxxxxxxxxxxxxx........</cc>,<cc>....</cc>]集合
if 'img' not in str(s): #判断，若获取的cc值里面没有img标签，则结束本次循环
continue
d = s.find_all('img', attrs={'class':'BDE_Image'}) #获取标签为img，其中一个属性：class="BDE_Image" 所有数据，放进集合
lenth = len(d) #集合的个数
for i in range(lenth):
print d[i].attrs['src'] #打印，属性为src的内容，机后面的http://xxxxxxxxxxxxxxxxx

url = 'http://tieba.baidu.com/p/4161148236?fr=frs'
getImg(url)

========================================end========================================

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python之BeautifulSoup之二带属性值的抓取（find_all（'tag', attrs={'class':'value'}）的相关文章

Settings修改记录

1 更换主题略 2 修改Wifi对话框里的背景 Settings src com android settings wifi WifiDialog java protected void onCreate Bundle savedInst
js如何将一个按钮显示或者隐藏

关于一个元素的显示和隐藏有很多的方法 xff0c 随便百度就可以找到办法 xff0c 这边我就记录一下我是怎么显示和隐藏的 xff0c 便于以后回顾需求是 xff1a 当state为1和2时 xff0c 按钮 xff08 id是plshb
Shell脚本实现ftp上传与下载文件

下面的命令一定要手动输入 xff0c vi 我就是一开始因为没有手动输入 xff0c 直接复制进去的 xff0c 就一直报各种错 xff0c so一定要手动输入上传 bin sh export PUTFILE 61 a txt ftp v
JAVA生成随机ID（UUID）

java中生成随机的id xff0c 可以引入import java util UUID包 xff0c java代码如下 xff1a public static String getUUID UUID uuid 61 UUID random
java根据url路径下载图片到本地

直接这个类就可以实现 xff01 package paas cicd cn finedo paas util import java io File import java io FileOutputStream import java i
NVIDIA显卡驱动版本，CUDA版本，cudnn版本之间关系及如何选择

要配置NVIDIA显卡的CUDA和cudnn xff0c 各种版本之间的依赖关系以及与其他使用GPU的库版本兼容一直没有弄明白 xff0c 最近经过多次卸载重装 xff0c 终于成功配置好了显卡计算环境 xff0c 于是把各个驱动程序和库之
Ubuntu20.04及18.04的ROS安装教程及各种失败解决方法（sudo rosdep init找不到命令或失败与rosdep update一直timeout，roscore找不到命令）

项目场景 xff1a ros安装在安装ROS的过程中一般选择有网络非常好的网络进行安装 xff0c 这样就可以全程顺利执行一次性安装成功 xff0c 但不顺利也没问题这个教程将会给出解决由网络原因造成安装失败的解决方法安装步骤 xff1
Ubuntu20.04或18.04下PX4（pixhawk）源码编译环境配置教程，及构建代码各种错误解决办法

在 Ubuntu Linux 18 04 和 20 04 上设置 PX4 开发环境 xff0c 可参考此教程或官方教程Ubuntu Development Environment PX4 User Guide PX4 is the Prof
正负±5V(-5V到+5V)转0-3.3V简单电路实现（其他输入输出值只需稍微更改）

在我们使用STM32或其他3 3v的芯片内部ADC外设时往往会遇到输入的模拟范围过大 xff08 比如输入的是正负电压 xff09 这个时候我们就需要使用一个电压转换的板子进行转换 xff0c 通常情况下一般是使用运放的虚短虚断的特性
sudo rosdep init找不到命令或失败解决办法

初始化rosdep 终端输入 sudo rosdep init 失败1 如出现sudo rosdep xff1a 找不到命令解决办法 20 04终端输入 sudo apt install python3 rosdep2 18 04终端输入
rosdep update错误失败一直timeout解决方法

更新rosdep 终端输入 rosdep update 失败1 The read operation timed out xff08 包括ERROR unable to process source xff0c ERROR error lo
Android 设置文件后缀名及限制文件的大小获取手机文件

本功能可根据设置的限制文件大小及文件的后缀名 xff0c 列出手机内所有的文件如下图所示 xff1a 可根据点击的文件获取相应的文件列表 xff0c 部分代码说明如下 xff1a 获取文件大小 String fileSizeStr 61
centos6离线升级至centos7

1 说明本文用于离线状态下centos跨大版本升级 xff08 centos6升级至centos7 xff09 xff0c 系统环境为刚安装的纯净环境 xff0c 升级前没有安装外部源的包 centos跨版本升级只能升级到centos7
RHEL8.0升级包后图形化界面进入异常，提示 “Oh no! Something has gone wrong.Logout！”

1 问题背景近期遇到一个问题 xff0c RHEL8 0因为扫出漏洞 xff0c 根据漏洞做了更新 xff0c 重启后 xff0c 发现图形化界面进入异常 xff0c 提示 Oh no Something has gone wrong L
nfs关于用户写权限的配置

1 说明 nfs是很常用的网络共享盘方式 xff0c 访问客户端数量多了之后 xff0c 为确保安全 xff0c 会做权限控制 xff0c 一般都是放开读权限 xff0c 而控制写权限本文将在几种场景下说明 nfs 关于用户写权限的配置
root用户和root用户组在权限上的区别

1 root 用户在系统中是超级管理员 xff0c uid 61 0 xff0c 拥有最高权限 xff0c 除了系统特殊文件有 i a 权限的文件和目录文件系统问题等情况 xff0c 能够操作任何文件和服务进程 2 root 用户组
RedHat免费订阅账号注册方式

免费订阅账号来自于开发者账号的免费订阅功能 xff0c 可以阅读基本上所有产品的文章 xff0c 也可以下载官方所更新的最新的补丁包 xff0c 对于有漏洞修复需求来说比较实用官方站点 xff1a developers redhat co
使用 lvreduce 对逻辑卷做减容缩容操作及注意要点

1 背景 Linux 系统运维管理过程中 xff0c 有时候会遇到某个逻辑卷所分配的容量较大 xff0c 实际使用量又不多 xff0c 导致剩余较多浪费了此时如果有其他的逻辑卷需要扩容 xff0c 出于资源利用最大化的考虑 xff0c 会
ps aux 进程状态为 I (大写i)

系统使用 ps aux 查看进程时 xff0c 发现有状态为 I 大写i 的进程 xff0c 暂无发现由于这个状态导致的问题进程状态 I xff0c 表示task idle xff0c 即空闲的任务 xff08 进程 xff09 xff0
android网络框架OkHttp之get请求（源码初识）

转载请标明出处 xff1a http blog csdn net iamzgx article details 51477877 xff1b 本文出自 iGoach的博客概括 OkHttp现在很火呀于是上个星期就一直在学习OkHttp框

随机推荐

学会Retrofit+OkHttp+RxAndroid三剑客的使用，让自己紧跟Android潮流的步伐

转载请标明出处 xff1a http blog csdn net iamzgx article details 51607387 本文出自 iGoach的博客概括在上一篇博客android网络框架OkHttp之get请求 xff08 源
手动缓存Retrofit+OkHttp响应体，不再局限于Get请求缓存

转载请标明出处 xff1a http blog csdn net iamzgx article details 51764848 本文出自 iGoach的博客概括这篇博客是接着上一篇博客学会Retrofit 43 OkHttp 43 R
哪个才是Android工程构建时的gradle版本？gradle-wrapper.properties还是build.gradle的buildscript说了算？

先说谜底 xff0c gradle wrapper properties说了算 xff08 1 xff09 build gradle的buildscript里的buildscript dependencies的com android too
cocos2d-js之入门篇

转载请标明出处 xff1a http blog csdn net iamzgx article details 54232599 本文出自 iGoach的博客 cocos2d js xff0c 至今日 xff0c 也马马虎虎算接触了一个星期
微信小程序-入门篇

转载请标明出处 xff1a http blog csdn net iamzgx article details 72615506 本文出自 iGoach的博客前言 2017年1月9日 xff0c 微信小程序发布这也标志着FaceBook
使用OkHttp上传图片

简介上传图片是一个APP的常见功能 xff0c 可以是通过OOS上传到阿里云 xff0c 也可以直接上传到Server后台 xff0c OOS有提供相应的SDK xff0c 此处忽略下面通过OkHttp来实现图片的上传代码直接上代码
简单说说如何把json或者txt文件转换为db

前言最近在Github上找到一个中国城市的json文件 xff0c 虽然也有db文件 xff0c 但是想通过这个json文件生成自己的数据库表下面就简单来转换成自己的数据库准备json 在Github找到一个下面json表 34 sp
2018年7月面试记录

MRCM 聊天缓存如何实现的聊天重发如何实现如何保持长连接心跳简述TCP协议写一个自己最擅长的设计模式 ZHYT finish会立马销毁activity吗view的生命周期activity结束了HandlerQueue如何处理Handler
Android面向AOP之AspectJ的使用篇

前言 AOP xff0c 它不是一门新语言 xff0c 是一种面向切面的思想它主要的作用是把一些具有相同属性或者相同功能的代码抽离出来形成一个切面 xff0c 从而实现面向切面编程 xff01 而AspectJ就是基于Java语言实现AO
仿拉勾首页之Behavior的学习

前言最近在找工作 xff0c 于是打开拉勾 xff0c 看了看首页 xff0c 交互做的还是不错的先来看看拉勾效果然后最终实现的效果布局是图片直接用 xff0c 所以会失真实现思路首先这个是一个MD的效果 xff0c 可以使用自
Java中Collections类方法常用合集

目录 1 Collections sort list 2 Collections reverse list 3 Collections shuffle list 4 Collections swap List list int i int
解决Slf4j日志不打印问题

日志不打印的问题 xff0c 很让人头疼 xff0c 也是我们经常遇到的问题日常站点状态巡检时发现有异常日志 xff0c 定位到日志位置 xff0c 看其上线文自定义输出的日志时却发现 xff0c 自己加的日志都没输出排查了一下初步定位
Android Studio 配置Gradle总结

一 xff0c 问题 xff1a 换个新电脑安装完Android Sutdio第一次打开一个工程巨慢怎么办 xff1f 手动配置Gradle Home为什么总是无效明明已经下载了Gradle xff0c 配置了gradle home 为什
android 指纹识别之 BiometricPrompt的简单使用教程

1 使用android api 28的sdk创建一个新的项目创建完成后 xff0c 在build gradle中查看是否正确 2 在AndroidManifest xml中添加用户权限 lt uses permission android
Linux常用命令

expect except是一种自动交互语言 xff0c 能实现在shell脚本中为scp和ssh等自动输入密码自动登录 span class token comment usr bin expect span span class tok
使用 Acegi 保护 Java 应用程序，第 5 部分: 保护 JSF 应用程序中的 JavaBean

Bilal Siddiqui 在这篇文章中总结了本系列 xff0c 演示了如何用 Acegi 在 JSF 应用程序中保护对 JavaBean 的访问可以使用多种方式配置安全 bean xff0c 包括直接在 JSF 标签中使用受 Ace
baidu

1 hashmap的底层原理和hashtable的区别 put xff1a 对key的hashCode做hash操作 xff0c 然后再计算在bucket中的index xff1b 如果没碰撞直接放到bucket里 xff1b 如果碰撞了
ssh 带端口登录

ssh span class token operator span p 端口号 root 64 ip
域名+解析+GitHub来搭建自己的个人网站

域名 43 解析 43 GitHub来搭建自己的个人网站标签 xff1a GitHub使用技巧网站搭建版权声明 xff1a 本文为 64 icurious 的原创文章 xff0c 可以转载 xff0c 但请务必注明作者和出处 xff0
python之BeautifulSoup之二带属性值的抓取（find_all（'tag', attrs={'class':'value'}）

系统 xff1a Windows python 2 7 11 利用BeautifulSoup库抓取页面的一些标签TAG值再抓取一些特定属性的值示例标签 xff1a lt cc gt lt div id 61 34 post conten

python之BeautifulSoup之二 带属性值的抓取（find_all（'tag', attrs={'class':'value'}）

python之BeautifulSoup之二 带属性值的抓取（find_all（'tag', attrs={'class':'value'}） 的相关文章

随机推荐

热门标签

python之BeautifulSoup之二带属性值的抓取（find_all（'tag', attrs={'class':'value'}）

python之BeautifulSoup之二带属性值的抓取（find_all（'tag', attrs={'class':'value'}）的相关文章