xuexila作文 lxml etree xpath如何同时选择多种标签tag

2023-11-19

以学习啦为例，说明如何选择一个大范围标签下面的两个及以上种类标签tag。
例如
div
p 1 /p
h2 2 /h2
p 3 /p
/div
只有同时可以选择p, h2，内容1,2,3的顺序才不会乱。

from lxml import etree
import requests
from requests.exceptions import HTTPError
import re
import os


def get_xuexila(url):
    try:
        res = requests.get(url)
        res.raise_for_status()
        res.encoding = 'UTF-8'
        tree = etree.HTML(res.text)
        ps = tree.xpath('//*[@id="contentText"]/p|//*[@id="contentText"]/h2')
        for onep in ps:
            print(onep.text)
    except HTTPError:
        print("HTTP Error!")


if __name__ == '__main__':
    url = input('输入学习啦url')
    get_xuexila(url)
    print('Done')

这里，关键点在于 whole path a | whole path b，而不是最后的p|h2，后面xpath 2.0或者可以支持。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

开发语言

xuexila作文 lxml etree xpath如何同时选择多种标签tag 的相关文章

Django REST序列化器：创建对象而不保存

我已经开始使用 Django REST 框架我想做的是使用一些 JSON 发布请求从中创建一个 Django 模型对象然后使用该对象而不保存它我的 Django 模型称为 SearchRequest 我所拥有的是 api view
如何在刻度标签和轴之间添加空间

我已成功增加刻度标签的字体但现在它们距离轴太近了我想在刻度标签和轴之间添加一点呼吸空间如果您不想全局更改间距通过编辑 rcParams 并且想要更简洁的方法请尝试以下操作 ax tick params axis both whic
Python、Tkinter、更改标签颜色

有没有一种简单的方法来更改按钮中文本的颜色 I use button text input text here 更改按下后按钮文本的内容是否存在类似的颜色变化 button color red Use the foreground设置按钮
导入错误：没有名为 _ssl 的模块

带 Python 2 7 的 Ubuntu Maverick 我不知道如何解决以下导入错误 gt gt gt import ssl Traceback most recent call last File
如何在 Sublime Text 2 的 OSX 终端中显示构建结果

我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它让我困扰的一件事是默认的构建结果显示在 ST2 的底部我的程序产生一些很长的结果显示它的理想方式如在 TM2 中是并排查看它们如何在 Mac 操作系统
如何在Windows上模拟socket.socketpair

标准Python函数套接字套接字对 https docs python org 3 library socket html socket socketpair不幸的是它在 Windows 上不可用从 Python 3 4 1 开始我
如何使用包含代码的“asyncio.sleep()”进行单元测试？

我在编写 asyncio sleep 包含的单元测试时遇到问题我要等待实际的睡眠时间吗 I used freezegun到嘲笑时间当我尝试使用普通可调用对象运行测试时这个库非常有用但我找不到运行包含 asyncio sleep 的测
打破嵌套循环[重复]

这个问题在这里已经有答案了有没有比抛出异常更简单的方法来打破嵌套循环在Perl https en wikipedia org wiki Perl 您可以为每个循环指定标签并且至少继续一个外循环 for x in range 10 fo
Python 中的二进制缓冲区

在Python中你可以使用StringIO https docs python org library struct html用于字符数据的类似文件的缓冲区内存映射文件 https docs python org library mmap
Python：字符串不会转换为浮点数[重复]

这个问题在这里已经有答案了我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
Geopandas 设置几何图形：MultiPolygon“等于 len 键和值”的 ValueError

我有 2 个带有几何列的地理数据框我将一些几何图形从 1 个复制到另一个这对于多边形效果很好但对于任何有效多多边形都会返回 ValueError 请指教如何解决这个问题我不知道是否如何为什么应该更改 MultiPolygon
如何将 numpy.matrix 提高到非整数幂？

The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
Python 3 中“map”类型的对象没有 len()

我在使用 Python 3 时遇到问题我得到了 Python 2 7 代码目前我正在尝试更新它我收到错误类型错误 map 类型的对象没有 len 在这部分 str len seed candidates 在我像这样初始化它之前 se
如何在 Django 中使用并发进程记录到单个文件而不使用独占锁

给定一个在多个服务器上同时执行的 Django 应用程序该应用程序如何记录到单个共享日志文件在网络共享中而不保持该文件以独占模式永久打开当您想要利用日志流时这种情况适用于 Windows Azure 网站上托管的 Django 应
用于运行可执行文件的python多线程进程

我正在尝试将一个在 Windows 上运行可执行文件并管理文本输出文件的 python 脚本升级到使用多线程进程的版本以便我可以利用多个核心我有四个独立版本的可执行文件每个线程都知道要访问它们这部分工作正常我遇到问题的地方是当它们
使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce
协方差矩阵的对角元素不是 1 pandas/numpy

我有以下数据框 A B 0 1 5 1 2 6 2 3 7 3 4 8 我想计算协方差 a df iloc 0 values b df iloc 1 values 使用 numpy 作为 cov numpy cov a b I get ar
Python - 字典和列表相交

给定以下数据结构找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出我可以将列表不是 dict1 组织到任何其他数
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例
Pandas 与 Numpy 数据帧

看这几行代码 df2 df copy df2 1 df 1 df 1 values 1 df2 ix 0 0 我们的教练说我们需要使用 values属性来访问底层的 numpy 数组否则我们的代码将无法工作我知道 pandas Data

随机推荐

浅谈HTTP中Get、Post、Put与Delete请求方式的区别

1 GET请求会向数据库发索取数据的请求从而来获取信息该请求就像数据库的select操作一样只是用来查询一下数据不会修改增加数据不会影响资源的内容即该请求不会产生副作用无论进行多少次操作结果都是一样的 2 与GET不同的是
房价预测回归模型--tensorflow2.0学习笔记--tf.keras使用实例

import tensorflow as tf import matplotlib as mpl import matplotlib pyplot as plt matplotlib inline import numpy as np im
Netty框架之概述及基本组件介绍

概述 Netty是由JBOSS提供的一个java开源框架是一个高性能高可扩展性的异步事件驱动的网络应用程序框架它极大地简化了TCP和UDP客户端和服务器开发等网络编程 NIO有下面的缺点 JDK 的 NIO 底层由 epoll
计算机文件及文件夹管理软件,常用管家(电脑文件夹管理工具)V1.1 免费版

常用管家电脑文件夹管理工具是一款很优秀好用的文件夹管理助手如果你需要一款好用的文件夹管理工具不妨试试小编带来的这款常用管家软件功能强大全面使用后可以帮助用户更轻松便捷的管理文件夹软件能够快速收藏和打开常用的文件夹网站并且能
决策树实战：california房价预测

Python3 7 决策树实战 california房价预测网上有好多2 版本的代码但是本地安装的是python3 7版本在学习中遇到很多问题有很多地方和2 版本的不一样所以记录下来方便参考侵权必删导入模块 import pa
CISCN2018-WP

MISC 验证码用token登录输入好验证码就可以得到flag Picture 图片隐写一下就想到binwalk或者winhex打开试试 binwalk打开无果将这段数据ctrl shift c复制出来用下面python脚本生成z
HTML标签及浮动
7.块设备驱动的I/O请求处理(2)

不适用请求队列使用请求队列对于一个机械磁盘设备而言的确有助于提高系统的性能但是对于RAMDISK ZRAM Compressed RAM Block Device 等完全可真正随机访问的设备而言无法从高级的请求队列逻辑中获益对于这些
稳定性相关大纲

稳定性建设的几个维度个人渣记录仅为自己搜索用的博客 CSDN博客道法术器稳定性相关代码产品灰度能力降级百分比能力动态diamond doom测试单元测试稳定性改造高资源占用优化方法架构上改造降流量例如心跳内部逻辑
真正的阅读者，是不需要荐书的

From http www luanxiang org blog archives 2136 html 早上一个朋友在朋友圈里跟我说上次你推荐的信息简史和知识的边界两本书我觉得很不错这条消息让我比较差异首先我并没有推荐过
数据集分割

步骤 1 确定训练集和测试集是否同分布常用方法 1 留出法实现直接将数据集拆分为互斥的训练集验证集和测试集划分比例训练集验证集测试集 7 1 5 1 5 注意事项单次使用留出法会导致模型不稳定保证三种数据集中样本比例的相
Linux 下使用 C++ 实现的 Web 文件服务器

项目地址 Github https github com shangguanyongshi WebFileServer 在学习完成 TCP IP 网络编程和 Linux高性能服务器编程后阅读了一些Web服务器的相关代码自动动手使用
code style

最近一直在看java convention和google c style 因为老板要提高代码质量我们小公司一个因为客户说我们的代码质量太烂了于是开始搞代码质量先从静态代码质量开始于是就研究起来code style 但是我发现
Pthread 并发编程（三）——深入理解线程取消机制

基本介绍线程取消机制是 pthread 给我们提供的一种用于取消线程执行的一种机制这种机制是在线程内部实现的仅仅能够在共享内存的多线程程序当中使用基本使用 include
【ARM】程序快速定位segmentation fault core dumped错误

1 应用场景 ARM开发过程中经常进程运行着出现段错误这时候单纯靠加日志打log效率太低使用gdb的话由于APP进程太多生成的core的文件特别大而且gdb在arm板子也不好单步调试不太友好还是pass掉目前使用段错误捕捉SI
Python3爬虫——用Xpath提取网页信息

Python3爬虫用Xpath提取网页信息前言本笔记用于记录整理requests库的一些基本知识内容会根据博主自己的认知作增添或压缩水平有限如有错误请不吝赐教本文需要读者初步了解HTML有关节点的相关知识文章目录 Pytho
Python技能练习！值得你看的28道常见题型汇总！（附答案解析）

今天给大家分享30道Python练习题建议大家先独立思考一下解题思路再查看答案文末有惊喜 1 已知一个字符串为 hello world yoyo 如何得到一个队列 hello world yoyo 使用 split 函数分割字符串
C#多线程Lock锁定的使用例子(多线程线程同步）

这个例子是一个模拟多个人在多台提款机上同时提取一个账户的款的情况在存取的过程中可能 A线程取了100 而B线程那边还看见账户上没少掉那100快所以导致数据不统一赋值出现问题下面代码则可以测试出加上Lock锁定与不加的区别先上
学会这几个简单的bat代码，轻松在朋友面前装一波13

这个标题是干什么用的最近看晚上某些人耍cmd耍的十分开心还自称为黑客着实比较搞笑他们那些花里胡哨的东西在外行看来十分nb 但只要略懂一些就会发现他们的那些十分搞笑和滑稽今天这里分享几个类似的方法让你在不懂行的朋友面前秀一波
xuexila作文 lxml etree xpath如何同时选择多种标签tag

以学习啦为例说明如何选择一个大范围标签下面的两个及以上种类标签tag 例如 div p 1 p h2 2 h2 p 3 p div 只有同时可以选择p h2 内容1 2 3的顺序才不会乱 from lxml import etree im

xuexila作文 lxml etree xpath如何同时选择多种标签tag

xuexila作文 lxml etree xpath如何同时选择多种标签tag 的相关文章

随机推荐

热门标签