lxml库

快速入门XPath语法，轻松解析爬虫时的HTML内容

快速入门XPath语法轻松解析爬虫时的HTML内容爬虫时很多网站返回的是HTML文件可以用正则表达式 re库或XPath语法来匹配目标内容这两种方法属于爬虫的基本技能实战中要会灵活运用对于一些结构和内容复杂的HTML 用re

PythonPYPI 爬虫 xpath XPath提取数据 lxml库