我想知道如何检索每个结果<p>
tag.
import re
htmlText = '<p data="5" size="4">item1</p><p size="4">item2</p><p size="4">item3</p>'
print re.match('<p[^>]*size="[0-9]">(.*?)</p>', htmlText).groups()
result:
('item1', )
我需要的:
('item1', 'item2', 'item3')
对于此类问题,建议使用 DOM 解析器,而不是正则表达式。
我见过美丽的汤 http://www.crummy.com/software/BeautifulSoup/经常推荐用于 Python
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)