我需要从 HTML 源文件中查找表单内容,我做了一些搜索并找到了很好的方法来做到这一点,但问题是它只打印第一个找到的内容,我如何循环遍历它并输出所有表单内容,而不是只是第一个?
line = 'bla bla bla<form>Form 1</form> some text...<form>Form 2</form> more text?'
matchObj = re.search('<form>(.*?)</form>', line, re.S)
print matchObj.group(1)
# Output: Form 1
# I need it to output every form content he found, not just first one...
不要使用正则表达式来解析 HTML。
但如果您需要查找字符串中的所有正则表达式匹配项,请使用findall功能。
import re
line = 'bla bla bla<form>Form 1</form> some text...<form>Form 2</form> more text?'
matches = re.findall('<form>(.*?)</form>', line, re.DOTALL)
print(matches)
# Output: ['Form 1', 'Form 2']
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)