我有一个包含大量信息的文件。例如,所有行都遵循与此相同的模式:
<school>Nebraska</school>
我正在尝试使用 split 函数来仅检索“内布拉斯加州”。这是我到目前为止所拥有的,但我不确定要放什么才能让它切断两个部分而不仅仅是第一个部分。
with open('Pro.txt') as fo:
for rec in fo:
print(rec.split('>')[1])
有了这个我得到:
Nebraska</school
你已经切断了绳子的一部分。继续以同样的方式进行:
>>> s = '<school>Nebraska</school>'
>>> s.split('>')[1]
'Nebraska</school'
>>> s.split('>')[1].split('<')[0]
'Nebraska'
也就是说,您应该使用像 BeautifulSoup 这样的 HTML 解析器来解析 HTML。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)