我是新蟒蛇。我有一个单词列表和一个非常大的文件。我想删除文件中包含单词列表中的单词的行。
单词列表按排序给出,并且可以在初始化期间输入。我正在努力寻找解决这个问题的最佳方法。我现在正在进行线性搜索,这花费了太多时间。
有什么建议么?
您可以使用intersection
从集合论来检查单词列表和一行中的单词是否有任何共同点。
list_of_words=[]
sett=set(list_of_words)
with open(inputfile) as f1,open(outputfile,'w') as f2:
for line in f1:
if len(set(line.split()).intersection(sett))>=1:
pass
else:
f2.write(line)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)