python正则表达式去除重复单词

2023-11-24

我是Python新手

如果有重复的话我想换句话。

Correct

  • 前任。 “这真是太好了” --> “这真是太好了”
  • 前任。 “这就是这样”-->“这就是这样”

现在我正在使用这个reg。但这一切在字母上都发生了变化。 前任。 “我和我的朋友很高兴”-->“我的朋友和很高兴”(它删除了“i”和空格)错误

text = re.sub(r'(\w+)\1', r'\1', text) #remove duplicated words in row

我怎样才能做同样的改变,但它必须检查单词而不是字母?


text = re.sub(r'\b(\w+)( \1\b)+', r'\1', text) #remove duplicated words in row

The \b匹配空字符串,但仅匹配单词的开头或结尾。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

python正则表达式去除重复单词 的相关文章

随机推荐