我需要将字符串分割成单词,然后将每个连续的单词成对连接,如下所示:
"This is my subject string"
会去:
"This is" "is my" "my subject" "subject string"
字符串的长度从 5 个单词到 250 个单词不等。此外,它还会对大量数据(1GB 左右)执行此操作。有没有一种有效的方法可以在Python中做到这一点?
我看过很多关于哪种方法最有效的建议,所以想先问问。
您可以使用 split 方法和列表理解来做到这一点:
text = "This is my subject string" words = text.split() #note that split without arguments splits on whitespace pairs = [words[i]+' '+words[i+1] for i in range(len(words)-1)] print(pairs)