我正在尝试在 R 中编写正则表达式来检测可能出现在字符串中任何位置的单词,但仅限于它作为整个单词出现时。
例如在
samplestr <- c("LT BLAHBLAH", "BLAH LT BLAH", "BLAHLT BLOO")
我想检测所有出现的“LT”,但不检测单词在较大组中包含 LT 的情况。 grepl("regex that Works",samplestr) (或类似的字符串检测函数)的所需输出将是:
TRUE TRUE FALSE
您可以使用grep
与正则表达式模式\bLT\b
:
samplestr <- c("LT BLAHBLAH", "BLAH LT BLAH", "BLAHLT BLOO")
output <- grep("\\bLT\\b", samplestr, value=TRUE)
output
[1] "LT BLAHBLAH" "BLAH LT BLAH"
图案\bLT\b
has 单词边界在两侧LT
,这只会匹配LT
当作为独立单词时,或者更一般地说,当被非单词字符包围时。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)