我想在数十亿个字符串中进行常规子字符串搜索。这个要求与一般的全文搜索有点不同,因为我希望查询“ubst”也可以点击“substr”。
Lucene 或 Sphinx 能够做到这一点吗?如果没有,您认为最好的方法是什么?
这种情况下的最佳索引结构是后缀树Lucene 没有实现这种类型的索引,因此它的子字符串搜索速度很慢。但是 lucene 有前缀树索引,这意味着如果您通过前缀搜索术语,您可以进行快速搜索。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)