如果我创建一个文档并添加一个既存储又分析的字段,那么我如何将该字段作为标记列表读回?我有以下内容:
Document doc = new Document();
doc.add(new Field("url", fileName, Store.YES, Index.NOT_ANALYZED));
doc.add(new Field("text", fileContent, Store.YES, Index.ANALYZED));
// add the document to the index
writer.addDocument(doc);
所以 fileContext 是一个包含大量文本的字符串。当它存储在索引中时,它会被分析并被标记化。然而,我怎样才能获得这些代币呢?我可以在存储文档后从索引中检索文档,并且可以从文档中读取“文本”字段,但这是作为字符串返回的。如果可能的话我想获得代币。我的“writer”是一个 IndexWriter 实例,它使用 StandardAnalyzer。任何指示都将受到非常欢迎。
非常感谢
查看document.getField("name").tokenStreamValue()
.
编辑:实际上这个问题使用上述内容为您提供完整的解决方案TokenStream
.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)