任何人都可以建议我在 Lucene 中获取每个文档的点击次数(出现次数)的最佳方法吗?..
Lucene 使用基于字段的索引,而不是基于文档的索引。
为了获取每个文档的术语计数:
- 使用迭代文档IndexReader.document()和 isDeleted()。
- 在文档 d 中,使用迭代字段文档.getFields().
- 对于每个字段 f,使用以下方法获取项getTermFreqVector().
- 检查项向量并计算每个项的频率总和。
- 每个字段的术语频率总和将为您提供文档的术语频率向量。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)