Lucene

Solr协会

最近几天我们正在考虑使用 Solr 作为我们选择的搜索引擎我们需要的大多数功能都是开箱即用的或者可以轻松配置然而我们绝对需要的一项功能似乎在 Solr 中被很好地隐藏或缺失我将尝试用一个例子来解释我们有很多实际上是企业的文件

Lucene searchengine Solr

lucene通配符查询带空格

我有 Lucene 索引其中包含城市名称考虑我想搜索新德里我有字符串 New Del 我想将其传递给 Lucene 搜索器并且我期望输出为 New Delhi 如果我生成类似 Name New Del 的查询它将为我提供所有带有

Lucene wildcard lucenenet

如何统计lucene索引中每个文档的term数？

我想知道 lucene 索引中每个文档的术语数量我一直在 API 和互联网上搜索但没有结果你能帮助我吗 Lucene 的构建是为了回答相反的问题即哪些文档包含给定术语因此为了获取文档的术语数量您必须进行一些修改第一种方法是存

Java Lucene

Lucene.Net 下划线导致令牌分裂

我已将 MsSqlServer 数据库表视图和存储过程编写到目录结构中然后使用 Lucene net 对其进行索引我的大多数表视图和过程名称都包含下划线我使用标准分析器如果我查询名为 tIr 的表例如发票 tnWtn01 我收

TSQL Lucene

SpatialQuery 使用 Lucene 进行基于位置的搜索

我的 lucene 索引已索引纬度和经度字段如下所示 doc Add new Field latitude latitude ToString Field Store YES Field Index UN TOKENIZED doc Ad

Lucene lucenenet

query_string 和 multi_match 有什么区别？

运行此查询时 query string query text fields field1 field2 multi match query text fields field1 field2 有什么不同何时使用其中之一何时使用另一个 q

elasticsearch Lucene

SOLR - Boost 函数 (bf) 以增加日期最接近 NOW 的文档的分数

我有一个 solr 实例其中包含具有 startTime 字段的文档范围从上个月到一年后我想添加一个提升查询函数来提升 startTime 字段接近当前时间的文档的分数到目前为止我已经看到很多使用 rord 为较新的文档添加增强

Lucene Solr

Lucene 4.4.0新增ControlledRealTimeReopenThread示例使用

在新的 Lucene 4 4 0 版本中近实时管理器 org apache lucene search NRTManage 已被替换为受控实时重开线程 https issues apache org jira browse LUCENE

Lucene

Elasticsearch：带有停用词消除功能的带状疱疹

我正在尝试实现一个 Elasticsearch 映射来优化大量文本中的短语搜索根据中的建议本文 http www elasticsearch org blog searching with shingles 我使用 shingle 过滤器

Lucene elasticsearch fulltextsearch

NoSQL（MongoDB）与 Lucene（或 Solr）作为数据库[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案随着基于文档数据库的 NoSQL 运动的发展我最近关注了 MongoDB 我注意到如何将项目视为文档就像 Lucene 以及 Solr 用

MongoDB Solr Lucene memcached NoSQL

当我使用完成建议器时，如何获得没有重复的独特建议？

我在我的环境中使用弹性 5 1 1 我在字段名称上选择了完成建议器post hashtags带有一个字符串数组来提供建议我收到前缀 inv 的响应如下 Req POST hashtag search pretty filter path

elasticsearch Lucene searchsuggestion

Lucene 标准分析器与 Snowball

刚刚开始使用 Lucene Net 我使用标准分析器索引了 100 000 行运行了一些测试查询并注意到如果原始术语是单数则复数查询不会返回结果我知道雪球分析器增加了词干支持这听起来不错不过我想知道超过标准的雪球锣是否有任何

fulltextsearch Lucene lucenenet NLP snowball

Solr/Solrj 分页

我正在创建的 Web 应用程序中使用 solr 和 solrj 来实现索引和搜索功能我的请求处理程序在 solrconfig xml 中配置如下

Java Solr Lucene solrj

Lucene 4.0 中的术语频率

尝试使用 Lucene 4 0 计算词频我的文档频率工作得很好但不知道如何使用 API 来执行术语频率这是我的代码 private static void addDoc IndexWriter writer String conten

Java Lucene

在elasticsearch中转义特殊字符

我正在使用Elasticsearch python 客户端 https elasticsearch py readthedocs io en master 对我们托管的 elasticsearch 实例进行一些查询我注意到一些字符需要转义

python elasticsearch replace Lucene escaping

在 Solr 中实现术语关联挖掘的最简单方法是什么？

关联挖矿似乎为检索提供了良好的结果相关术语在文本语料库中有很多关于这个主题的著作其中包括著名的LSA http en wikipedia org wiki Latent semantic analysis方法挖掘关联最直接的方法是构建

Lucene Solr Associations

MultiFieldQueryParser 正在从首字母缩略词中删除点

我再次发布这个问题因为我的查询没有得到答复我正在使用 Lucene 开发图书搜索 api 用户可以搜索标题或描述字段包含 C F A 的书籍我正在使用 StandardAnalyzer 以及停用词列表我使用 MultiFieldQu

Lucene lucenenet

如何使用 lucene 查询找到空的 Solr 文档字段

我有一些这样的文件

Solr Lucene

cursorMark是无状态的以及它如何解决深度分页

作为指定here https cwiki apache org confluence display solr Pagination of Results光标标记是无状态的但我不明白它是如何解决无状态的深度分页问题的 solr 是否按唯一

apache Solr Lucene solr4

Solr：在带有空格的字符串上使用通配符

我的问题与这里讨论的问题基本相同带空格的 Solr 通配符查询 https stackoverflow com questions 10023133 solr wildcard query with whitespace 但这个问题没有得

Solr Lucene wildcard