Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
Solr协会
最近几天我们正在考虑使用 Solr 作为我们选择的搜索引擎 我们需要的大多数功能都是开箱即用的或者可以轻松配置 然而 我们绝对需要的一项功能似乎在 Solr 中被很好地隐藏 或缺失 我将尝试用一个例子来解释 我们有很多实际上是企业的文件
Lucene
searchengine
Solr
lucene通配符查询带空格
我有 Lucene 索引 其中包含城市名称 考虑我想搜索 新德里 我有字符串 New Del 我想将其传递给 Lucene 搜索器 并且我期望输出为 New Delhi 如果我生成类似 Name New Del 的查询 它将为我提供所有带有
Lucene
wildcard
lucenenet
如何统计lucene索引中每个文档的term数?
我想知道 lucene 索引中每个文档的术语数量 我一直在 API 和互联网上搜索 但没有结果 你能帮助我吗 Lucene 的构建是为了回答相反的问题 即哪些文档包含给定术语 因此 为了获取文档的术语数量 您必须进行一些修改 第一种方法是存
Java
Lucene
Lucene.Net 下划线导致令牌分裂
我已将 MsSqlServer 数据库表 视图和存储过程编写到目录结构中 然后使用 Lucene net 对其进行索引 我的大多数表 视图和过程名称都包含下划线 我使用标准分析器 如果我查询名为 tIr 的表例如 发票 tnWtn01 我收
TSQL
Lucene
SpatialQuery 使用 Lucene 进行基于位置的搜索
我的 lucene 索引已索引纬度和经度字段 如下所示 doc Add new Field latitude latitude ToString Field Store YES Field Index UN TOKENIZED doc Ad
Lucene
lucenenet
query_string 和 multi_match 有什么区别?
运行此查询时 query string query text fields field1 field2 multi match query text fields field1 field2 有什么不同 何时使用其中之一 何时使用另一个 q
elasticsearch
Lucene
SOLR - Boost 函数 (bf) 以增加日期最接近 NOW 的文档的分数
我有一个 solr 实例 其中包含具有 startTime 字段的文档 范围从上个月到一年后 我想添加一个提升查询 函数来提升 startTime 字段接近当前时间的文档的分数 到目前为止 我已经看到很多使用 rord 为较新的文档添加增强
Lucene
Solr
Lucene 4.4.0新增ControlledRealTimeReopenThread示例使用
在新的 Lucene 4 4 0 版本中 近实时管理器 org apache lucene search NRTManage 已被替换为受控实时重开线程 https issues apache org jira browse LUCENE
Lucene
Elasticsearch:带有停用词消除功能的带状疱疹
我正在尝试实现一个 Elasticsearch 映射来优化大量文本中的短语搜索 根据中的建议本文 http www elasticsearch org blog searching with shingles 我使用 shingle 过滤器
Lucene
elasticsearch
fulltextsearch
NoSQL(MongoDB)与 Lucene(或 Solr)作为数据库[关闭]
Closed 这个问题是基于意见的 help closed questions 目前不接受答案 随着基于文档数据库的 NoSQL 运动的发展 我最近关注了 MongoDB 我注意到如何将项目视为 文档 就像 Lucene 以及 Solr 用
MongoDB
Solr
Lucene
memcached
NoSQL
当我使用完成建议器时,如何获得没有重复的独特建议?
我在我的环境中使用弹性 5 1 1 我在字段名称上选择了完成建议器post hashtags带有一个字符串数组来提供建议 我收到前缀 inv 的响应如下 Req POST hashtag search pretty filter path
elasticsearch
Lucene
searchsuggestion
Lucene 标准分析器与 Snowball
刚刚开始使用 Lucene Net 我使用标准分析器索引了 100 000 行 运行了一些测试查询 并注意到如果原始术语是单数 则复数查询不会返回结果 我知道雪球分析器增加了词干支持 这听起来不错 不过 我想知道 超过标准的雪球锣是否有任何
fulltextsearch
Lucene
lucenenet
NLP
snowball
Solr/Solrj 分页
我正在创建的 Web 应用程序中使用 solr 和 solrj 来实现索引和搜索功能 我的请求处理程序在 solrconfig xml 中配置如下
Java
Solr
Lucene
solrj
Lucene 4.0 中的术语频率
尝试使用 Lucene 4 0 计算词频 我的文档频率工作得很好 但不知道如何使用 API 来执行术语频率 这是我的代码 private static void addDoc IndexWriter writer String conten
Java
Lucene
在elasticsearch中转义特殊字符
我正在使用Elasticsearch python 客户端 https elasticsearch py readthedocs io en master 对我们托管的 elasticsearch 实例进行一些查询 我注意到一些字符需要转义
python
elasticsearch
replace
Lucene
escaping
在 Solr 中实现术语关联挖掘的最简单方法是什么?
关联挖矿似乎为检索提供了良好的结果相关术语在文本语料库中 有很多关于这个主题的著作 其中包括著名的LSA http en wikipedia org wiki Latent semantic analysis方法 挖掘关联最直接的方法是构建
Lucene
Solr
Associations
MultiFieldQueryParser 正在从首字母缩略词中删除点
我再次发布这个问题 因为我的查询没有得到答复 我正在使用 Lucene 开发图书搜索 api 用户可以搜索标题或描述字段包含 C F A 的书籍 我正在使用 StandardAnalyzer 以及停用词列表 我使用 MultiFieldQu
Lucene
lucenenet
如何使用 lucene 查询找到空的 Solr 文档字段
我有一些这样的文件
Solr
Lucene
cursorMark是无状态的以及它如何解决深度分页
作为指定here https cwiki apache org confluence display solr Pagination of Results光标标记是无状态的 但我不明白它是如何解决无状态的深度分页问题的 solr 是否按唯一
apache
Solr
Lucene
solr4
Solr:在带有空格的字符串上使用通配符
我的问题与这里讨论的问题基本相同 带空格的 Solr 通配符查询 https stackoverflow com questions 10023133 solr wildcard query with whitespace 但这个问题没有得
Solr
Lucene
wildcard
1
2
3
4
5
6
...19
»