如何使用 SolrJ 获取突出显示的片段？

2024-04-10

我正在将我的应用程序从 Lucene 迁移到 Solr。 Solr 可以更好地处理突出显示，但是如果我搜索关键字“city”，我会期望得到如下响应：

{
   "id":"fdc3833a-0e4f-4314-ba8c",
   "title": "Paris is a beautiful <b>city</b>",
   "description": "The <b>city</b> is a great example of......",
}

而我收到以下回复：

{
       "id":"fdc3833a-0e4f-4314-ba8c",
       "title": "Paris is a beautiful city",
       "description": "The city is a great example of......",
    }
    "highlighting": {
        "fdc3833a-0e4f-4314-ba8c": {
              "title": [
                "Paris is a beautiful <b>city</b>"
              ],
              "description": [
                "The <b>city</b> is a great example of......"
              ]
            }
        }

正如您所看到的，我得到的不是结果中突出显示的术语，而是一个名为“突出显示”的额外部分，这意味着我的 Java 代码必须更改。我的问题是：如何在 SolrJ 中获取亮点片段？

在 SolrJ 中，可以使用以下代码获取突出显示的片段：

public String getHighlightedText(final QueryResponse queryResponse, final String fieldName, final String docId) {
    String highlightedText = "";
    Map<String, Map<String, List<String>>> highlights = queryResponse.getHighlighting();
    if (highlights!=null && MapUtils.isNotEmpty(highlights.get(docId))) {
        List<String> snippets = highlights.get(docId).get(fieldName);
        if (CollectionUtils.isNotEmpty(snippets)) {
            highlightedText = getFragments(snippets);
        }
    }
return highlightedText;
}

private static final String getFragments(List<String> snippets){
        StringBuilder fragments = new StringBuilder();
        for (int i = 0; i < snippets.size(); i++) {
            if (i > 0) {
                fragments.append("............");
            }
            fragments.append(snippets.get(i));
        }
        return fragments.toString();
    }

请注意，此代码将为您提供单值字段的最佳片段，而您将需要多值字段的一些变体。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Solr

solrj

如何使用 SolrJ 获取突出显示的片段？的相关文章

LUCENE：搜索与正则表达式匹配的术语

我需要搜索 lucene 索引中的任何术语匹配特定的正则表达式我知道我可以使用TermsComponent在solr中如果配置如下
Solr 中的多值字段排序

我有一个 Solr 索引将每个产品的价格存储在多值字段中我需要按价格对结果集进行排序其中价格从低到高从高到低我尝试对价格进行排序它显示错误您无法对 multivalued True 字段进行排序下面是我的 solr XML
MIME 类型/内容类型，用于在 IE 和 Firefox 中使用 Excel 打开 CSV 文件

我在 Excel 中识别并打开 CSV 输出时遇到问题在我的 Web 应用程序中我有一个 java servlet 它将搜索结果返回给用户搜索结果由 Apache Solr 服务器提供 GUI 前端有一个选项允许用户请求 CSV 格
复杂的 SOLR 查询，包括 NOT 和 OR

我对 SOLR 搜索有一些相当复杂的要求我需要针对标记内容的数据库执行这些搜索我需要首先过滤数据库以获取与我的过滤器标签匹配的结果任何具有黑名单中的标签的结果都应被删除除非它们也包含白名单中的标签假设我想检索所有标记为森林或
ckan本地安装，solr JSP支持未配置500错误

我正在尝试使用 Ubuntu 14 04 LTS 在本地计算机上安装 CKAN 我按照从找到的源安装的说明进行操作here http docs ckan org en latest maintaining installing instal
Solr MoreLikeThis 不适用于多个分片？

我在 SolrCloud 中有 5 个节点集群每个节点有 2 个分片 Solr版本 6 3 0 现在当我运行 mlt 查询时它仅返回每个节点的结果并且不会将它们分布在所有分片节点上即没有给出任何结果给出结果我什至尝试将其指
如何使用 Solr 索引 pdf 内容？

我正在尝试使用 SolrJ 索引一些 pdf 文档如下所述http wiki apache org solr ContentStreamUpdateRequestExample http wiki apache org solr Cont
我们可以同时使用拼音标记和同义词吗？

我正在尝试同时启用语音分析器和同义词这似乎不起作用它们一起使用有错吗在下面的实现中我希望使用同义词转换搜索查询然后使用语音分析器来检索结果但我的同义词在这里完全被忽略了如果我在创建索引时删除语音分析器那么同义词就可以正常工作
在 solr 8 中的 fl 中使用父过滤器时获取“当架构嵌套时不应发送父过滤器”

我正在尝试使用子文档获取父文档但得到当模式嵌套时不应发送父过滤器 error 附上下面我尝试过但无法得到解决方案的查询 q parent which content type person fl child parentFilter c
在 Solr 中实现术语关联挖掘的最简单方法是什么？

关联挖矿似乎为检索提供了良好的结果相关术语在文本语料库中有很多关于这个主题的著作其中包括著名的LSA http en wikipedia org wiki Latent semantic analysis方法挖掘关联最直接的方法是构建
索引后文件被锁定

我的网络应用程序中有以下工作流程从存档下载 pdf 文件索引文件删除文件我的问题是对文件进行索引后它仍然处于锁定状态并且删除部分会引发异常这是我用于索引文件的代码片段 try ContentStreamUpdateReq
Solr 在 TrieDateField 上按年份过滤

我的 Solr 模式有一个字段类型tdate班级的solr TrieDateField
使用 ConcurrentUpdateSolrServer 需要哪些 jar？

目前使用 solrServer new CommonsHttpSolrServer serverUrl 和这些罐子 apache solr core 3 6 0 apache solr solrj 3 6 0 commons codec 1
Solr 不搜索整数？

我目前正在使用 Solr 为电子商务网站开发搜索引擎所以我在 schema xml 中得到这两个字段
SOLR - Boost 函数 (bf) 以增加日期最接近 NOW 的文档的分数

我有一个 solr 实例其中包含具有 startTime 字段的文档范围从上个月到一年后我想添加一个提升查询函数来提升 startTime 字段接近当前时间的文档的分数到目前为止我已经看到很多使用 rord 为较新的文档添加增强
是否可以检索与 Solr 中的查询匹配的字段名称？

我想动态地向用户显示哪个字段与发送到 Solr 的查询相匹配例如如果我有一个文档 document field1 yay field2 nay dynamic field hurr one yay two nay 我查询 yay 我是否
在云模式下设置 Apache Solr

我必须执行以下操作我必须在 2 个服务器节点上部署 Solr 在另一台服务器上部署 Zookeeper 将自定义配置上传到 Zookeeper 创建具有 2 个分片和 2 个副本的自定义集合 Solr 7 4 0 和 Zookeeper
Django-Haystack 和 Solr 8.5.1

Django haystack 是否适用于最新的 Solr 更新 8 5 1 另外我如何设置我的 Django 博客项目 CentOS 8 Solr 8 7 Django Oscar 3 0 1 安装Java yum update yum
Solr 自定义相似度

我想在我的 solr schema xml 中设置我自己的自定义相似度但我在理解此功能时遇到一些问题我想完全停用 solr 评分 tf idf coord 和 fieldNorm 我不知道从哪里开始我知道的事情我必须编写自己的 De
不指定字段名查询Solr

我是 Solr 的新手我一定错过了一些东西我在示例模式中还没有接触太多我导入了一些示例数据我也设置了LocalSolr 这似乎运作良好我的问题只是查询Solr一般来说我有一份文件其中name字段设置为tom 我一直在查看配置文

随机推荐

跨线程Winforms控件编辑[重复]

这个问题在这里已经有答案了如果编辑文本的代码属于与包含 Windows 窗体的线程不同的线程如何编辑 Windows 窗体元素中的文本我得到了例外跨线程操作无效控制 textBox1 是从创建它的线程以外的线程访问的谢谢您
Python 求和 excel 文件

我有一个包含 3 列的 Excel 文件请举例如下 Name Produce Number Adam oranges 6 bob Apples 5 Adam Apples 4 steve Peppers 7 bob Peppers 16
读取 ELF 部分的内容（以编程方式）

我正在尝试检索 ELF 二进制文件中附加部分的内容此时我使用以下代码来检索每个部分的名称 include
jQuery 验证 - 隐藏错误消息

我正在使用 jQuery 验证插件并希望禁用它创建的或元素容器来显示错误消息基本上我希望带有错误的输入元素具有错误类但不创建包含错误消息的附加元素这可能吗我刚刚想到了 CSS 解决方法但它并没有真正解决元素仍在创建的事实
Spring Cloud Sleuth-获取当前的traceId？

我正在使用 Sleuth 我想知道是否可以获取当前的 TraceId 我不需要添加任何回复或任何内容我只想要在某些情况下向开发团队发出警报的电子邮件的traceId Ex import brave Span import brave Tr
如何在 gitlab CI 中检测编译器警告

在我们的 gitlab 服务器上设置 CI 构建的步骤中我似乎找不到有关如何设置编译器警告检测的信息构建输出示例 100 Building CXX object somefile cpp o home gitlab runner bui
将数据从 Dynamodb 发送到 Amazon Elasticsearch 的最佳方式

我想知道将数据从 dynamoDB 发送到 elasticsearch 的最佳方式是什么 AWS SDK js https github com Stockflare lambda dynamo to elasticsearch blob
Android：从另一个活动返回时避免调用 onCreate()

假设我的应用程序包含两个活动 A 和 B 两者在 AndroidManifest 中都仅限于纵向活动 A 启动活动 B 在Activity B中有一个按钮它调用finish 当点击时问题是当我垂直握住设备纵向并单击按钮时调用
DT Shiny 中单列的渲染下拉列表

我不精通 Javascript 并且想复制下拉菜单中提供的功能兰森塔布尔 https jrowen github io rhandsontable dropdown autocomplete包但对于DT https rstudio gith
将 IEnumerable 对象序列化为字符串数组的扩展方法？

我的最后一个问题是关于将对象的字符串表示形式序列化为 XML https stackoverflow com questions 1138414 can i serialize xml straight to a string instea
为什么我的 dockerfile 不复制目录

在我的 dockerfile 中我有这两行 ADD ansible inventory etc ansible hosts ADD ansible ansiblerepo 第一行有效因为我可以运行容器并看到我的主机文件已填充了清单文件中的
使用 getElementsByName() 设置选项值

拥有这个字段集 fieldset legend death legend fieldset
如何从 javascript 中的 API 调用返回值到 React 组件

我似乎无法将 javascript 中此 API 调用的值返回到我的 React 组件我有一个调用 API 的 java 脚本文件在js文件中返回结果但是当我在react组件中调用useEffect中的js函数时它返回未定义 ex
ctags 多行 C 函数原型

ctags 有没有办法处理 C 中的多行函数原型我四处寻找 fields S应该做多行原型但我无法让它工作 ctags x c kinds pf fields S file file int foo int x int y ctags
django QueryDict 仅返回列表的最后一个值

使用 django 1 8 我观察到一些奇怪的事情这是我的 JavaScript function form submit var form form1 id request post this attr action form seri
面向对象的 CSS：这重要吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我刚刚发现这个有趣的演示 http www slideshare net stubbornella object oriented css ty
为什么React需要jsdom来测试？

在为 React 组件编写测试时您必须将它们渲染到 DOM 中以便断言它们的正确性例如如果您想测试某个类是否已添加到给定状态的节点则必须渲染到 DOM 节点然后通过普通 DOM API 检查该 DOM 节点问题是考虑到 Re
使用 C#、LINQ - 想要获取列名和数据值

我想以一种相当通用的方式显示一行的内容我将针对几个不同的表使用这种技术输出将是纯文本在 RichTextBox 中如下所示表名 PROPNUM xxxxxx 销售日期月日年最后一列最后一个值 a 我知道每个表的列名但真
在Vue组件模板中的元素属性中组合字符串和变量

我有一个表格其中有 1 个客户或 2 个客户我创建了一个用于选择计数的组件另一个用于显示客户端信息表单的组件因此如果有 2 个客户端使用 v for 则有 2 个表单 div div
如何使用 SolrJ 获取突出显示的片段？

我正在将我的应用程序从 Lucene 迁移到 Solr Solr 可以更好地处理突出显示但是如果我搜索关键字 city 我会期望得到如下响应 id fdc3833a 0e4f 4314 ba8c title Paris is a beau

如何使用 SolrJ 获取突出显示的片段？

如何使用 SolrJ 获取突出显示的片段？ 的相关文章

随机推荐

热门标签

如何使用 SolrJ 获取突出显示的片段？的相关文章