Solr高亮问题

2023-12-26

大家好,我有一个问题,当我查询 Solr 时,它会匹配结果,但是当我在此查询的结果上启用突出显示时,突出显示不起作用。

我的查询是

+内容:“项目 503”

内容是文本类型,并且文本项 503 中的一个重要内容显示为“项 503(c)”,最后的左括号会产生问题吗?请帮忙

这是 SolrConfig.xml 中的突出显示部分

  <highlighting>
   <!-- Configure the standard fragmenter -->
   <!-- This could most likely be commented out in the "default" case -->
   <fragmenter name="gap" class="org.apache.solr.highlight.GapFragmenter" default="true">
    <lst name="defaults">
     <int name="hl.fragsize">100</int>
    </lst>
   </fragmenter>

   <!-- A regular-expression-based fragmenter (f.i., for sentence extraction) -->
   <fragmenter name="regex" class="org.apache.solr.highlight.RegexFragmenter">
    <lst name="defaults">
      <!-- slightly smaller fragsizes work better because of slop -->
      <int name="hl.fragsize">70</int>
      <!-- allow 50% slop on fragment sizes -->
      <float name="hl.regex.slop">0.5</float>
      <!-- a basic sentence pattern -->
      <str name="hl.regex.pattern">[-\w ,/\n\"']{20,200}</str>
    </lst>
   </fragmenter>

   <!-- Configure the standard formatter -->
   <formatter name="html" class="org.apache.solr.highlight.HtmlFormatter" default="true">
    <lst name="defaults">
     <str name="hl.simple.pre"><![CDATA[<em>]]></str>
     <str name="hl.simple.post"><![CDATA[</em>]]></str>
    </lst>
   </formatter>
  </highlighting>

and here is fieldtype definition in schema.xml

  <fieldtype name="text" class="solr.TextField">
    <analyzer>
      <tokenizer class="solr.StandardTokenizerFactory" luceneMatchVersion="LUCENE_29"/>
      <filter class="solr.StandardFilterFactory"/>
     <!-- <filter class="solr.LowerCaseFilterFactory"/>
      <filter class="solr.StopFilterFactory" luceneMatchVersion="LUCENE_29"/>
      <filter class="solr.EnglishPorterFilterFactory"/>-->
    </analyzer>
  </fieldtype>

and here is field definition

<field name="Contents" type="text" indexed="true" stored="true" />

问候 阿山。


您是否也尝试过存储术语向量?如果您使用快速矢量荧光笔(我认为 Solr 可能默认使用),您将需要它们。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Solr高亮问题 的相关文章

  • 我们可以同时使用拼音标记和同义词吗?

    我正在尝试同时启用语音分析器和同义词 这似乎不起作用 它们一起使用有错吗 在下面的实现中 我希望使用同义词转换搜索查询 然后使用语音分析器来检索结果 但我的同义词在这里完全被忽略了 如果我在创建索引时删除语音分析器 那么同义词就可以正常工作
  • Solr 动态价格范围和组

    跟进问题 如何获取 solr 结果中的方面范围 https stackoverflow com questions 33956 how to get facet ranges in solr results SolR 查询 价格范围 htt
  • 在 Solr 中实现术语关联挖掘的最简单方法是什么?

    关联挖矿似乎为检索提供了良好的结果相关术语在文本语料库中 有很多关于这个主题的著作 其中包括著名的LSA http en wikipedia org wiki Latent semantic analysis方法 挖掘关联最直接的方法是构建
  • Solr 索引时间提升 VS 查询时间提升?

    问题 1 我们可以只进行查询时间提升 使用 dismax 而不在索引时间提及提升值吗 问题 2 与查询时间提升相比 索引时间提升有何优点 缺点 反之亦然 查询时间和索引时间提升 在索引时 您可以选择提升特定文档 整个文档或仅一个字段 它作为
  • 如何备份Solr数据库?

    我想知道如何备份 转储 Solr 数据库 如果只是复制一些文件 请指定哪些文件 文件名 位置等 Thanks We use Solr复制 http wiki apache org solr SolrReplication做我们的备份 您可以
  • 在 MongoDB 和 Apache Solr 之间同步数据的简单方法

    我最近开始使用 MongoDB 和 Apache Solr 我使用 MongoDB 作为数据存储 并且希望 Apache Solr 为我的数据创建索引 以实现应用程序中的搜索功能 经过一些研究 我发现 基本上有两种方法可以在 MongoDB
  • Solr 不搜索整数?

    我目前正在使用 Solr 为电子商务网站开发搜索引擎 所以我在 schema xml 中得到这两个字段
  • Solr 中的拼写检查中阈值频率不起作用

    我得到stuck在中间Solr 我只需要最流行的词 w r t query 我用过语音过滤器双方索引和查询但这里的problem是它正在给予术语太多 我只需要几个术语这是非常具体的query 模式 xml
  • 自定义存储库的 Spring Data Solr 优先级

    我需要在 Spring Data Solr 自定义存储库中实现以下内容 X 或 Y 和 Z 我当前的代码如下 Criteria criteria new Criteria x is X VALUE criteria criteria or
  • SOLR - Boost 函数 (bf) 以增加日期最接近 NOW 的文档的分数

    我有一个 solr 实例 其中包含具有 startTime 字段的文档 范围从上个月到一年后 我想添加一个提升查询 函数来提升 startTime 字段接近当前时间的文档的分数 到目前为止 我已经看到很多使用 rord 为较新的文档添加增强
  • Solr 增量导入不起作用

    我使用的是solr 4 2 请注意 完全导入有效 但增量导入却无效 增量导入不会给出任何错误 但不会获取任何更改 这是数据配置文件
  • 如何统计lucene索引中每个文档的term数?

    我想知道 lucene 索引中每个文档的术语数量 我一直在 API 和互联网上搜索 但没有结果 你能帮助我吗 Lucene 的构建是为了回答相反的问题 即哪些文档包含给定术语 因此 为了获取文档的术语数量 您必须进行一些修改 第一种方法是存
  • lucene 如何与 Neo4j 配合使用

    我是新来的Neo4j and Solr Lucene 我读到我们可以在 Neo4j 中使用 lucene 查询 这是如何工作的 Neo4j中使用lucene查询有什么用 我还需要一个建议 我需要编写一个应用程序来搜索和分析数据 which
  • 在 Solr 更新中指定多值术语频率?

    我有一个包含多值字段的 Solr 模式 我正在 Solr 外部解析文档并使用更新索引http wiki apache org solr UpdateJSON http wiki apache org solr UpdateJSON 也可以看
  • 在 Ecom 应用程序中实施 SOLR 的最佳实践是什么?

    我是 SOLR 的新用户 我正在开发一个具有 SQL 数据库的电子商务 Web 应用程序 我想在应用程序中为我的 类别页面 实现 SOLR 我们将在其中显示该类别的产品以及特定信息 例如可用库存 价格和更多详细信息 此外 我们希望根据库存情
  • 使用进度条时出错:Max 必须是正整数

    每当我用 solr 重新索引 a 时 都会收到以下错误 RAILS ENV development rake sunspot solr reindex Error using progress bar Max must be a posit
  • Django-Haystack 和 Solr 8.5.1

    Django haystack 是否适用于最新的 Solr 更新 8 5 1 另外我如何设置我的 Django 博客项目 CentOS 8 Solr 8 7 Django Oscar 3 0 1 安装Java yum update yum
  • Solr 自定义相似度

    我想在我的 solr schema xml 中设置我自己的自定义相似度 但我在理解此功能时遇到一些问题 我想完全停用 solr 评分 tf idf coord 和 fieldNorm 我不知道从哪里开始 我知道的事情 我必须编写自己的 De
  • 测量文档集之间的相似性

    出于说明目的 我们假设这是一个论坛服务 我需要计算每个用户帖子之间的 相似度 结果如下 among posts by user A similarity 60 among posts by user B similarity 20 我正在处
  • PHP Solr PECL 扩展安装

    我已经使用命令安装了 pecl solr pecl install solr 和梨使用 wget http pear php net go pear phar php go pear phar 重启Apache后 我仍然收到错误 Fatal

随机推荐

  • Powershell脚本文件名增量

    在 Powershell 中 我想自动化更改一组文件的文件名的过程 并将类似文件的最新版本复制到该目录 删除最旧的 file3 bak gt none 增加备份目录中当前文件的文件名 file1 bak gt file2 bak file2
  • Python suds 显示以下问题“RuntimeError:超出最大递归深度”

    我正在调用一个 Documentum Web 服务 我从一个简单的代码开始 from suds client import Client UnresolvedImport from suds transport https import H
  • 在 Swift 4 中动态更改状态栏颜色

    我想更改状态栏颜色 lightContent and default动态地 因为我的背景可以在同一个 ViewController 中改变 我尝试为此创建一个如下所示的函数 func changeStatusBar useDefault B
  • 为什么内联列表项不换行?

    请参阅demo http jsfiddle net DdWJg 1 怎么来的li不换行到下一行吗 我不是在寻找解决方案 因为有几个解决方案并且它们有效 但我想知道为什么它不包装 在中找不到任何内容the spec http www w3 o
  • Visual C++ 智能感知比编译器“更智能”吗

    我有以下场景 我有一个基类 从中派生出一个类 一切看起来都很好 但是 每次我将鼠标光标悬停在基类的继承成员上时 智能感知都会显示它很好 EG BaseClass SomeMember 但是 当我尝试编译时 编译器显示各种错误 它们与智能感知
  • 如何以编程方式选择列表视图中的项目

    我有一个ArrayList
  • xtable 标题对齐方式与表格左对齐或居中(使用knitr)

    我想将 xtable 图形标题与表格左对齐 或者如果这不起作用 至少居中 因为我认为小表格居中而相应的标题左对齐看起来有点愚蠢 此外 左对齐表格和标题也不是最佳选择 应该是可以的using https stackoverflow com q
  • 使用带有 ajax 的 google 图表出现内存泄漏

    我对 javascript 相当陌生 并且在某些代码中找不到内存泄漏 这些代码每秒使用 ajax 数据更新 google 图表 我的代码 简化为一个小测试用例 function TimeLine id max this chart new
  • 无法重置Root密码:windows、MySQL8.0

    我忘记了 root 密码 我正在遵循官方网站 https dev mysql com doc mysql windows excerpt 8 0 en resetting permissions windows html重置我的密码 我已按
  • 在 RabbitMQ 中,哪个更昂贵,每个交换器有多个队列,还是多个交换器且每个交换器有更少的队列?

    因此 我们决定在向微服务架构的迁移中使用 RabbitMQ 作为消息 事件总线 但我们无法找到放置队列的最佳方式的明确答案 我们有两个选择 One main exchange which will be a Fanout exchange
  • 已安装 Poetry 但“poetry:未找到命令”

    最近我在诗歌方面遇到了一百万零一个问题 我昨天已经完全安装并工作了 但是重新启动我的机器后 我又遇到了问题 即使在重新启动后 是否有办法在我的终端中始终识别诗歌 系统规格 Windows 10 Visual Studio 代码 Bash W
  • Horizo​​ntalScrollView,自动滚动到结束并有动画

    我有一个horizo ntalScrollView 当我加载视图时 我需要进行自动滚动以以动画结束 我已经实现了这个方法来做到这一点 final HorizontalScrollView strip HorizontalScrollView
  • Selenium WebDriver 查找第 n 个元素

    我遇到了一个问题 无法解决它 我必须访问页面上的第 n 个图像 该图像位于 HTML 内的表格中 我需要单击图像以分别为每一行移动到下一个屏幕 我已经尝试了此处提供的各种解决方案 但由于我正在使用 findElement by 语法 因此我
  • 缩放 HTML5 视频并打破宽高比以填充整个网站

    我想使用 4 3 视频作为网站的背景 但是 将宽度和高度设置为 100 不起作用 因为宽高比保持不变 因此视频不会填充网站的整个宽度 这是我的 HTML 和 CSS 代码 HTML
  • 如何通过 Android KitKat 在外部 SD 卡上使用 O_DIRECT 或 O_SYNC

    我在一家生产包含硬件加密引擎的 SD 存储卡的公司工作 我们通过写入 读取特殊文件来与加密模块交互 从 KitKat 开始 O DIRECT外部 SD 卡似乎不支持该标志 没有O DIRECT or O SYNC支持 当我们从 SD 卡 通
  • RFID RC522 Raspberry PI 2 Windows 物联网

    我正在寻找一种在 Windows IOT 上的 Raspberry Pi 2 0 上使用 RFID RC522 的方法 当然不是官方兼容的 官方的 OM5577 演示板 在法国太贵了 我还没有找到任何经销商在没有大量运费的情况下出售它 总成
  • JS:获取元素的可见区域坐标

    我需要一个函数 可以计算当前在屏幕上可见的元素的可见区域 而无需隐藏部分overflow scroll position absolute etc 也就是这个函数的结果getVisiblePart el 将Visible Rect is x
  • 将 OpenCV 与 Tkinter 结合使用

    我正在编写一个程序 需要在 Tkinter 窗口中显示视频流 由于还有用于执行各种功能的按钮 因此我使用网格来组织所有内容 以下代码 修改自显示网络摄像头序列 TkInter https stackoverflow com question
  • 绘制按函数分组的多个图形并将其保存为 pdf

    我想创建一个包含 12 个图的 pdf 文件 有两个选项 每页一个图 每页四个图 Using plt savefig months pdf 仅保存最后一个图 MWE import pandas as pd index pd date ran
  • Solr高亮问题

    大家好 我有一个问题 当我查询 Solr 时 它会匹配结果 但是当我在此查询的结果上启用突出显示时 突出显示不起作用 我的查询是 内容 项目 503 内容是文本类型 并且文本项 503 中的一个重要内容显示为 项 503 c 最后的左括号会