Lucene索引中“-”字符的问题

2024-01-09

我在使用 Lucene 索引时遇到问题，该索引已索引包含“-”字符的单词。

它适用于某些包含“-”的单词，但不适用于所有单词，我找不到它不起作用的原因。

我正在搜索的字段经过分析并包含带有和不带有“-”字符的单词版本。

我正在使用分析器：org.apache.lucene.analysis.standard.StandardAnalyzer

这是一个例子：

如果我搜索“gsx-*”我得到一个结果，索引字段包含 “铃木 GSX-R 1000 GSX-R1000 GSXR”

但如果我搜索“v-*”我没有结果。预期结果的索引字段包含： “铃木 DL 1000 V-STROM DL1000V-STROMVSTROM V STROM”

如果我搜索不带“*”的“v-strom”，它会起作用，但如果我只搜索“v-str”，则我不会得到结果。（应该有结果，因为它是针对网上商店的实时搜索）

那么，这两个预期结果有什么区别呢？为什么它适用于“gsx-” 但不适合“v-" ?

我相信，StandardAnalyzer 会将连字符视为空格。所以它改变了你的查询"gsx-*" into "gsx*" and "v-*"变成空无一物，因为 at 也消除了单字母标记。您在搜索结果中看到的字段内容是该字段的存储值，它完全独立于为该字段建立索引的术语。

所以你想要的是“v-strom”作为一个整体成为一个索引术语。StandardAnalyzer不适合这种类型的文本。也许可以尝试一下WhitespaceAnalyzer or SimpleAnalyzer。如果这仍然不能解决问题，您还可以选择将自己的分析器组合在一起，或者只是开始这两个分析器并进一步组合它们TokenFilters。给出了很好的解释Lucene 分析包 Javadoc。 http://lucene.apache.org/core/old_versioned_docs/versions/3_5_0/api/all/org/apache/lucene/analysis/package-summary.html

顺便说一句，无需在索引中输入所有变体，例如 V-strom、V-Strom 等。其想法是让同一个分析器在索引中和解析查询时将所有这些变体标准化为同一字符串。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Lucene索引中“-”字符的问题的相关文章

在文本文件中写入多行（java）

下面的代码是运行命令cmd并使用命令行的输出生成一个文本文件下面的代码在 Eclipse 的输出窗口中显示了正确的信息但在文本文件中只打印了最后一行谁能帮我这个 import java io public class TextFile
这个函数（for循环）空间复杂度是O(1)还是O(n)？

public void check 10 for string i list Integer a hashtable get i if a gt 10 hashtable remove i 这是 O 1 还是 O n 我猜测 O n 但不是
org.apache.sling.api.resource,version=[2.3,3) -- 无法解析

您好我无法访问我的项目内容我已经上传了从 CQ 访问内容所需的所有包我唯一能看到的是 org apache sling api resource version 2 3 3 无法解析这是否是异常的原因如果是请告诉我如何解决中Q
java中如何连接字符串

这是我的字符串连接代码 StringSecret java public class StringSecret public static void main String args String s new String abc s co
JavaFX 中具有自定义内容的 ListView

How i can make custom ListView with JavaFx for my app I need HBox with image and 2 Labels for each line listView 您可以通过查看
Hibernate.createBlob() 方法从 Hibernate 4.0.1 开始已弃用，并移至 Hibernate.getLobCreator(Session session).createBlob()

Method Hibernate createBlob 已弃用自休眠4 0 1并搬到Hibernate getLobCreator Session session createBlob 任何解决方案我应该在方法内传递什么getLobCrea
在 S3 中迭代对象时出现“ConnectionPoolTimeoutException”

我已经使用 aws java API 一段时间了没有遇到太多问题目前我使用的是库 1 5 2 版本当我使用以下代码迭代文件夹内的对象时 AmazonS3 s3 new AmazonS3Client new PropertiesCred
匿名类上的 NotSerializedException

我有一个用于过滤项目的界面 public interface KeyValFilter extends Serializable public static final long serialVersionUID 7069537470113
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
普罗米修斯指标 - 未找到

我有 Spring Boot 应用程序并且正在使用 vertx 我想监控服务和 jvm 为此我选择了 Prometheus 这是我的监控配置类 Configuration public class MonitoringConfig Bea
在游戏视图下添加 admob

我一直试图将 admob 放在我的游戏视图下这是我的代码 public class HoodStarGame extends AndroidApplication Override public void onCreate Bundle
IntelliJ - 调试模式 - 在程序内存中搜索文本

我正在与无证的第三方库合作我知道有一定的String存储在库深处的某个字段中的某处我可以预测的动态值但我想从库的 API 中获取它有没有一种方法可以通过以下方式进行搜索类似于全文搜索 full程序内存处于调试模式并在某个断点处停止
如何知道抛出了哪个异常

我正在对我们的代码库进行审查有很多这样的陈述 try doSomething catch Exception e 但我想要一种方法来知道 doSomething 抛出了哪个异常在 doSomething 的实现中没有 throw 语句
java.lang.NumberFormatException: Invalid int: "3546504756"，这个错误是什么意思？

我正在创建一个 Android 应用程序并且正在从文本文件中读取一些坐标我在用着Integer parseInt xCoordinateStringFromFile 将 X 坐标转换为整数 Y 坐标的转换方法相同当我运行该应用程序时
Netty：阻止调用以获取连接的服务器通道？

呼吁ServerBootstrap bind 返回一个Channel但这不是在Connected状态因此不能用于写入客户端 Netty 文档中的所有示例都显示写入Channel从它的ChannelHandler的事件如channelCon
我可以创建自定义 java.* 包吗？

我可以创建一个与预定义包同名的自己的包吗在Java中比如java lang 如果是这样结果会怎样这难道不能让我访问该包的受保护的成员如果不是是什么阻止我这样做 No java lang被禁止安全管理器不允许自定义类java
hashcode 的默认实现为以相同方式构造的对象返回不同的值

我在这里编写一个示例代码 public class Test private int i private int j public Test TODO Auto generated constructor stub public Test
调整添加的绘制组件的大小和奇怪的摆动行为

这个问题困扰了我好几天我正在制作一个特殊的绘画程序我制作了一个 JPanel 并添加了使用 Paint 方法绘制的自定义 jComponent 问题是每当我调整窗口大小时所有添加的组件都会消失或者只是不绘制因此我最终会得到一个
带有 Maven Wrapper 的 Java 17 导致无法识别的 VM 选项“MaxPermSize=512m”

I use OpenJDK 17 https jdk java net 17 使用 Maven Wrapper 3 8 2 从春季初始化 https start spring io Maven项目 JAR打包 Java 17 Spring
如何修复：“无法解析类型 java.lang.CharSequence。它是从所需的 .class 文件间接引用的”消息？ [复制]

这个问题在这里已经有答案了我正在尝试使用这个字符串 amountStr amountStr replace replace replace 但我收到一条错误消息我知道我收到的错误消息是因为我刚刚发布的字符串已过时所以我想知道该字符串的

随机推荐

Mercurial 中的版本控制扩展配置

通常我会通过添加以下内容来启用扩展 hg hgrc extensions hgext win32text encode cleverencode decode cleverdecode 但是我希望此配置进行版本控制即存储库的一部分以
如何在puppeteer js中填写日期

我在表格上有以下内容
将自己的框架或库添加到 AOSP

我正在尝试将我的自定义包添加到 AOSP 下frameworks opt mypackage 我提供了一个Android mkMakefile 包含以下内容 LOCAL PATH call my dir include CLEAR VARS
在 Python 中使用 Pandas 查找每日最大小时数

我试图在我的需求时间序列中找到每天最大需求的时间我创建了一个数据框看起来像 power 2011 01 01 00 00 00 1015 70 2011 01 01 01 00 00 1015 70 2011 01 01 02 00 0
Yii2 中 GridView 的默认过滤器

我不知道如何设置GridView的默认过滤器这意味着当页面加载时它将加载具有我设置的特定条件的过滤器有什么想法吗谢谢实现此目的的一个简单方法是使用搜索模型我使用默认 Gii 生成的代码来解释方法 public function
添加两个 RDD[mllib.linalg.Vector]

我需要添加存储在两个文件中的两个矩阵内容为latest1 txt and latest2 txt有下一个 str 1 2 3 4 5 6 7 8 9 我正在阅读这些文件如下所示 scala gt val rows sc textFile
如何在react js应用程序中使用react-gtm-module？

在我的反应应用程序中我使用react gtm module 我只有 GTM ID 我将以下代码放入每个页面路由器组件中 import TagManager from react gtm module componentDidMount co
如何构建和使用flink-connector-kinesis？

我正在尝试将 Apache Flink 与 AWS kinesis 结合使用这document https ci apache org projects flink flink docs release 1 7 dev connector
如何从 nodejs/express 向浏览器发送成功状态？

我在我的nodeJS Expressjs服务器中编写了以下代码 app post settings function req res var myData a req param a b req param b c req param c
HTML/JavaScript Windows 应用商店应用程序可以在可调整大小的窗口中运行吗？

我即将开始在 Windows 8 1 上开发应用程序为了利用我现有的技能和经验我更愿意使用 HTML 而不是 XAML 作为前端我不想全屏运行应用程序而是希望将其放在老式的 WPF WinForms 样式窗口中该窗口可以调整大小
替换嵌套 NSDictionary 中出现的 NSNull

这个问题类似于这个问题 https stackoverflow com questions 8075147 replace all nsnull objects in an nsdictionary 但是此方法仅适用于字典的根级别我正在寻
将 Maildir 转换为 mbox

我正在更改主机并且需要将旧服务器上的 maildir 帐户转换为新服务器上的 mbox 关于最好的方法有什么想法吗我找到了这个 for i in new cur do formail gt mbox done 但我真的不太明白我有 L
IIS 10 错误 500.19 (0x80070021) - 锁定冲突

我有一个应用程序我正在尝试从 Server 2012 IIS 8 迁移到 Server 2016 IIS 10 当我最初移动所有内容时我收到了附加的错误消息我已经阅读了几篇堆栈交换帖子它基本上说该部分需要解锁我已通过命令提示符命令
在 SharedPreferences 中存储数组列表对象

该方法将新对象添加到ArrayList get text from textview time date getText toString entry d entry getText toString dayName day getText
Angular Material 2 中的 md-table

我正在与角材料表 https material angular io components table overview在Html代码中有
将项目升级到 MVC 5

我一直在寻找一种解决方案来升级当前的 MVC 4 应用程序我必须使用新的 MVC 5 二进制文件我在任何地方都找不到解决方案有人有主意吗 Visual Studio 2013 只需允许 Nuget 包管理器运行更新即可自动升级项目 S
调用方法一次以在 Django Rest Framework 序列化器中设置多个字段

如何使用 Django Rest Framework 序列化程序调用同一方法一次来设置多个字段这就是我现在所做的但这显然调用了该方法两次如何限制它只能被调用一次 class MyModel models Model def GetTw
我应该实现 onRetainNonConfigurationInstance 吗？

我刚刚读到有关维护 Android 应用程序状态的内容并偶然发现了 onRetainNonConfigurationInstance 但在阅读时文档 http developer android com reference android
Flutter：如何将 URI 转换为文件？

我想将路径 content media external images media 138501 转换为文件并在图像中设置 Code File imageFile File content media external images med
Lucene索引中“-”字符的问题

我在使用 Lucene 索引时遇到问题该索引已索引包含字符的单词它适用于某些包含的单词但不适用于所有单词我找不到它不起作用的原因我正在搜索的字段经过分析并包含带有和不带有字符的单词版本我正在使用分析器 org apache

Lucene索引中“-”字符的问题

Lucene索引中“-”字符的问题 的相关文章

随机推荐

热门标签

Lucene索引中“-”字符的问题的相关文章