lucene 字段的 store 属性

2024-01-27

lucene Field有一个构造函数:

Field(String name, String value, Store store, Index index)

例如,我可以通过以下方式创建一个新字段:

Field f1 = new Field("text", "The text content", Field.Store.YES, Field.Index.ANALYZED);

我不太确定第四个参数的含义:Index

如果我将其设置为Index.No,那么是否需要将这个字段添加为“字段”呢?

因为在我看来,一旦一个属性被声明为字段,它就应该被索引,如果没有那么为什么要把它声明为字段呢?

查询和搜索有什么区别?


存储的字段是当您要求 Lucene 还给你一份文档 http://lucene.apache.org/java/3_0_2/api/all/org/apache/lucene/index/IndexReader.html#document%28int%29。它们保留了一个字段的原始值,没有进行任何分析。您可以使用它们向用户呈现文档(不一定是所有字段)。

未建立索引的存储字段对于存储用户不会用来查询索引的文档的元数据非常有用。例如,文档来自的数据库 ID。用户永远不会使用这个 id,因为他们不知道它,所以索引它通常是没有用的。但是如果您存储它,那么您可以使用它在运行时从数据库收集额外信息。

查询和搜索之间的区别相当主观。对于我自己来说,搜索实际上是在索引中搜索的一般行为,而查询是实际的用于搜索索引的查询字符串 http://lucene.apache.org/java/3_0_2/queryparsersyntax.html.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

lucene 字段的 store 属性 的相关文章

  • java中的高亮文本

    我们正在开发抄袭检测框架 在那里我必须强调文档中可能抄袭的短语 首先对文档进行预处理 包括停用词删除 词干提取和数字删除 因此 预处理标记的突出显示变得困难 作为和示例 原文 极限编程是敏捷软件开发的一种方法 它强调在短开发周期 称为时间盒
  • Spring Data - MongoDB 索引 DBRef

    我正在使用 spring data mongodb 1 2 0 RELEASE 我有两个类 A 和 B 其中 B 引用了 A 并且用 DBRef 进行了注释 Class A Document collection a public clas
  • SOLR - Boost 函数 (bf) 以增加日期最接近 NOW 的文档的分数

    我有一个 solr 实例 其中包含具有 startTime 字段的文档 范围从上个月到一年后 我想添加一个提升查询 函数来提升 startTime 字段接近当前时间的文档的分数 到目前为止 我已经看到很多使用 rord 为较新的文档添加增强
  • 公共领域还好吗?

    在你像我最初那样做出直觉反应之前 请阅读整个问题 我知道它们让你感觉很脏 我知道我们以前都被烧伤过 我知道这不是 好风格 但是公共场所可以吗 我正在开发一个相当大规模的工程应用程序 该应用程序创建并使用结构的内存模型 从高层建筑到桥梁再到棚
  • 索引匹配不起作用

    对于下表 如果 A 列和 B 列都匹配 如何检索 C 列A 列 B 列 C 列城市 1 城市 10 本地城市 2 城市 21 远程城市 3 城市 1 远程城市 4 城市 2 本地 我尝试使用索引和匹配 但得到 N A Enter as an
  • 为 MongoDB 中的对象数组建立索引

    我有一个巨大的电子邮件转储 我正在尝试在 MongoDB 中存储和查询它 有 160 万封电子邮件 每封电子邮件都存储为节点模块 https github com andris9 mailparser它将原始电子邮件解析为漂亮的 Javas
  • 根据 MySQL 列内容的长度创建索引?

    如何根据值的长度在 MySQL v 5 0 myisam 数据库引擎 中的列上创建索引 它是文本数据类型 最多 7000 个字符 我是否必须添加具有第一列长度的另一列 是的 因为 MySQL 不支持基于函数的索引 例如ADD INDEX m
  • 如何统计lucene索引中每个文档的term数?

    我想知道 lucene 索引中每个文档的术语数量 我一直在 API 和互联网上搜索 但没有结果 你能帮助我吗 Lucene 的构建是为了回答相反的问题 即哪些文档包含给定术语 因此 为了获取文档的术语数量 您必须进行一些修改 第一种方法是存
  • 对具有许多索引的表进行缓慢的批量插入

    我尝试将数百万条记录插入到具有 20 多个索引的表中 在上次运行中 每 100 000 行花费了 4 个多小时 并且查询在 3 5 天后被取消 您对如何加快速度有什么建议吗 我怀疑是索引太多的原因 如果你也这么认为 如何在操作前自动删除索引
  • 仅使用行中包含的值获取 JTable 中的行索引?

    在Java中 JTable中是否可以通过查找该行中包含的指定值来获取该行的索引 我正在使用自定义表格模型 例如 考虑一个包含三列和三行的表 Row 1 A B C Row 2 D E F Row 3 G H I 如果我只知道表中某处有一个值
  • iOS 初学者:带有 3 个按钮的 UIAlertView 窗口 > 检查按下了什么按钮

    我有一个教程中的工作代码 但不完全理解它 情况 在我的 iPhone 应用程序中按下按钮后 将出现一个包含三个按钮的 AlertView 现在我想检查用户按下了什么按钮 教程中的代码 IBAction infoButtonPressed i
  • Python Pandas 按多索引和列排序

    在 Pandas 0 17 中 我尝试按特定列排序 同时维护分层索引 A 和 B B 是通过串联设置数据帧时创建的流水号 我的数据如下所示 C D A B bar one shiny 10 two dull 5 three glossy 8
  • 如何根据 2D 索引和 1D 值向量替换 Numpy 3D 数组中 z 轴的值

    我似乎很难理解数组索引 给出了什么 我确实有一个 3d 数组 如下所示 a 3d np zeros 3 3 3 二维索引数组 a 2d index np array 0 0 1 0 0 0 0 1 1 astype bool 以及要放入 3
  • mysql:非常简单的 SELECT id ORDER BY LIMIT 不会按预期使用 INDEX (?!)

    我有一个包含大约 300 万条记录的简单表 我创建了必要的索引 我还强制索引为 PRIMARY 但仍然不起作用 它搜索几乎所有 300 万行 而不是使用索引执行这个 record id是INT自动递增 EXPLAIN SELECT reco
  • 从另一个未排序的numpy数组中的数据查找未排序的numpy数组中值的索引位置[重复]

    这个问题在这里已经有答案了 我有一个 numpy 数组 A 其中包含可以按任何顺序排列的唯一 ID 例如A 1 3 2 我有第二个 numpy 数组 B 它记录了 ID 何时被使用 例如B 3 3 1 3 2 1 2 3 1 1 2 3 3
  • SQL Server 2005 - 应该多久重建一次索引?

    我最近接手了一个项目 他们有一个 SQL 作业设置 每三个小时运行一次 它会重建 ASP NET 会员数据库表中找到的索引 每天重建索引 8 次 这看起来相当高 我每天都会获得大约 2000 个新用户 总共大约有 200 万注册用户 对于正
  • 动态添加字段到数据类对象

    我正在编写一个库来访问 REST API 它返回带有用户对象的 json 我将其转换为 dict 然后将其转换为数据类对象 问题是并非所有字段都是固定的 我想动态添加其他字段 未在我的数据类中指定 我可以简单地为我的对象分配值 但它们不会出
  • 如何避免 pandas 在保存的 csv 中创建索引

    我试图在对文件进行一些编辑后将 csv 保存到文件夹中 每次我使用pd to csv C Path of file csv csv 文件有一个单独的索引列 我想避免将索引打印到 csv 我试过 pd read csv C Path to f
  • Java 字符串可变性 - java.lang.NoSuchFieldException:偏移量

    我是 Java 新手 我看到了问答部分here http algs4 cs princeton edu 12oop 有两个删除可变性的示例 经测试可变字符串 java http algs4 cs princeton edu 12oop Mu
  • 覆盖子类中的字段或属性

    我有一个抽象基类 我想声明一个字段或属性 该字段或属性在从该父类继承的每个类中具有不同的值 我想在基类中定义它 以便我可以在基类方法中引用它 例如覆盖 ToString 来表示 此对象的类型为 property field 我有三种方法可以

随机推荐