删除文档后 SOLr 索引大小是否会减小?

2023-12-11

我有一个 SOLr 实例,在其中索引来自客户端的大量文档,以便用户可以在 Web 应用程序中搜索它们。

因为我们有大量文件,并且只需要搜索最近的文件(90 天左右),所以我们有一项计划工作,从索引中删除旧文档。

问题是,即使进行了删除,磁盘空间每天仍会增加约 2Gb。

这是正常行为还是我们应该采取更多措施来保持索引大小稳定?

我们正在使用 Java 应用程序向索引添加和删除文件。


删除只会将文档标记为已删除 - 它们仍然存在于索引中。由于删除它们需要重写索引文件,因此不会执行实际删除在发出优化命令之前.

还有一个选项expungeDeletes当您发出提交时,但据我所知,最好在正常运行时间之外发出优化。如果您每晚删除文档,则可以在删除后发出优化,甚至频率更低,例如每隔两天或三天一次。

优化需要与索引占用相同数量的可用磁盘空间(因为最坏的情况是整个索引被再次写入)。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

删除文档后 SOLr 索引大小是否会减小? 的相关文章

  • Solr 管理控制台中模式浏览器屏幕中的字段

    上面是特定索引的架构浏览器屏幕的屏幕截图 该字段是品牌 字段类型定义如下
  • LUCENE:搜索与正则表达式匹配的术语

    我需要搜索 lucene 索引中的任何术语 匹配特定的正则表达式 我知道我可以使用TermsComponent在solr中 如果配置如下
  • 更改 SOLR 默认连接

    我正在使用嵌入 SOLR 的应用程序 SOLR 在 Tomcat 的 webapp 区域中像一场战争一样运行 是否有 SOLR 配置允许我切换搜索的默认 SOLR 行为以假定 AND 而不是 OR 作为连接运算符 在您的模式文件中添加 或修
  • SolrNet:过滤查询时保留 Facet 计数

    当我查询时 我收到以下方面 Field1 Key Best Facet 1 Value 999 Key Best Facet 2 Value 999 Field2 Key Second Best Facet 1 Value 421 Key
  • 如何在不使用 SPLITSHARD 的情况下动态向 SolrCloud 添加节点?

    我已经设置了Solr云有 4 个碎片 我向 SolrCloud 添加了 8 个节点 4 个领导者和 4 个副本 每个节点运行在不同的机器上 但后来我发现我的数据越来越多 每天400万文件 这样我的 4 个分片就不够用了 因此 我想动态地向该
  • 本地/离线网站“站点”的全文搜索[重复]

    这个问题在这里已经有答案了 可能的重复 通过 javascript 对 CD Rom 上的静态 HTML 文件进行全文搜索 https stackoverflow com questions 1357173 full text search
  • Solr 4.0 中的 BaseTokenFilterFactory 去哪儿了?

    用于创建您自己的标记和字符过滤器的 Solr 文档说明如下 http wiki apache org solr AnalyzersTokenizersTokenFilters Specifying an Analyzer in the sc
  • 客户端断开连接后 Solr 查询继续吗?

    我对 Solr 长期运行查询遇到的问题有一个理论 但我不知道它是否正确 也不知道如何测试它 我正在使用 cURL 从应用程序查询 Solr cURL 的配置方式是 如果 Solr 在 3 秒内未发送响应 它将放弃并断开连接 从而允许托管 c
  • Solr 中缺少强制 uniquekey 字段错误

    我的项目中有这个问题 我使用 Apache Poi 读取 xlsx excel 文件 并且想在 Solr 核心中对它们进行索引 我使用 SolrInputDocument 来索引读取文件 这是我的java代码 package org sol
  • 在 MongoDB 和 Apache Solr 之间同步数据的简单方法

    我最近开始使用 MongoDB 和 Apache Solr 我使用 MongoDB 作为数据存储 并且希望 Apache Solr 为我的数据创建索引 以实现应用程序中的搜索功能 经过一些研究 我发现 基本上有两种方法可以在 MongoDB
  • Solr 不搜索整数?

    我目前正在使用 Solr 为电子商务网站开发搜索引擎 所以我在 schema xml 中得到这两个字段
  • simplexml_load_file 在 Solr 的 url 中带有 &(与号)

    我正在使用 Solr 并有以下查询 该查询在我的浏览器中运行良好 http www someipaddress com 8983 solr select q fq shopid 40 start 0 rows 18 fq manufactu
  • 自定义存储库的 Spring Data Solr 优先级

    我需要在 Spring Data Solr 自定义存储库中实现以下内容 X 或 Y 和 Z 我当前的代码如下 Criteria criteria new Criteria x is X VALUE criteria criteria or
  • SOLR - Boost 函数 (bf) 以增加日期最接近 NOW 的文档的分数

    我有一个 solr 实例 其中包含具有 startTime 字段的文档 范围从上个月到一年后 我想添加一个提升查询 函数来提升 startTime 字段接近当前时间的文档的分数 到目前为止 我已经看到很多使用 rord 为较新的文档添加增强
  • Solr 错误 - 流主体被禁用

    我正在从浏览器 URL 中删除文档 我正在使用 Solr 7 4 0 我正在使用此查询来删除文档 http localhost 8983 solr test update stream body
  • Solr协会

    最近几天我们正在考虑使用 Solr 作为我们选择的搜索引擎 我们需要的大多数功能都是开箱即用的或者可以轻松配置 然而 我们绝对需要的一项功能似乎在 Solr 中被很好地隐藏 或缺失 我将尝试用一个例子来解释 我们有很多实际上是企业的文件
  • 是否可以检索与 Solr 中的查询匹配的字段名称?

    我想动态地向用户显示哪个字段与发送到 Solr 的查询相匹配 例如 如果我有一个文档 document field1 yay field2 nay dynamic field hurr one yay two nay 我查询 yay 我是否
  • 如何减少solr内存使用?

    我在我的应用程序中使用 solr 只有数百个文档 内存占用80M左右 如何减少 80M 并不多 事实上它几乎是最低限度 你不会比这个低很多 影响内存使用的一些因素 输入文档尺寸 多线程文档更新 缓存大小 分面查询 Sorting 参考 ht
  • 使用进度条时出错:Max 必须是正整数

    每当我用 solr 重新索引 a 时 都会收到以下错误 RAILS ENV development rake sunspot solr reindex Error using progress bar Max must be a posit
  • Solr 阿拉伯语

    我正在使用 Solr 来索引 3 种语言 阿拉伯语 法语和英语 的文档 我使用了这个 fieldType

随机推荐

  • 快速从 findObjectsInBackgroundWithBlock 获取数据

    我正在使用 Parse 从数据库中获取数据 当块 findObjectsInBackgroundWithBlock 被调用时 会传递一个数组 由于我只接收一行数据 因此它全部出现在数组的一个 0 部分中 那么我如何从该数组中获取所有位 这是
  • 正确的表格标题

    语义问题 如果我有一个基本上是一张大表的 HTML 页面 我应该使用什么元素作为标题 通常 您会使用h1用于页面标题 以及caption作为表格的标题 但是 如果表格是页面上唯一的内容怎么办 包括两者看起来有点傻 那我用一个h1并忘记cap
  • 未找到配置或 get/set 在 Angular 6 中已被弃用

    ng config global defaults styleExt scss 错误 找不到配置 ng set global defaults styleExt scss 错误 get set 已被弃用 取而代之的是 config 命令 已
  • PyQT5错误:无法找到或加载Qt平台插件xcb

    直到 为止Anaconda3 其中包含Python 3 4 已重新安装在我的RedHat 6 5工作站 我已经能够开发使用的Python应用程序PyQT5 重新安装后Anaconda我收到一条错误消息 无法找到或加载 Qt 平台插件 xcb
  • React 虚拟化下拉菜单被溢出剪切:隐藏

    我正在为我的表使用react virtualized 我想在单击单元格中的按钮时显示一个下拉菜单 问题是我的下拉菜单被表格的行高抑制 行高 40 行高度 200 我玩过css定位 但到目前为止没有任何效果 下拉菜单代码 div div
  • 具有线程的多上下文 CoreData

    UPDATE 我想问题是保存子上下文时父上下文没有更新 仍然需要帮助 我尝试过很多多上下文 父子 核心数据的例子 以前我的应用程序使用传统的数据存储方式 即我使用了一个OperationQueue 我从服务器获取数据并使用MOC保存到数据库
  • SQL Server 查找不同行之间的 datediff、总和

    我正在尝试构建一个查询来分析我们的时间跟踪系统中的数据 每次用户滑入或滑出时 它都会生成一行记录滑入时间以及 在场 或 场外 进入或退出 在用户 Joe Bloggs 的情况下 有 4 行 我想将其配对并计算 Joe Bloggs 在网站上
  • 出现异常“并非所有代码路径都返回值”

    您好 我有一个使用查询更新 MySQL 表的方法 我使用 MS Visual Studio 和 phpmyadmin 作为 SQL 客户端 Method public static Member updateMember string un
  • Maven无法连接到docker内的网络

    我正在尝试克隆一个 git 项目并执行以下操作mvn package在码头工人里面 但是maven无法连接网络下载依赖项 这是Dockerfile FROM java 8 FROM maven ADD id rsa root ssh id
  • 使用 Solrj / Spring Data Solr 实现标记和排除过滤器

    我正在尝试在字段上实现多选的 Solr Facet 搜索 举这个例子 http docs lucidworks com display solr Faceting Faceting LocalParametersforFaceting 我想
  • 删除sql中的重复项并相应修改关系表

    我有三张桌子 menu tab 有列 menu id menu description item tab 有列 item id item name item description item price menu has item有列 me
  • 从 MS Access 解析 VBA 中的 JSON (US BLS)

    预先感谢您的帮助 我正在使用 JSON VB6 解析器 可以在以下位置找到它 VB JSON 解析器 我有以下 JSON 响应 来自 BLS 网站 特别是此链接Here 状态 REQUEST SUCCEEDED 响应时间 71 消息 结果
  • Java 解析 Json 与具有不同对象类型的数组(Gson 或 Jackson 等)

    response data 333 id 69238 code 545 id 69239 code 545 marked 123 544 id 69906 code 544 marked 123
  • 如何让物体忽略重力(AndEngine)?

    我有一个精灵 有身体 在场景中弹跳 它需要不受重力影响 但也能够与场景中的其他物体发生碰撞 这意味着我无法使用运动体 我试过 body PhysicsFactory createCircleBody mPhysicsWorld this B
  • 在android中使用sqlite插入包含单引号和双引号的字符串

    我在 Android 应用程序中使用 sqlite 插入字符串时遇到问题 我试过 query INSERT OR REPLACE into table id text VALUES data get i id data get i text
  • android中如何获取自己设备的手机号码?

    我想以编程方式检索设备的手机号码 我的代码是 TelephonyManager telephonyManager TelephonyManager this getSystemService Context TELEPHONY SERVIC
  • 如何扩展 jQuery 的 ReplaceWith 函数以接受回调函数?

    这应该很容易 对吧 但我似乎无法在任何地方找到此类功能的任何示例 问题是 在我执行replaceWith 之后 我想对那些写入DOM的元素做一些事情 但是如果我尝试在replaceWith 调用之后对它们做一些事情 那么它们还不存在 所以我
  • Android 中的媒体播放器播放暂停

    如何使 播放 和 暂停 图像按钮看起来像单个图像按钮 我特此在下面附上我的代码 这些是使用的图像 我将播放重命名为开始 import android app Activity import android media MediaPlayer
  • 当我使用 DropDownListFor 时,所选项目不显示

    我使用以下命令生成下拉列表 for var index 0 index lt Model AdminSummaries Count index div class rep tr0 div class rep td0 Html DropDow
  • 删除文档后 SOLr 索引大小是否会减小?

    我有一个 SOLr 实例 在其中索引来自客户端的大量文档 以便用户可以在 Web 应用程序中搜索它们 因为我们有大量文件 并且只需要搜索最近的文件 90 天左右 所以我们有一项计划工作 从索引中删除旧文档 问题是 即使进行了删除 磁盘空间每