模式更改是否需要重新索引所有 Solr 文档或仅包含已更改模式字段的文档？

2023-12-28

我的 Solr 索引中有数百万个文档。其中只有一千个文档具有字段 A，我想更改其架构。架构更改包括更改多值从真到假，stored从假到真，并且type从文本到字符串，需要重新索引的东西。重新索引数千个文档将花费我几分钟的时间，而重新索引所有内容则需要几天的时间。

Solr wiki 上的重新索引页面 (http://wiki.apache.org/solr/HowToReindex http://wiki.apache.org/solr/HowToReindex）说“您可能需要在开始索引过程之前删除所有文档”，但没有说明何时不需要。

我可以只删除包含字段 A 的一千个文档并重新索引这千个文档，还是需要先删除整个索引（所有文档），然后再对它们全部重新建立索引？

我已经在一个小型样本索引中测试了“删除少数”场景；更新和查询在更改的字段上按预期工作。然而，我不知道我是否只是运气好，由于没有删除所有内容而潜伏着一些问题。

如果您使用相同的 id（在 schema.xml 中定义的唯一键）对文档建立索引，则不必在建立索引之前删除它们。对具有相同 ID 的文档建立索引将覆盖现有文档。

请记住，当您为具有相同 ID 的文档建立索引时，旧文档会自动标记为“已删除”，但不会从索引中物理删除。并且词向量分析适用于所有文档（包括已删除的文档）

如果您需要物理清理已删除的文档，则需要执行索引“优化”，您可以从 solr 管理界面执行此操作。

如果您对架构进行更改，则不必对所有内容建立索引。仅重新索引受影响的文档就足够了。

所以如果我处在你的位置，我什至不会删除任何内容。我只会重新索引数千个受影响的文档。然后稍后进行优化以清理索引。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

模式更改是否需要重新索引所有 Solr 文档或仅包含已更改模式字段的文档？的相关文章

openNLP 与 Solr 集成时出现异常

我正在尝试将 openNLP 与 Solr 6 1 0 集成我配置了架构和 solrconfig 文件详细信息请参见 wiki 链接 https wiki apache org solr OpenNLP https wiki apach
将图像文件存储在猫鼬模式的二进制数据中并以html形式显示图像

我正在使用 Express Node js 和 Mongodb 创建上传和显示图像文件的网页我使用 schema 将图像的二进制文件保存在 mongodb 中这是我在index js和db js中的一点代码 var Post mongo
我们可以同时使用拼音标记和同义词吗？

我正在尝试同时启用语音分析器和同义词这似乎不起作用它们一起使用有错吗在下面的实现中我希望使用同义词转换搜索查询然后使用语音分析器来检索结果但我的同义词在这里完全被忽略了如果我在创建索引时删除语音分析器那么同义词就可以正常工作
Solr 中缺少强制 uniquekey 字段错误

我的项目中有这个问题我使用 Apache Poi 读取 xlsx excel 文件并且想在 Solr 核心中对它们进行索引我使用 SolrInputDocument 来索引读取文件这是我的java代码 package org sol
Solr：在带有空格的字符串上使用通配符

我的问题与这里讨论的问题基本相同带空格的 Solr 通配符查询 https stackoverflow com questions 10023133 solr wildcard query with whitespace 但这个问题没有得
Solrcloud Zookeper 设置：等待 4000ms 后未找到注册的领导者，集合：c1 切片：shard2

我使用 solr 4 10 3 我通过 java 中的嵌入式 jetty 服务器启动 solr 我正在尝试使用 2 个分片领导者配置 solrcloud 我有一个外部动物园管理员设置我在启动 solr 时指向动物园管理员实例如下所示
如何在Oracle数据库11g中创建新模式/新用户？

我已经申请了一家公司的实习机会作为一个问题他们要求我为他们的公司创建一个具有一定要求的架构并将DDL文件我已经安装了 Oracle 数据库 11g Express 版本但如何在 Oracle 数据库 11g 中创建新架构我在网上
solr + haystack + django 我在哪里放置 schema.xml？

我刚刚安装Solr and Haystack for a Django我正在做的项目下列的this http docs haystacksearch org dev tutorial html Haystack教程我创建了一个 sche
如何使用 lucene 查询找到空的 Solr 文档字段

我有一些这样的文件
由于未定义符号，PECL solr 未加载：curl_easy_getinfo

我正在尝试加载 PECL solr 扩展我尝试使用 pecl install solr 并下载并使用 phpize configure make 来安装它在这两种情况下扩展安装时都没有错误但在 apache 重新启动后或在命令行上
如何禁用 solr 管理页面

对于生产来说拥有一个甚至不要求登录凭据的 solr 管理员感觉不安全如何禁用默认的 solr 管理页面我只是希望我的 web 应用程序使用 Solr 进行搜索词索引我强烈建议保留管理页面用于调试目的它在很多情况下拯救了我有多种方
用于标签搜索的数据存储解决方案

我已经按照预先计算的分数订购了数百万件商品每个项目都有许多布尔属性假设总共有大约一万个可能的属性每个项目有十几个我希望能够请求实时几毫秒给定任意属性组合的前 n 个项目您会推荐什么解决方案我正在寻找可扩展性极强的东西我们目
如何备份Solr数据库？

我想知道如何备份转储 Solr 数据库如果只是复制一些文件请指定哪些文件文件名位置等 Thanks We use Solr复制 http wiki apache org solr SolrReplication做我们的备份您可以
Solr 突出显示是否还可以指示返回片段在原始字段内的位置或偏移量？

背景使用Solr 4 0 0 我已经对一组示例文档的文本建立了索引并启用了术语向量以便我可以使用快速向量突出显示
Solr 错误 - 流主体被禁用

我正在从浏览器 URL 中删除文档我正在使用 Solr 7 4 0 我正在使用此查询来删除文档 http localhost 8983 solr test update stream body
枚举类型的 JAXB 元素

所以我知道如何创建枚举类型但是当我为其设置元素类型时元素字段将只是字符串类型而不是枚举类型如何在我的模式中创建枚举并让 JAXB 将其生成为 java 枚举类型这就是我创建枚举类型和元素的方式
是否可以检索与 Solr 中的查询匹配的字段名称？

我想动态地向用户显示哪个字段与发送到 Solr 的查询相匹配例如如果我有一个文档 document field1 yay field2 nay dynamic field hurr one yay two nay 我查询 yay 我是否
如何减少solr内存使用？

我在我的应用程序中使用 solr 只有数百个文档内存占用80M左右如何减少 80M 并不多事实上它几乎是最低限度你不会比这个低很多影响内存使用的一些因素输入文档尺寸多线程文档更新缓存大小分面查询 Sorting 参考 ht
Log4Net“找不到架构信息”消息

我决定使用log4net http logging apache org log4net index html作为新 Web 服务项目的记录器一切工作正常但对于我在我的应用程序中使用的每个 log4net 标签我都会收到很多类似下面的
使用 dismax 处理程序进行通配符搜索？

我已成功索引文件并且希望能够使用通配符进行搜索我目前正在使用 dismaxRequestHandler QueryType dismax 进行搜索以便我可以搜索查询的所有字段像 computer 这样的常规搜索会返回结果但 com

随机推荐

如何编写一个 O(n^2) 方法来查找两点之间的最大距离

我有一个数组int nums 5 1 6 10 4 7 3 9 2 我想在 O n 2 时间内找到该数组中最小和最大数字之间的距离根据作业的要求它需要 O n 2 时间为此我正在编写一个名为的方法quadratic 到目前为止我已
C++ 中的反射

我已经使用 Java 工作多年了在那些年里我广泛或者可能只是频繁使用反射并发现它有用且令人愉快但8个月前我换了工作现在Java只是一个记忆我开始接触C 所以现在我想知道C 中是否有反射机制我读过有关 RTTI 的内容但我
当您执行“git fetch上游master：master”与“git pull上游master：master”时，确切的区别是什么

我知道之间的区别git fetch and git pull git pull基本上是一个git fetch git merge在一个命令中但是我正在研究如何使用上游更新我的分支主分支无需检查主分支我遇到了这个答案合并更新和拉
如何为 Tomcat 设置 Spring 日志

使用 Spring MVC 且没有 Spring 日志使得调试变得困难我读过一些关于这个问题的其他文章但似乎没有一篇对我有帮助 log4j properties is in src文件夹 slf4j api 1 5 11 slf4j l
Azure WebJob 不会在调试器中本地运行

我的Azure WebJob曾经在VS2015调试器中运行但我发现它逐渐变得非常断断续续现在根本无法运行如果我将其部署到 Azure 它工作得很好该作业被标记为 RunOnStartUp public class Program s
如果 javascript 解释器执行“JIT 编译”，它是否会缓存其结果，以便下次加载网站时在同一脚本上使用？

更具体地说我最关心的是 Firefox 中的 SpiderMonkey 解释器因此假设我想加快浏览器中特定网站的加载速度或者加快具有某些流行脚本的所有网站的加载速度例如jQuery 据推测所涉及的脚本在页面重新加载之间不会改变
意外的模块路径“github.com/sirupsen/logrus”

我用过 github com sirupsen logrus 我无法删除它我试过了 go mod tidy go clean modcache 这是日志 go github com Sirupsen email protected cdn
Python 中的函数作为对象：内存中到底存储了什么？

我已经使用 Python 来解决实际问题有一段时间了但我仍然对幕后发生的事情没有正确的理论理解例如我正在努力理解 Python 如何将函数视为对象我知道函数是函数类的对象具有调用方法并且我知道我可以通过为自定义类编写调
将 Pickle 文件记录为 Mlflow 运行的一部分

我正在运行 MLflow 实验作为其中的一部分我想将一些工件记录为 python pickle 例如尝试不同的分类编码器因此想将编码器对象记录为 pickle 文件有办法实现这一点吗那里有两个功能日志工件 https mlflo
具有多语言支持的 Durandal（淘汰赛）应用程序

我正在为我正在开发的应用程序建立多语言支持经过一些研究并阅读SO 国际化最佳实践 https stackoverflow com questions 228835 best practice javascript and multilan
MySql - 存储“0000-00-00 00:00:00”代替默认日期值

我在 mysql 数据库中有一个带有日期时间列的表此列的默认值设置为 1900 01 01 00 00 00 但是我注意到在插入的 4000 行中有 1 行将此值设置为 0000 00 00 00 00 00 尽管设置了默认值但我对
我的seaborn 和Matplotlib 图看起来一样吗？

最近人们告诉我seaborn是Python中最好的数据可视化包所以我决定尝试一下然而我的图看起来与我的 matplotlib 图完全相同我正在使用 PyCharm Python 3 6 这是我用来测试两者的超级简单代码 x 1 2
安装 R 包时出现问题

我正在设置一台运行 Gentoo 的新笔记本电脑并希望安装 R 就像我在所有计算机上所做的那样然而在安装软件包时我遇到了一些问题我首先尝试 gt install packages c ggplot2 plyr reshape2 它正
是否可以在 Android Studio 中使用已发布签名的 APK 构建 App Bundle？我想将 apk 迁移到 Play 商店的应用程序包

我正在使用 Unity Engine 来构建 apk 然后我在Enhance 上使用该APK 来集成SDK AAB 格式不被接受因此我需要直接从 Unity 构建 APK 而不是 AAB 然后我希望将该集成 APK 迁移到 App Bun
卸载 python.org 版本的 python2.7 以支持默认的 OS X python2.7

我正在运行 OS X 10 8 2 并且我相信默认情况下它附带 Python 2 7 3 我之前从 python org 安装了 Python 2 7 2 并且想废弃它以将系统的默认 python 重置为预安装的原因是每当我启动任何 py
在seaborn中合并两个热图

我有 2 个数据表其中包含尺寸4x25 每个表都来自不同的时间点但具有完全相同的元数据本质上是相同的列标题和行标题鉴于列数较多我认为最好使用heatmap使用seaborn图书馆Python 但是我需要将两个表包含在同一个图中
使用 C# 以编程方式删除服务 [重复]

这个问题在这里已经有答案了可能的重复如何在 C 中以编程方式安装 Windows 服务 https stackoverflow com questions 358700 how to install a windows service
适应不断变化的业务需求？

关于如何开发能够适应不断变化的业务需求的软件的想法任何模式架构等可能一些轶事例子会很棒这更像是一项调查而不是具体问题谢谢您将想了解更多关于整个敏捷开发 http en wikipedia org wiki Agile deve
chmod - 保护正在访问的用户文件，以便只有所有者才能访问？

如何设置 chmod 以便只有文件的所有者才能读取写入和执行其他用户无法读写执行 chmod 600 filename会做的或者chmod 700如果它是可执行文件另一种不太神秘的方法是 chmod go rwx filenam
模式更改是否需要重新索引所有 Solr 文档或仅包含已更改模式字段的文档？

我的 Solr 索引中有数百万个文档其中只有一千个文档具有字段 A 我想更改其架构架构更改包括更改多值从真到假 stored从假到真并且type从文本到字符串需要重新索引的东西重新索引数千个文档将花费我几分钟的时间而重新索引所有

模式更改是否需要重新索引所有 Solr 文档或仅包含已更改模式字段的文档？

模式更改是否需要重新索引所有 Solr 文档或仅包含已更改模式字段的文档？ 的相关文章

随机推荐

热门标签

模式更改是否需要重新索引所有 Solr 文档或仅包含已更改模式字段的文档？的相关文章