如何优化全文搜索的 Core Data 查询

2023-12-31

在文本中搜索匹配单词时可以优化核心数据查询吗？（这个问题也涉及到 iPhone 上自定义 SQL 与 Core Data 的区别。）

我正在开发一款新的（iPhone）应用程序，它是科学数据库的手持参考工具。主界面是一个标准的可搜索表格视图，我希望在用户输入新单词时得到即时响应。单词匹配必须是文本中单词的前缀。文本由 100,000 个单词组成。

在我的原型中，我直接编写了 SQL 代码。我创建了一个单独的“单词”表，其中包含主实体文本字段中的每个单词。我对单词进行了索引并按照以下方式进行了搜索

SELECT id, * FROM textTable 
  JOIN (SELECT DISTINCT textTableId FROM words 
         WHERE word BETWEEN 'foo' AND 'fooz' ) 
    ON id=textTableId
 LIMIT 50

这运行得非常快。使用 IN 可能也同样有效，即

SELECT * FROM textTable
 WHERE id IN (SELECT textTableId FROM words 
               WHERE word BETWEEN 'foo' AND 'fooz' ) 
 LIMIT 50

LIMIT 至关重要，它可以让我快速显示结果。我通知用户，如果达到限制，则显示太多。这很糟糕。

在过去的几天里，我一直在思考迁移到核心数据的优势，但我担心对重要查询的架构、索引和查询缺乏控制。

理论上的 NSPredicatetextField MATCHES '.*\bfoo.*'会起作用，但我确信它会很慢。这种文本搜索似乎很常见，我想知道通常的攻击是什么？您会像我上面那样创建一个单词实体并使用“word BEGINSWITH 'foo'”谓词吗？它的工作速度会像我的原型一样快吗？ Core Data 会自动创建正确的索引吗？我找不到任何明确的方法来向持久存储提供关于索引的建议。

我在我的 iPhone 应用程序中看到了 Core Data 的一些很好的优势。故障和其他内存考虑因素允许对表视图查询进行高效的数据库检索，而无需设置任意限制。对象图管理使我能够轻松遍历实体，而无需编写大量 SQL。将来迁移功能会很好。另一方面，在有限的资源环境（iPhone）中，我担心自动生成的数据库会因元数据、不必要的反向关系、低效的属性数据类型等而变得臃肿。

我应该潜入还是谨慎行事？

我做了一个解决方案。我认为它类似于这个帖子 https://stackoverflow.com/questions/1878962/full-text-searching-in-apples-core-data-framework/2076064#2076064。我将合并源代码添加到我的 Core Data 项目中，然后创建一个不是托管对象子类的全文搜索类。在 FTS I 类中#import "sqlite3.h"（源文件）而不是 sqlite 框架。 FTS 类保存到与 Core Data 持久存储不同的 .sqlite 文件。

当我导入数据时，Core Data 对象将相关 FTS 对象的 rowid 存储为整数属性。我有一个静态数据集，因此我不担心引用完整性，但维护完整性的代码应该很简单。

为了执行 FTS，我MATCH查询 FTS 类，返回一组 rowid。在我的托管对象类中，我使用以下命令查询相应的对象[NSPredicate predicateWithFormat:@"rowid IN %@", rowids]。我避免以这种方式遍历任何多对多关系。

性能的提升是巨大的。我的数据集有 142287 行，包括 194MB（核心数据）和 92MB（删除停用词的 FTS）。根据搜索词频率的不同，我的搜索时间从几秒变为不常见词（2000 次点击）的搜索时间为 0.2 秒。

我确信我的方法存在无数问题（代码膨胀、可能的命名空间冲突、丢失一些核心数据功能），但它似乎有效。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何优化全文搜索的 Core Data 查询的相关文章

核心数据：重命名属性，而不会导致用户及其当前数据出现问题

我只想为我的应用程序的新版本重命名并在表上添加属性并且如果应用程序已安装我想保留数据首先我只是设置选项 let options NSMigratePersistentStoresAutomaticallyOption true NSI
H2 用户定义的聚合函数 ListAgg 不能在第一个参数上使用 DISTINCT 或 TRIM()

所以我有一个 DB2 生产数据库我需要在其中使用可用的函数 ListAgg 我希望使用 H2 的单元测试能够正确测试此功能不幸的是H2不直接支持ListAgg 但是我可以创建一个用户定义的聚合函数 import java sql Co
内置函数将每个单词的第一个字母大写

如果 SQL Server 中已存在此类函数我不想为此创建自定义函数输入字符串 This is my string to convert预期输出 This Is My String To Convert SET ANSI NULLS O
如何在iOS中处理1到3个手指的滑动手势

我使用以下代码来处理代码中的 1 根手指滑动 UISwipeGestureRecognizer swipe UISwipeGestureRecognizer alloc initWithTarget self action selector
如何从 SQL Server 2008 查询结果中删除“NULL”

我有一个包含 59 列和超过 17K 行的表很多行都有NULL在某些列中我想删除NULL以便查询返回空白而不是NULL 我可以运行一些更新功能来替换所有NULL with 使用 SQL Server 2008R2 Management
如何识别拼写不同的相似单词

我想从数据库中过滤掉重复的客户名称一位客户可能有多个同名但拼写差异不大的系统条目这是一个示例名为 Brook 的客户可能有 3 个系统条目有了这个变化布鲁克贝尔塔布鲁克贝尔塔比鲁克贝尔塔假设我们将此名称放入一个数据库列
错误域=kAFAssistantErrorDomain 代码=209“（空）”

我面临着一个问题SFSpeechRecognizer 启动应用程序几秒钟后我开始收到错误消息错误域 kAFAssistantErrorDomain 代码 209 空和错误域 kAFAssistantErrorDomain 代码 2
Objective-C UILabel 作为超链接

我正在尝试做一个UILabel一个链接UIWebView 我怎样才能做一个UILabel作为超链接您可以使用 UITapGestureRecognizer 它将实现与您想要的类似的功能 UILabel myLabel UILabel al
SQL查询查找表的主键？

我怎样才能找到哪一列首要的关键使用查询来创建表这是重复的question https stackoverflow com questions 893874 mysql determine tables primary key dynami
iOS：生成pdf时绘制文本时如何设置字体？

我在ios应用程序中使用drawpdf函数生成pdf 同时调用nsobject类中的drawtext函数它根据我指定的框架和字符串清楚地绘制文本我的代码是 void drawText NSString textToDraw inFram
如何使用 BigQuery 有效地选择另一个表中匹配子字符串的记录？

我有一个包含数百万个字符串的表我想将其与包含大约两万个字符串的表进行匹配如下所示 standardSQL SELECT record FROM record JOIN fragment ON record name LIKE CONCA
调整 UIImage 的大小而不将其完全加载到内存中？

我正在开发一个应用程序用户可以在其中尝试加载非常非常大的图像这些图像首先在表格视图中显示为缩略图我的原始代码会在大图像上崩溃因此我重写它以首先将图像直接下载到磁盘是否有一种已知的方法可以调整磁盘上图像的大小而无需通过以下方式将其
贴纸包会在模拟器上使 iMessage 崩溃，但在 iPhone 上不会崩溃

按照 Apple 的在线说明和视频在 Xcode 中创建了一个贴纸包所有图像的尺寸均正确且远低于文件大小阈值如果我在我的实体 iPhone 上构建并运行贴纸包一切都会完美运行如果我在模拟器上构建并运行贴纸包对于任何模拟的 iPho
如何向标准 UIButton 添加徽章？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案是否可以在标准中添加看起来标准的徽章UIButton 如果不支持半原生那么实现此目的最简单的方法是什么示例图片这是 Sascha
在 appdelegate 中呈现多个模态视图

我想在应用程序收到 application UIApplication application didReceiveRemoteNotification NSDictionary userInfo 中的每个推送消息后呈现一个 modalvi
在实例化对象之前是否可以检查故事板中是否存在标识符？

在我的代码中我有这一行但我想知道是否有办法检查是否一些控制器在我将它与一起使用之前就存在实例化ViewControllerWithIdentifier 方法如果标识符不存在则应用程序崩溃如果没有好的方法这并不是一个大问题我
如何通过SQL查询检查是否有JSON函数？

有SQL 2016 中的 JSON 函数 https learn microsoft com en us sql t sql functions json functions transact sql例如 JSON VALUE JSON Q
是否可以跨 2 个不同的 iOS 应用程序访问数据？

假设我在 App1 中存储了一些 ID 数据并希望在同一设备上的 App2 中访问它平台上可以这样吗如果没有的话有什么解决方法吗您可以使用iOS 钥匙扣 http developer apple com library ios do
将图像存储在核心数据中

我想在更新记录时存储每位员工的图像我怎样才能做到这一点我有一个字典存储员工的姓名 ID 和部门现在我想将图像保存在一起 Core Data 支持二进制数据类型当您定义具有二进制数据字段的模型时它会创建具有 NSData 字段
是否可以引用同一个表中的不同列？

如果博客有一个类别表如下所示 CREATE TABLE categories id INTEGER PRIMARY KEY AUTO INCREMENT parent id INTEGER NOT NULL name VARCHAR

随机推荐

c++ \ 将 FILETIME 转换为秒

如何将 FILETIME 转换为秒我需要比较两个 FILETIME 对象 I found this http www gamedev net topic 565693 converting filetime to time t on wi
如何将 gem 'minitest' 添加到我的测试助手中？

我是 Ruby on Rails 和测试的新手当我跑步时rake test我收到以下错误 Users jarvis rvm gems ruby 1 9 2 p180 rails3tutorial gems rack 1 3 4 lib r
OutOfMemoryError：在 WildFly 中使用 websockets 时直接缓冲内存

在我们的 WildFly 18 服务器上运行一段时间后我们遇到了以下错误 org xnio listener default I O 1 XNIO001007 A channel event listener threw an excep
通过 JSON/XML 将二进制数据发送到 (Rails) RESTful 端点？

我目前正在组装一个基于 Rails 的 Web 应用程序该应用程序仅通过 json 和 xml 提供和接收数据但是某些要求包含上传二进制数据图像的能力现在据我了解 JSON 并不完全是为了这个目的但是您通常如何解决通过应用程
JavaScript：对象的filter()

ECMAScript 5 有filter 原型为Array类型但不是Object类型如果我理解正确的话我将如何实施filter for ObjectJavaScript 中的 s 假设我有这个对象 var foo bar Yes 我想
如何使用 safe_load 使用 PyYAML 反序列化对象？

有这样的片段 import yaml class User object def init self name surname self name name self surname surname user User spam eggs
如何在javascript中用时刻（moment.js）做大于或等于？

基本上我想做一个myMoment gt yourMoment 没有myMoment isSameOrAfter并结合起来写出来isSame and isAfter有点长还有什么选择呢将时刻转换为js日期并使用 gt 比较您可以使用i
计算二次贝塞尔曲线的交点

这绝对是在挑战我的三角知识的极限有没有计算二次贝塞尔曲线和直线之间交点的公式 Example 在下图中我有 P1 P2 C 这是控制点和 X1 X2 对于我的特定计算来说它只是 X 轴上的一条直线我想知道的是 T 的 X Y 位置
当 UITextField 成为 Touch ID 完成块中的第一响应者时，不显示 iOS 键盘（在 UIRemoteKeyboardWindow 内）(iOS 10)

我最近在我的应用程序中发现了一个问题该问题似乎只发生在 iOS 10 中当以编程方式触发文本字段成为完成处理程序内的第一响应者时系统键盘不会显示特别是我从中返回的完成处理程序Touch ID 尝试这个问题最疯狂的部分是即使没有显
如何在php中将字符串转换为数组[重复]

这个问题在这里已经有答案了如何在 php 中转换数组中的字符串即 str this is string 应该是这样的 arr 0 this arr 1 is arr 2 string The str split str 3 将字符串拆分
gcc：允许未定义的符号[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我不希望 gcc 链接器将未定义的符
Select2 不使用我的 templateResults 或 templateSelection 选项

我正在尝试将 select2 ajax 调用与模板一起使用我的 ajax 运行得很好但它没有使用我的模板函数 ajax数据是 name First thing otherData asdfg name Second thing othe
翻页示例代码

是否有任何示例代码可用于像 stanza 和 iBooks 这样翻页任何帮助将不胜感激这里有一些资源可以帮助您开始使用 UIScrollView 分页 http developer apple com iphone library s
apache tomcat 8 websocket来源和客户端地址

H e l l o 社区我希望有人可以帮助我我正在使用 apache tomcat 8 0 0 RC5 和 JSR 356 Web 套接字 API 我有两个问题 1 是否可以通过 OnOpen方法获取客户端ip 2 是否可以获得连接的来
JFreeChart XYSeries 作为字符串

我正在使用 jfreechart 并尝试制作一个运行良好的 XYLineChart 我的问题是 y 标签是双值我需要字符串 My Code DefaultXYDataset result new DefaultXYDataset XYSe
ldpi、mdpi、hdpi、xhdpi 显示的 Android 初始屏幕尺寸？ - 例如：ldpi 为 1024X768 像素

我必须使用phonegap 为Android 应用程序设计启动屏幕加载时适合屏幕的图像我必须设计适合 ldpi mdpi hdpi xhdpi 等 4 种屏幕的 4 种尺寸图像谁能告诉我这些屏幕的确切像素尺寸以便我可以按该尺寸进行设
Google Drive API - 权限 - 超出速率限制。用户留言：抱歉，您已超出共享配额

我一直在使用 Google Drive API 以编程方式创建和共享文档昨天我开始在每个插入权限的请求中收到此错误消息 com google api client googleapis json GoogleJsonResponseEx
Android：跳过依赖项项目的 Gradle“testClasses”任务

我已关注本指南 https developer android com training testing unit testing local unit tests html在 Android Studio v1 4 中为我的主 Andro
如何以编程方式在 iPhone 上启动 Contacts.app

我想在用户需要添加联系人时启动 Contacts app 我的应用程序已经从联系人 API 读取如果可以避免的话我宁愿不重新实现功能我的目标是 iOS 4 0 及以上版本如果您想添加联系人请使用ABNewPersonViewCon
如何优化全文搜索的 Core Data 查询

在文本中搜索匹配单词时可以优化核心数据查询吗这个问题也涉及到 iPhone 上自定义 SQL 与 Core Data 的区别我正在开发一款新的 iPhone 应用程序它是科学数据库的手持参考工具主界面是一个标准的可搜索表格视图我希

如何优化全文搜索的 Core Data 查询

如何优化全文搜索的 Core Data 查询 的相关文章

随机推荐

热门标签

如何优化全文搜索的 Core Data 查询的相关文章