如何使用SQLAlchemy在SQLite上创建全文搜索索引并进行查询？

2023-11-21

我正在创建一个可以执行基本操作的简单应用程序。 SQLite用作数据库。我想执行通配符搜索，但我知道它的性能很差。我想尝试全文搜索，但我无法完整提供示例怎么做。我确认 SQLite 有全文搜索支持。这是我的示例代码。

from flask_sqlalchemy import SQLAlchemy

db = SQLAlchemy()

class Person(db.Model):
    id = db.Column(db.Integer, primary_key=True)
    name = db.Column(db.Text, unique=True, nullable=False)
    thumb = db.Column(db.Text, nullable=False, default="")

    role = db.relationship("Role", backref="person", cascade="delete")


class Role(db.Model):
    id = db.Column(db.Integer, primary_key=True)
    person_id = db.Column(db.Integer, db.ForeignKey(Person.id, ondelete="CASCADE"), nullable=False)
    role = db.Column(db.Text, nullable=False)

如何创建 FTS 索引并使用 SQLAlchemy 查询它。例如，在“Person”中搜索姓名。

FTS5提供了支持全文搜索的虚拟表。换句话说，您无法在现有表的列上创建全文索引。相反，您可以创建一个 FTS5 虚拟表并从原始表复制相关数据以建立索引。为了避免两次存储相同的数据，您可以将其设为外部内容表，但您仍然必须确保 FTS5 表保持同步（手动或通过触发器）。

您可以创建一个通用的自定义 DDL 构造来处理创建镜像另一个表的 FTS5 虚拟表：

class CreateFtsTable(DDLElement):
    """Represents a CREATE VIRTUAL TABLE ... USING fts5 statement, for indexing
    a given table.

    """

    def __init__(self, table, version=5):
        self.table = table
        self.version = version


@compiles(CreateFtsTable)
def compile_create_fts_table(element, compiler, **kw):
    """
    """
    tbl = element.table
    version = element.version
    preparer = compiler.preparer
    sql_compiler = compiler.sql_compiler

    tbl_name = preparer.format_table(tbl)
    vtbl_name = preparer.quote(tbl.name + "_idx")

    text = "\nCREATE VIRTUAL TABLE "
    text += vtbl_name + " "
    text += "USING fts" + str(version) + "("

    separator = "\n"

    pk_column, = tbl.primary_key
    columns = [col for col in tbl.columns if col is not pk_column]

    for column in columns:
        text += separator
        separator = ", \n"
        text += "\t" + preparer.format_column(column)

        if not isinstance(column.type, String):
            text += " UNINDEXED"

    text += separator
    text += "\tcontent=" + sql_compiler.render_literal_value(
            tbl.name, String())

    text += separator
    text += "\tcontent_rowid=" + sql_compiler.render_literal_value(
            pk_column.name, String())

    text += "\n)\n\n"
    return text

给定的实现有点天真，默认情况下索引所有文本列。创建的虚拟表通过添加隐式命名_idx在原始表名之后。

但仅此还不够，如果您想自动保持表与触发器同步，并且由于您只为一个表添加索引，您可以选择在迁移脚本中使用文本 DDL 构造：

def upgrade():
    ddl = [
        """
        CREATE VIRTUAL TABLE person_idx USING fts5(
            name,
            thumb UNINDEXED,
            content='person',
            content_rowid='id'
        )
        """,
        """
        CREATE TRIGGER person_ai AFTER INSERT ON person BEGIN
            INSERT INTO person_idx (rowid, name, thumb)
            VALUES (new.id, new.name, new.thumb);
        END
        """,
        """
        CREATE TRIGGER person_ad AFTER DELETE ON person BEGIN
            INSERT INTO person_idx (person_idx, rowid, name, thumb)
            VALUES ('delete', old.id, old.name, old.thumb);
        END
        """,
        """
        CREATE TRIGGER person_au AFTER UPDATE ON person BEGIN
            INSERT INTO person_idx (person_idx, rowid, name, thumb)
            VALUES ('delete', old.id, old.name, old.thumb);
            INSERT INTO person_idx (rowid, name, thumb)
            VALUES (new.id, new.name, new.thumb);
        END
        """
    ]

    for stmt in ddl:
        op.execute(sa.DDL(stmt))

如果您的人员表包含现有数据，请记住将这些数据也插入到创建的虚拟表中以建立索引。

为了实际使用创建的虚拟表，您可以创建一个非主要映射器 for Person:

person_idx = db.Table('person_idx', db.metadata,
                      db.Column('rowid', db.Integer(), primary_key=True),
                      db.Column('name', db.Text()),
                      db.Column('thumb', db.Text()))

PersonIdx = db.mapper(
    Person, person_idx, non_primary=True,
    properties={
        'id': person_idx.c.rowid
    }
)

并使用例如 MATCH 进行全文查询：

db.session.query(PersonIdx).\
    filter(PersonIdx.c.name.op("MATCH")("john")).\
    all()

请注意，结果是一个列表Person对象。PersonIdx只是一个Mapper.

正如 Victor K. 所指出的，不推荐使用非主要映射器，新的替代方案是使用aliased()。设置基本相同，但rowid to id创建时需要进行映射person_idx Table使用key的参数Column:

person_idx = db.Table('person_idx', db.metadata,
                      db.Column('rowid', db.Integer(), key='id', primary_key=True),
                      db.Column('name', db.Text()),
                      db.Column('thumb', db.Text()))

并创建别名而不是新的映射器：

PersonIdx = db.aliased(Person, person_idx, adapt_on_names=True)

别名的工作方式更像映射类，因为您不通过访问映射属性.c，但直接：

db.session.query(PersonIdx).\
    filter(PersonIdx.name.op("MATCH")("john")).\
    all()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用SQLAlchemy在SQLite上创建全文搜索索引并进行查询？的相关文章

插入多行并返回主键时 Sqlalchemy 的奇怪行为

插入多行并返回主键时我注意到一些奇怪的事情如果我在 isert 查询中添加使用参数值我会得到预期的行为但是当将值传递给游标时不会返回任何内容这可能是一个错误还是我误解了什么我的sqlachemy版本是0 9 4 下面如何重现错
代码 zip( *sorted( zip(units, error) ) ) 的作用是什么？

对于我的申请units and errors始终是数值列表我尝试用谷歌搜索每个部分的作用并找出了 zip 的第一部分它似乎 ziped list zip units errors 只需将单位和误差配对即可生成一个列表如下所示 uni
Python 3.4.3 subprocess.Popen 在没有管道的情况下获取命令的输出？

我试图将命令的输出分配给变量而不让命令认为它正在通过管道传输原因是如果正在通过管道传输则相关命令会给出未格式化的文本作为输出但如果从终端运行则会给出颜色格式化的文本我需要获取这种颜色格式的文本到目前为止我已经尝试了一些事情
python 类的属性不在 __init__ 中

我想知道为什么下面的代码有效 usr bin env python3 import sys class Car def init self pass if name main c Car c speed 3 c time 5 print c
Django REST Framework：无法使用视图名称解析超链接关系的 URL

我已经广泛研究了这个相当常见的问题但没有一个修复对我有用我正在 REST 框架中构建 Django 项目并希望使用超链接关系用户可以拥有许多独立的汽车和路线路线是位置的集合这些是我的序列化器 class CarSerialize
Tensorflow 到 ONNX 的转换

我目前正在尝试转换我使用本教程创建的已保存且正在工作的 pb 文件 https github com thtrieu darkflow https github com thtrieu darkflow 到 onnx 文件中我目前正在
Python：动态向对象添加字段

我想知道是否可以动态向对象添加字段例如我希望能够添加如下内容 user object user first name John user last name Smith 当我在 Python 命令行解释器中执行该命令时我得到 Attr
如何对嵌套函数进行单元测试？ [复制]

这个问题在这里已经有答案了您将如何对嵌套函数进行单元测试f1 在下面的例子中 def f def f1 return 1 return 2 或者需要测试的函数不应该嵌套吗有一个类似的问题这个链接 https stackoverflow
如何在 scikit-learn 的 SVM 中使用非整数字符串标签？ Python

Scikit learn 具有相当用户友好的用于机器学习的 python 模块我正在尝试训练用于自然语言处理 NLP 的 SVM 标记器其中我的标签和输入数据是单词和注释例如词性标记而不是使用双精度整数数据作为输入元组 1 2
使用 Matplotlib、PyQt 和 Threading 进行实时绘图导致 python 崩溃

我一直在努力研究我的 Python 应用程序但找不到任何答案我有 PyQT GUI 应用程序它使用 Matplotlib 小部件 GUI 启动一个新线程来处理 mpl 小部件的绘图恐怕我现在通过从另一个线程访问 matplotlib
pip-tools 的干净设置不会编译非常基本的 pyproject.toml

使用全新的pip tools设置总是会导致Backend subprocess exited error pyproject toml project dependencies openpyxl gt 3 0 9 lt 4 在仅包含上述 p
Celery 设计帮助：如何防止并发执行任务

我对 Celery AMQP 相当陌生正在尝试提出一个任务队列工作人员设计来满足以下要求我有多种类型的每用户任务例如 TaskA TaskB TaskC 这些每用户任务中的每一个都为系统中的一个特定用户读取写入数据因此
在 Mac (Catalina) 上安装 PyGame 时出错 [重复]

这个问题在这里已经有答案了我一直在尝试将 PyGame 安装到 Catalina 上的 Mac 上但不知道如何安装我收到的错误消息是 SystemExit error command gcc failed with exit stat
“ModuleNotFoundError：我的 Docker 容器中没有名为的模块”

我正在尝试在 Docker 容器中运行 python 脚本但我不知道为什么 python 找不到任何 python 模块我认为它与 PYTHONPATH 环境变量有关所以我尝试将其添加到 Dockerfile 中如下所示 ENV P
透视包含字符串的 Pandas Dataframe - “没有要聚合的数字类型”错误

关于此错误有很多问题但环顾四周后我仍然无法找到解决解决方案我正在尝试用字符串旋转数据框以使一些行数据变成列但到目前为止还没有成功我的 df 的形状
有效积累稀疏 scipy 矩阵的集合

我有一个 O N NxN 的集合scipy sparse csr matrix 每个稀疏矩阵都有 N 个元素集我想将所有这些矩阵加在一起以获得一个常规的 NxN numpy 数组 N 约为 1000 矩阵内非零元素的排列使得所得总和肯定不
从 xgb.train() 获取概率

我是 Python 和机器学习的新手我在网上搜索了我的问题并尝试了人们建议的解决方案但仍然没有得到它如果有人能帮助我我将非常感激我正在开发我的第一个 XGboost 模型我已经使用 xgb XGBClassifier 调整了参
SQLite创建连接时出现异常

我在创建连接时收到 SQLite 异常这在我安装 VS2015 RTM 之前有效客户端 PCL databaseConnection DependencyService Get
Scrapy - 持续从数据库中获取要爬取的url

我想不断地从数据库中获取要爬行的网址到目前为止我成功地从基地获取了 url 但我希望我的蜘蛛继续从该基地读取因为该表将由另一个线程填充我有一个管道一旦爬行工作就会从表中删除 url 换句话说我想使用我的数据库作为队列我尝试
SQLite HAVING 比较错误

我有一个测试 SQLite 表用于存储带有值的报告数据 CREATE TABLE IF NOT EXISTS test fact daily revenue date TEXT revenue NUMERIC product TEXT I

随机推荐

Python Pandas - 缺少必需的依赖项 ['numpy'] 1

从昨天开始当我尝试在 anaconda 上导入包时出现此错误 ImportError Missing required dependencies numpy 我尝试卸载 Anaconda 和 Python 切换到 Python 2 7 但
在 codeigniter 中调试路由？

我想知道是否有任何简单的方法可以在 codeigniter 中调试路由最好我希望能够在日志中看到以下内容 Client sent apps something Route found apps any gt applications se
SQL Server：拆分操作

如何在 SQL Server 中拆分字符串例子输入字符串 stack over flow Result stack over flow 如果您不能使用表值参数请参阅 SQL Server 2008 中使用表值参数的数组和列表作者 E
是否可以在 Visual Studio 中为动态对象提供智能感知？

我在项目中使用动态对象并且我想为该对象提供智能感知我知道 Visual Studio 无法知道智能感知要显示什么但如果我可以插入智能感知我确实知道应该显示哪些条目有没有办法扩展 Visual Studio 的智能感知如果是这样
Android 测试分片

谁能解释一下 android 中的测试分片意味着什么如果有人可以分享任何教程将会非常有帮助碎片这个词的意思是整体的一小部分仅凭一个数字如何进行分片我应该在什么基础上指定 shardIndex 定义如开发人员文档中所示测试分片测试
如何在 Eclipse 中编辑 Maven 依赖项中的“.class”文件

好的我有我的 Java 项目在项目资源管理器的 Maven 依赖项项目文件夹下我遇到了jar文件夹里面有一个 class文件现在我点击了Download Sources我可以查看 class文件作为 Java 文件但我无法在
COM 如何选择如何编组接口？

据我了解在 COM 中实现编组的方法有以下三种类型库编组代理存根编组通过对象实现 IMarshal 现在该组件如何consumer 用户选择使用哪一个它是自行决定并使用首选方式还是调用某些内置函数并为其解决问题我目前遇到以
从必需的文件扩展 Node.js 中的 Array.prototype

我将以下内容保存在 test js 中它成功地在浏览器中扩展了Array 但它似乎不适用于node和require 有人可以解释这里出了什么问题吗 function Array prototype max function return
Angularjs 中的记住我功能和令牌

我正在寻找更好的方法来解决我的问题我的登录表单上有记住我的功能当用户单击记住我框时我的 API 会向我发送令牌我的问题是存储此令牌并在用户返回我的网站时再次对用户进行身份验证的最佳方法是什么我以为创建一个 Cookie 并在其中
R 中给定函数的包名称[重复]

这个问题在这里已经有答案了可能的重复如何确定函数的名称空间我不知道该怎么做你如何知道 R 中某个函数的包名称我想要一个函数给出函数的名称返回拥有它的包的名称有什么建议吗可能有更好的解决方案但是find functionn
获取列中仅出现一次的值的数量

首先如果相关的话我正在使用 MySQL 尽管我认为解决方案可以跨数据库产品工作我的问题是我有一个带有单列的简单表格该列没有任何约束此列中有一些简单的数据例如 a a b c d d 我需要获取只出现一次的值的数量计数从上面
malloc分配的内存的保护标志是什么？

根据这个线程分配的内存malloc至少有PROT READ PROT EXEC 否则所包含的函数无法执行 man malloc没有提到任何有关保护的内容因此提出了这个问题 malloc 通常会返回具有读写权限的内存某些体系结构例如
h.264 视频无法在 iOS 上播放

我有一个用 h 264 编码的视频文件无法在 iOS 上播放我想知道原因这是 HTML
Android 应用程序中的 C# .dll 库

我目前正在使用 Monodroid 开发 Android 应用程序我对电话应用程序相当陌生因此对以下几件事感到困惑 Android 库的定义是什么我使用 Mono 模板创建 Android 库创建 Mono for Android
什么时候需要延迟加载？

我懒惰地加载我的所有成员我这样做已经有一段时间了并且只是认为延迟加载从表面上看是一件好事假设我们有 public class SomeClass public int anInt public SomeReferenceType me
如何包含 CEFSharp 所需的 VC++ 可再发行文件

使用 CEFSharp 浏览器构建应用程序在我的计算机上运行良好但在服务器上崩溃并出现以下错误 System IO FileLoadException 无法加载 CefSharp Core dll 导入的过程我在互联网上看到过这个问题
XHTML 中是否有类似于“colgroup”的名为“rowgroup”的属性？

下列w3c文件提及rowgroup http www w3 org TR html401 struct tables html h 11 2 6 http www w3 org TR html401 struct tables html r
如何在 VB6 中设置完整的内部版本号（Major.Minor.Build.Revision）

How to set the complete version number from vb6 VPIaccessMaker vbg from Visual Basic i can set Major Minor Revision as 3
像 Craigslist 一样的电子邮件转发 - Rails

我正在尝试做 craigslist 的匿名电子邮件所做的事情但使用 Rails 而且价格也便宜对我来说能够向电子邮件添加标头非常重要这就是基本电子邮件转发不起作用的原因我想到的一种方法是使用 SMTP 服务器每当我通过 POP
如何使用SQLAlchemy在SQLite上创建全文搜索索引并进行查询？

我正在创建一个可以执行基本操作的简单应用程序 SQLite用作数据库我想执行通配符搜索但我知道它的性能很差我想尝试全文搜索但我无法完整提供示例怎么做我确认 SQLite 有全文搜索支持这是我的示例代码 from flask s

如何使用SQLAlchemy在SQLite上创建全文搜索索引并进行查询？

如何使用SQLAlchemy在SQLite上创建全文搜索索引并进行查询？ 的相关文章

随机推荐

热门标签

如何使用SQLAlchemy在SQLite上创建全文搜索索引并进行查询？的相关文章