neo4j 中的搜索查询:如何使用内部 TFIDF / levenshtein 或其他算法对 START 查询中的 neo4j 中的结果进行排序?

2023-12-08

我正在使用维基百科主题名称为我的全文索引实验开发一个模型。

我在“主题”(旧版)上设置和索引,并对以下内容进行全文搜索:'united states':

start n=node:topic('name:(united states)') return n

第一个结果根本不相关:

'List of United States National Historic Landmarks in United States commonwealths and territories, associated states, and foreign states'

[...]

而实际的“美国”则深埋在列表的深处。

因此,它提高了problem为了找到结果的最佳匹配(例如 levenshtein、bigram 等算法),您首先必须获取所有物品匹配模式。

这将是一个严重的限制,因为在这种情况下我有 21K 行,大约 4 秒。

neo4j 使用哪些算法对全文搜索 (START) 的结果进行排序?它使用什么原理对结果进行排序以及如何使用密码更改它? 在文档中,编写了使用 JAVA api 来应用 sort() - 如果有一个教程来指定要修改的文件,并了解在进行任何调整之前使用哪个排名原理,将会非常有用。

根据以下评论进行编辑 - 结果分页可以为: n=node:topic('名称:(美国)') return n 跳过 10 限制 50;

(在限制之前跳过)但我需要确保第一个结果是有意义的before分页。


我不知道lucene使用什么排序算法来对结果进行排序。 然而,关于分页,如果你改变限制的顺序并跳过如下,应该没问题。 start n=node:topic('name:(united states)') return n skip 10 limit 50 ;

我还要补充一点,如果您正在执行全文搜索,也许像 solr 这样的解决方案更合适。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

neo4j 中的搜索查询:如何使用内部 TFIDF / levenshtein 或其他算法对 START 查询中的 neo4j 中的结果进行排序? 的相关文章

  • SOLR - Boost 函数 (bf) 以增加日期最接近 NOW 的文档的分数

    我有一个 solr 实例 其中包含具有 startTime 字段的文档 范围从上个月到一年后 我想添加一个提升查询 函数来提升 startTime 字段接近当前时间的文档的分数 到目前为止 我已经看到很多使用 rord 为较新的文档添加增强
  • SpatialQuery 使用 Lucene 进行基于位置的搜索

    我的 lucene 索引已索引纬度和经度字段 如下所示 doc Add new Field latitude latitude ToString Field Store YES Field Index UN TOKENIZED doc Ad
  • neo4j - 三个节点之间的关系

    我完全陌生Neo4j这些天我正在测试它 我遇到的一个问题是如何正确实现涉及 3 个不同节点的关系Spring Data 例如 假设我有 3 NodeEntitys User Tag and TaggableObject 正如你可以争论的那样
  • 无法将 neo4j shell 连接到本地服务器

    我已经通过自制程序安装了 neo4j 2 0 0 并启动了服务器 我可以通过端口 7474 访问 webadmin 控制台 但是当我运行时neo4j shell host localhost port 7474 I get non JRMP
  • Data-config.xml 和 mysql - 我只能加载“id”列

    我在 Windows Server 2012 上安装了 Solr 5 0 0 我想将表中的所有数据加载到 solr 引擎中 我的 data config xml 如下所示
  • Django Postgres 全文 TrigramSimilarity 多个字段

    我想弄清楚如何使用TrigramSimilarity with unaccent对于多个字段 到目前为止我有 def filter by location self queryset location log info Filtering
  • MongoDB 全文搜索分数“分数是什么意思?”

    我正在为我的学校开发一个 MongoDB 项目 我有一个句子集合 我进行正常的文本搜索以查找集合中最相似的句子 这是基于评分的 我运行这个查询 db sentences find text search any text score met
  • 我能找到neo4j中两个节点之间的所有关系吗?

    我有一组节点 它们通过以下方式相关 A gt B gt C gt D 该关系是与某个 id 属性的 连接 关系 我的问题是 我可以编写一个 cypher 查询 它将显示从起始节点 A 到起始节点 D 的每个关系的所有 id 属性 而不在查询
  • 如何决定使用哪种NoSQL技术? [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 MongoDB 基于文档 HBase 基于列 和 Neo4j 对象图 的优缺点是什么 我特别有兴趣了解
  • 构造映射不允许索引集合作为映射键?

    所以我正在尝试写一个答案这个问题 https stackoverflow com questions 29262918 cypher zip collections这对我来说似乎很有趣 什么鬼 我来试试 这是我想出的解决方案 对我来说这似乎
  • 查找文本中所有关键字的有效算法

    我有很多字符串 其中包含许多不同拼写的文本 我通过搜索关键字来标记这些字符串 如果找到关键字 我将使用该关键字的关联文本 假设搜索字符串可以包含文本 schw schwa 和 施瓦茨 我有三个关键字 全部解析为文本 schwarz 现在我正
  • 测量文档集之间的相似性

    出于说明目的 我们假设这是一个论坛服务 我需要计算每个用户帖子之间的 相似度 结果如下 among posts by user A similarity 60 among posts by user B similarity 20 我正在处
  • 特定查询出现错误

    Lucene 的新手 我在 java 客户端中将它与 Hibernate 一起使用 并且在特定查询上收到此错误 HSEARCH000146 The query string a applied on field name has no me
  • 不支持的身份验证令牌,仅当禁用身份验证时才允许 schema='none':{ schema='none' } - Neo4j 身份验证错误

    我正在尝试使用 neo4j spark connector 从 Spark 连接到 Neo4j 当我尝试连接到 Neo4j 时遇到身份验证问题org neo4j driver v1 exceptions AuthenticationExce
  • Lucene 搜索错误堆栈

    我在尝试使用 Lucene 进行搜索时看到以下错误 版本1 4 3 关于为什么我会看到这个以及如何解决它有什么想法吗 Caused by java io IOException read past EOF at org apache luc
  • 显示表 FULLTEXT 索引列

    我希望运行一个查询 该查询将返回表中全文索引的列列表 该表采用 MyISAM 格式 我将使用 php 来构建查询 理想情况下 我会运行查询 它会返回信息 以便我可以构造一个以逗号分隔的列字符串 例如 名 姓 电子邮箱 这在 MySQL 中可
  • Neo4j Desktop DB 无法启动,状态为“KILLED”

    运行 Neo4j Desktop 版本 1 0 15 尝试启动DB导致启动失败 数据库启动失败 DB database f8950fdd 6b5f 4fea 8c9f e8457ee1da9a v3 3 1 退出 状态为 已杀 检查日志 主
  • Python 和图形数据库。使用 java lib 包装器还是 REST api?

    我想问你在Python中使用图数据库 Neo4j 的最佳方法 你觉得我应该使用 neo4j python embedded neo4j python 嵌入式 http docs neo4j org chunked milestone pyt
  • CakePHP 与 Lucene

    我正在尝试使用 cakephp 实现 Lucene 并遵循本指南http jamienay com 2010 01 zend search lucene datasource for cakephp http jamienay com 20
  • 转义 to_tsquery 中的特殊字符

    如何转义传递给的字符串中的特殊字符to tsquery 例如 这种查询 select to tsquery AT T 生产 NOTICE text search query contains only stop words or doesn

随机推荐

  • 将 vertex.label 放置在 igraph 中的圆形布局之外

    我有一个圆形布局 igraph 我希望顶点标签显示在圆形区域之外 尝试玩周围vertex label cex and vertex label degree但没有用 请指教 vertex label degree需要一些认真的 但简单的 调
  • matplotlib 动画保存不遵守 blit=True 但它似乎在 plt.show() 中工作得很好

    我对 Python 很陌生 正在尝试使用 matplotlib 对文本进行动画处理 使用几个在线示例得出以下代码 import matplotlib pyplot as plt import matplotlib animation as
  • 如何在 Mac OS X 中获取指向二进制部分的指针?

    我正在编写一些代码 将一些数据结构存储在一个特殊的命名二进制部分中 这些都是同一结构的实例 分散在许多 C 文件中 并且不在彼此的范围内 通过将它们全部放在指定的部分中 我可以迭代它们 这与 GCC 和 GNU ld 完美配合 由于缺少而在
  • 核心数据设计——如何同时拥有应用数据和用户数据?

    我遇到的情况是 我有一组随我的应用程序附带的基本信息 用户可以添加或编辑此信息 但有时 我需要能够更新基础数据 我不想触及用户更改 添加 我看过这个问题 但所使用的类比有点陌生 这一定是一个常见问题 我希望听到此类混合数据集的实践和经验 我
  • 如何使用多项逻辑回归解决多标签分类问题?

    我必须根据其他属性来预测学生所在的课程类型 prog是一个分类变量 指示学生所在课程的类型 普通 1 学术 2 或 职业 3 Ses是一个分类变量 表示某人的社会经济阶层 低 1 中 2 和 高 3 read write math scie
  • 在R中绘制频率密度直方图

    使用 R 任何人都可以告诉我如何绘制一个简单的直方图 并且以下数据的箱之间没有间隙 Class Width Freq Dist 0 lt x lt 5 0 2 5 lt x lt 15 0 1 15 lt x lt 20 1 2 20 lt
  • 主键和外键

    我有3张桌子 Student Loan Book StudentID LoanID BookID 我需要设置哪些外键 以便在给出学生姓名时 搜索该学生的所有贷款并显示书籍详细信息 这是从如此模糊的要求开始的 CREATE TABLE dbo
  • 如何处理用户离开对话

    我们有使用 OnMembersAddedAsync 方法的欢迎示例 但没有示例显示如何处理用户离开对话 我尝试覆盖 OnMembersRemovedAsync 但它似乎没有被调用 至少当我使用机器人框架模拟器时 我需要在用户离开 离开对话时
  • Holoviews 相关热图和回归图的点击流

    我想为 DataFrame 制作一个相关热图 并为每对变量制作一个回归图 我已尝试阅读所有文档 但仍然很难连接两个图 以便当我点击热图时 可以显示相应的回归图 这是一些示例代码 import holoviews as hv from hol
  • Javascript Promise 中的resolve和reject实际上做了什么

    起初 我认为resolve只需将参数传递给函数即可then 所以我尝试了这个 const promise new Promise resolve reject gt resolve new Promise resolve gt resolv
  • Jython:如何使用文件“jython-2.7-b1.jar”

    我是 Jython 新手 我从这里下载了一个jar文件http www jython org downloads html 下载 Jython 2 7beta1 jython jar 安装程序 不带捆绑 python 文件的独立版本 当我运
  • 在 C++ 中集成 swf

    有没有办法制作包含 swf 的 C GUI 应用程序 swf 文件非常小 并且比 gif 或其他类型的动画更容易制作 因此如果能够包含它们就太好了 一些图书馆的推荐 免费甚至开源 您可以在应用程序中托管 Flash 播放器本身 您只需实现您
  • linux下如何合并相似的行

    我的 Linux 系统上有一个文件 test txt 其中包含以下格式的数据 first second third fourth 10 first second third fourth 20 fifth sixth seventh eig
  • Python Tkinter 中的图像问题

    我一直在尝试将图像包含在我的 Tkinter 小部件中 但似乎没有任何效果 这是我的代码 from Tkinter import from PIL import Image root Tk image Image open images m
  • 如何在Python中将字符串转换为列表?

    l Hello my name is Apple l1 Hello my name is Apple type l 回报str但我希望它是一个列表 如l1 is 如何将该字符串转换为通用列表 the ast模块有一个literal eval
  • 循环未完成保存 pdf [重复]

    这个问题在这里已经有答案了 我正在写一个循环 循环的目的是创建许多图并将它们保存为PDF 选择数据的子集后 我执行以下操作 pdf path to the desired filename width 16 height 7 some gg
  • Swift 默认 AlertViewController 打破约束

    我正在尝试使用带有样式的默认 AlertViewController actionSheet 由于某种原因 警报会导致约束误差 只要alertController不是通过按钮触发 显示 整个视图就不存在约束错误 难道这是一个Xcode 的错
  • 如何逐行分析 cython 函数

    我经常努力寻找自己的瓶颈cython代码 我怎样才能了解个人资料cython逐行函数 罗伯特 布拉德肖 Robert Bradshaw 帮助我获得了罗伯特 科恩 Robert Kern 的line profiler工具工作于cdef函数 我
  • sendWakefulWork 并不总是用 cwac-wakeful-1.1.0 调用

    我有一个问题困扰了很长时间 我发现了 CWAC wakeful 它可以解决我所有的问题 我想 简而言之 为了解决这个问题 我实现了一个最简单的应用程序 它每 60 秒安排一次警报并每次记录一次 这是我的代码 主要活动 package com
  • neo4j 中的搜索查询:如何使用内部 TFIDF / levenshtein 或其他算法对 START 查询中的 neo4j 中的结果进行排序?

    我正在使用维基百科主题名称为我的全文索引实验开发一个模型 我在 主题 旧版 上设置和索引 并对以下内容进行全文搜索 united states start n node topic name united states return n 第