【HBZ分享】ES的评分score机制的原理

2023-11-01

score类型

  1. 基础评分boost,默认2.2,
  2. 逆向文档频率值(IDF):表示该词再文档中(ES中)出现的次数越多,表示越不重要,评分越低
  3. 关键词在文档中出现的频率(TF):表示该词在文档中出现的频率,频率越高表示越重要,评分越高
    注意: IDF是出现次数越多,则评分越低, 而TF是出现次数越高,则评分越高,一正一反

score评分机制的计算

  1. boost × idf × tf
  2. 字段的权重 × 逆向文档频率的值 × 关键词在文档中出现的频率值

ES查询时带上评分计算

加上explain 和mysql查看索引使用情况是同一个词
GET /test_index/_search?explain=true

如何自定义评分机制

  1. 权重配置: 通过指定boost基础评分,来定制总评分, 查询请求如下,需要指定boost,来定制哪个词查询基础分更大,即相同频率下该次就会评分更高,会放在前面
GET /test_index/_search
{
	"query": {
		"bool": {
			"should": [
				{
					"match": {
						"summary": {"query": "boot", "boost": 1} // 指定查boot的基础评分boost = 1, 不指定boost则默认2.2
					}
				}, 
				{
					"match": {
						"summary": {"query": "java", "boost": 3} // 指定查boot的基础评分boost = 3, 不指定boost则默认2.2
					}
				}, 
				{
					"match": {
						"summary": {"query": "cloud", "boost": 1} // 指定查boot的基础评分boost = 1, 不指定boost则默认2.2
					}
				},
				{
					"match": {
						"summary": {"query": "spring", "boost": 1} // 指定查boot的基础评分boost = 1, 不指定boost则默认2.2
					}
				}, 
			]
		}
	}
}
  1. 公式定制化: ES提供了一些内置评分函数(BM25), 根据需要进行参数调整,或者使用自定义评分函数来实现
  2. 自定义评分插件
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【HBZ分享】ES的评分score机制的原理 的相关文章

随机推荐

  • 基于贝叶斯的V2X通信传输数据的Trustworthiness估计

    标签 Trustworthiness Estimation 论文标题 Trustworthiness Estimation of Entities within Collective Perception 发表期刊 会议 2019 IEEE
  • Android------- IjkPlayer 源码学习目录

    在看了雷霄华的VideoEye后 发现其视图层使用的是SDL在windows上展示的 但是本人是搞Android App开发的 读其源码时 总是感觉有点不对劲 最后找到了bilibili 为移动端封装ffmpeg的框架 IjkPlayer
  • Global Average Pooling对全连接层的可替代性分析

    在NIN Network in Network 这篇论文中有很多的思想让人受益匪浅 其中之一就是全局平均池化 Global Average Pooling 对于全连接层的替代性分析 刚开始由于觉得之后的研究不需要NIN 因此就没去看论文 看
  • 第07课:生活中的代理模式——帮我拿一下快递

    用程序来模拟生活 从剧情中思考代理模式 代理模式的模型抽象 代码框架 类图 基于框架的实现 模型说明 代理模式的优点 代理模式的缺点 应用场景 故事剧情 八月中秋已过 冬天急速飞来 一场秋雨一场寒 十场秋雨穿上棉 在下了两场秋雨之后 Ton
  • 微信小程序精通到入门---07 tabBar和导航跳转

    一 tabBar使用 tabBar就是微信小程序底部的tab框 每个框必须指定一个对应的页面 设置步骤如下 步骤1 在images文件下创建一个nav目录 并且创建了6个图片 3个tab 每个tab的active和非acitve状态各一张
  • ChatGPT+Ai绘图【stable-diffusion实战】

    ai绘图 stable diffusion生成 还有很大的提升空间 提示词1 Picture a planet where every living thing is made of light The landscapes are bre
  • 知道两数之和,然后在数组中找到,输出数组下标

    这一个是对于在一个数组当中 这个数组是给定的然后在其数组内查找两个数相加等于目标值的数 之后输出他们的数组下标 1 首先从理解题目入手 从题目中可以看出给定的数组中有几个数 然后给出目标结果值 2 根据给定的开头 c语言版 int twoS
  • Objective-C 类,数据成员,函数成员,对象,

    一 类 在ios中 类的声明和实现时分离的 也就是说不能写在同一个文件中 声明放在 文件中 实现放在 m 文件中 在实现文件中引入 h文件 import xxx h 声明一个类 import
  • Swagger简介

    欢迎访问本人博客 http wangnan tech 欢迎关注简书 点击打开链接 欢迎关注微信公众号 前言 Swagger 是一款RESTFUL接口的文档在线自动生成 功能测试功能软件 本文简单介绍了在项目中集成swagger的方法和一些常
  • git 报错 eslint --fix found some errors. Please fix them and try committing again.

    这个问题是 git add git commit m 注释 命令输入完成后的报错 eslint报错 解决 git commit no verify m 提交时的注释
  • 发票打印不全不完整的解决方案(Win10)

    发票不管怎么设置 不是二维码缺少一点 就是金额小数点后边的数字显示不全 具体原因是打印机默认纸张上A4 实际发票纸张要比A4宽度宽一点点 原来写过一篇程序方便的打印票据的控制 终于部分解决了 NET Drawing Printing中自定义
  • MySQL-分库分表详解(六)

    作者 小刘在C站 个人主页 小刘主页 努力不一定有回报 但一定会有收获加油 一起努力 共赴美好人生 学习两年总结出的运维经验 以及思科模拟器全套网络实验教程 专栏 云计算技术 小刘私信可以随便问 只要会绝不吝啬 感谢CSDN让你我相遇 前言
  • python--七夕小游戏

    众所周知 我们python编程语言是可以用来做网站应用的 也可以做客户端应用的 但是客户端不懂python 就会出现很多让人奔溃的事件 但是 我们可以通过python中的第三方模块将我们的脚本转成exe文件运行 1 打开cmd 进入到终端下
  • Material Design【Android-Toolbar,滑动菜单,悬浮按钮,卡片布局,下拉刷新和可折叠式标题栏及案例】

    文章目录 Material Design 界面设计 1 Toolbar 标题栏 2 滑动菜单 3 悬浮按钮和可交互提示 4 卡片布局 5 下拉刷新 6 可折叠式标题栏 Material Design 界面设计 1 Toolbar 标题栏 1
  • Eclipse 历史版本

    url http archive eclipse org eclipse downloads index php url
  • 2023年3月27日--4月22日(ue视频教程,10小时,合计1989小时,剩余8011小时)

    目前 ue视频教程进行到了智 慧 城 市 3 13 mysql 7 1 tf1 4 11 蓝图反射 1 9 moba 1 5 webapp 2 4 mmoarpg 00A 04 fps1 8 socket 2 57 Opengl 5 9 G
  • 【C++】队列(queue)的使用

    目录 一 queue 简介 二 queue 构造函数 三 queue 赋值操作 四 queue 数据存取 五 queue 其他操作 六 queue 总结分析 如果这篇文章对你有所帮助 渴望获得你的一个点赞 一 queue 简介 C 中 st
  • 元宇宙通证-二、元宇宙无限游戏的无限正和机遇

    元宇宙无限游戏的无限正和机遇 首先 我们需要为游戏正名 在保守者看了 游戏是互联网时代的 数字毒品 让年轻人沉迷其中无法自拔 在科技进步的推动者看了 游戏并非玩物丧志 而是改变世界的手段 游戏让我们用想象力创造了一个平行宇宙 打开了一个充满
  • 对数据进行删除过程出现invalid character错误

    错误背景 在springmvc mybatis maven项目中 连接oracle对数据进行删除操作报以下错误 DEBUG 2018 12 18 23 10 47 com mchange v2 c3p0 impl DefaultConnec
  • 【HBZ分享】ES的评分score机制的原理

    score类型 基础评分boost 默认2 2 逆向文档频率值 IDF 表示该词再文档中 ES中 出现的次数越多 表示越不重要 评分越低 关键词在文档中出现的频率 TF 表示该词在文档中出现的频率 频率越高表示越重要 评分越高 注意 IDF