关于机器学习中查准率与查全率(召回率)矛盾关系的探讨

2023-11-13

昨天和舍友讨论查准率和查全率,很多资料中指出之所以需要F1值的原因在于准确率与召回率的关系是矛盾的,即查准率高的查全率低,查全率高的查准率低。因此需要F1值综合度量。

但关于为什么两者的关系是矛盾的,一直不太理解,现在看过帖子后总结一些想法:

首先看混淆矩阵与查准率查全率的定义

查准率代表预测为真的样本中有多少确实为真,(最好一找一个准)

查全率代表样本中所有为真的样本有多少被找出来了(最好把真的全找出来)

从逻辑上来理解矛盾关系:要想做到查全,势必要对查找范围和限制逐步放宽,也就是无脑找,总会找到所有的,而这样的结果是会把很多不相关的样本也找出来,影响了查准率。

下面从数学的角度简单证明二者的矛盾关系:

查全率R = TP/(TP+FN)

在这个公式中,分母TP+FN是样本中所有的正例(P),这个数量是不会变的,一直存在的。

现在要想提高查全率,只能增大TP,也就是要把样本中更多的样本预测为真(T),这个增大TP的过程,同时也会使FP跟着增大(因为要把更多的样本预测为真,但我们不知道真实标签,只能无脑预测为T)。

这时候,有查准率公式,P = TP/(TP+FP),可知,分母提高的要比分子多,故查准率P降低。

这样就简单证明了矛盾关系。

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

关于机器学习中查准率与查全率(召回率)矛盾关系的探讨 的相关文章

  • 从零开始的webpack生活-0x014:CustomLoader自定义loader

    0x001 概述 上一章我们讲了eslint loader的配置 常用类型的常用loader已经都讲完了 大体上其他的都大同小异 需要去各大loader的官方查阅用户手册就可以了 接下来将loader的本质和自定义loader 0x002
  • 30行Python代码实现3D数据可视化!非常惊艳!

    回顾 2D 作图 用赛贝尔曲线作 2d 图 此图是用基于 Matplotlib 的 Path 通过赛贝尔曲线实现的 有对赛贝尔曲线感兴趣的朋友们可以深入了解一下 在 matplotlib 中 figure 为画布 axes 为绘图区 fig
  • 教你用Navicat生成E-R图

    最近在弄毕业论文 导师让我在论文中插一些图 其中设计到之前数据库中表与表的关系图 开始本来想手动画一个 然后突然想到 是不是Navicat会自带这种功能呢 仔细一看 果然有 于是乎开始倒腾一番 在此记录一下 也方便需要的人 1 打开navi

随机推荐

  • vue3开发技巧包括全局注册自定义指令,全局注册组件

    文章目录 一 全局注册自定义指令 1 钩子函数 2 动态指令参数 二 全局注册组件 三 v for循环中绑定不同点击事件 四 v for循环中绑定不同class属性 一 全局注册自定义指令 vue3全局定义自定义指令 与vue2版本差别不大
  • 初学前端,学习路线图必不可少,更有【95页】初级前端模块笔记!

    前言 在初学前端的时候 我们总会遇到一些问题 我们可以在网上看到很多关于前端的这些问题 你们都是怎么学web前端的 零基础 怎么自学好前端 前端需要学多久 都学哪些知识 想成为一名合格的前端工程师 需要掌握哪些技能 下面是给初学前端的小伙伴
  • Java动态性之反射机制

    一 动态语言 程序运行时 可以改变程序结构或变量类型 典型的语言 python ruby javascript等 function test var s var a 3 var b 5 alert a b eval s c c java不是
  • python中如何查看statsmodels相关知识

    运行arima的一个相关程序时 总是打印一些我不需要的数据 如下 RUNNING THE L BFGS B CODE Machine precision 2 220E 16 N 1 M 12 This problem is unconstr
  • 2023新版Java学习路线视频讲解,程序员自学必备指南

    深知大家自学Java的苦 苦于没有系统的知识体系 不知道该学什么 看哪个视频比较好 因此 老杜精心录制了这版超实用且全面的Java学习路线 目的在于帮助自学Java的初学者减少迷茫和时间浪费 制定出一份系统的学习计划和路线 让你学Java更
  • comsol光学仿真01

    与RF模块比较 1 RF模块适合模拟与波长大小相近的域 2 最大网格大院大小必须是波长的一部分 大约在波长的1 6 缺点 计算过慢 与射线光学比较 1 射线 几何 光学适合模拟远大于波长的结构 2 能够有效追踪经过复杂几何区域和材料的射线
  • arm汇编指令详细整理及实例详解

    目录 一 简介 二 ARM 汇编指令说明 2 1 32位数据操作指令 2 2 32位存储器数据传送指令 2 3 32位转移指令 2 4 其它32位指令 三 实例讲解 3 1 MRS 3 2 MSR 3 3 PRIMASK 3 4 FAULT
  • lazarus开发应用提供http接口

    lazarus开发应用提供http接口 简单试用了一下fphttpapp 发现非常易用 直接支持中文内容 引用3个核心单元 fphttpapp httpdefs httproute 启用端口定义路由 procedure route1 aRe
  • mysql8.0查看用户_MySQL 8.0用户和角色管理

    MySQL8 0新加了很多功能 其中在用户管理中增加了角色的管理 默认的密码加密方式也做了调整 由之前的sha1改为了sha2 同时加上5 7的禁用用户和用户过期的设置 这样方面用户的管理和权限的管理 也增加了用户的安全性 MySQL8 0
  • pytorch的序列化

    PyTorch是一个基于Python的开源机器学习框架 序列化是指将模型 张量或其他Python对象转换为一种可存储的格式 以便于在后续的时间点进行加载 重用或共享 通过序列化 可以将模型保存到磁盘上 方便后续再次加载和使用 具体来说 Py
  • 【Reacte】 React 嵌入JS表达式 、条件渲染 、数组列表渲染 、样式处理

    嵌入JS表达式 语法 js表达式 let content 插入的内容 let h1 h1 我是通过JSX创建的元素 content h1 描述 1 只要是合法的js表达式都可以进行嵌入 2 JSX自身就是JS表达式 注意 语法是单花括号 不
  • 操作系统-c语言实现空闲块表的存储空间的分配和回收 ...

    include
  • SQL查询表中最后一条数据

    SQL查询表中最后一条数据 文章目录 SQL查询表中最后一条数据 准备数据表 查询最后一条数据 准备数据表 建立student表 并插入几条数据 查询最后一条数据 本文共分为三种方式 max id 函数 select from studen
  • How to be a under-graduate student

    1 想法去搜集这种记载的文字 所以研究生要学会去搜集资料或信息 2所以我们要看很多的资料 看资料是我们研究生阶段特别重要的 不要轻视了 3 现在培养研究生 就是培养你们要勇于拓宽科技新领域 到第一线去干4论文记载了一个研究课题的过程和结论
  • 电容的频率特性曲线

    电容的频率特性曲线 电容 电容 Capacitance 亦称作 电容量 是指在给定电位差下的电荷储藏量 记为C 国际单位是法拉 F 一般来说 电荷在电场中会受力而移动 当导体之间有了介质 则阻碍了电荷移动而使得电荷累积在导体上 造成电荷的累
  • python-opencv计算重叠矩形面积IOU

    import cv2 import numpy as np def calc riou r1 r2 r1 np array r1 r2 np array r2 rect1 r1 0 r1 1 r1 2 r1 3 r1 4 rect2 r2
  • Redis第二十四讲 Redis集群如何确保数据能被插入到同一个哈希槽与集群的哈希槽为什么是16384

    为什么哈希槽是16384 Redis 集群并没有使用一致性hash 而是引入了哈希槽的概念 Redis 集群有16384个哈希槽 每个key通过CRC16校验后对16384取模来决定放置哪个槽 集群的每个节点负责一部分hash槽 但为什么哈
  • 25_Vue3路由-VueRouter的基本使用及动态路由和路由嵌套

    Vue3路由之Vue router的基本使用及路由嵌套和动态路由 认识前端路由 路由其实是网络工程中的一个术语 在架构一个网络时 非常重要的两个设备就是路由器和交换机 当然 目前在我们生活中路由器也是越来越被大家所熟知 因为我们生活中都会用
  • 代理模式 与装饰模式的区别 干货

    装饰器模式关注于在一个对象上动态的添加方法 然而代理模式关注于控制对对象的访问 换句话 说 用代理模式 代理类 proxy class 可以对它的客户隐藏一个对象的具体信息 因此 当使用代理模式的时候 我们常常在一个代理类中创建一个对象的实
  • 关于机器学习中查准率与查全率(召回率)矛盾关系的探讨

    昨天和舍友讨论查准率和查全率 很多资料中指出之所以需要F1值的原因在于准确率与召回率的关系是矛盾的 即查准率高的查全率低 查全率高的查准率低 因此需要F1值综合度量 但关于为什么两者的关系是矛盾的 一直不太理解 现在看过帖子后总结一些想法