假设检验笔记

2023-11-10

假设检验,就是做了一个假设 H,然后通过实验得到相关的统计数据判断 H 是否(大概率)成立,或者有多大把握认为 H 成立。这个 H 一般是一个与分布、统计量相关的的命题,如 H : P { 硬 币 朝 上 } < 0.2 H: P\{硬币朝上\} < 0.2 H:P{}<0.2

Intuition

直觉上,假定 H 正确,会使某个事件 A 变成小概率事件,即 P ( A ∣ H ) P(A|H) P(AH) 很小,那么在 H 的条件下,A 几乎不可能发生,如 H : P { 硬 币 朝 上 } < 0.2 H: P\{硬币朝上\} < 0.2 H:P{}<0.2 A : 连抛100次,80次朝上 A:\text{连抛100次,80次朝上} A:连抛100次,80次朝上。但若果在检验实验中 A 居然发生了,那 H 大概率是错的,于是拒绝 H。

Example

tea
要检验此女士是否真能分辨「茶+奶」和「奶+茶」,可以进行伯努利实验:n 杯奶茶混合液给她逐杯试,如果她能至少分对 k 次,那就认为她真的能分辨。
为此可以作出假设 H 0 : 她 其 实 不 能 分 辨 , 只 是 瞎 猜 H_0:她其实不能分辨,只是瞎猜 H0:。将 H 0 H_0 H0 的对立假设记为 H 1 H_1 H1
选择这样假设是因为,这等价于对她的判断的分布作出假设:如果是瞎猜,那么她猜「茶+奶」和「奶+茶」的概率都应该是 0.5,对于每一杯她猜对的概率亦是 0.5,于是对于她猜对的总杯数 X,可以写出分布 X ∼ B ( n , 0.5 ) X\sim B(n,0.5) XB(n,0.5)
可以算出,要猜对多个的概率是很小的。即要观察的事件是 A : 分 对 至 少 k 杯 A:分对至少k杯 A:k,当 k 比较大时, P ( A ∣ H 0 ) P(A|H_0) P(AH0) 很小, A ∣ H 0 A|H_0 AH0 几乎不可能发生。
接下来就是进行实验,如果 A 发生了,就拒绝 H 0 H_0 H0、接受 H 1 H_1 H1,否则相反。

α \alpha α, P-value

这样检验有主观的成分:k 取多大,才能相信她大概率是真的能分辨(才能在 A 发生时拒绝 H 0 H_0 H0)?这可以换一种说法: P ( A ∣ H 0 ) P(A|H_0) P(AH0) 要多小(在 H 0 H_0 H0 条件下 A 要多难发生),才能在 A 真的发生时有足够的信心相信 H 0 H_0 H0 是错的?
此例中 P-value 就是 P ( A ∣ H 0 ) P(A|H_0) P(AH0)(P-value 应该是 A 和比 A 更难发生的事件概率和)。指定 k 的大小,等价于指定一个概率阈值 α \alpha α,只有当 P-value = P ( A ∣ H 0 ) ≤ α \text{P-value}=P(A|H_0)\leq\alpha P-value=P(AH0)α 时,才认为: A 发 生 ⇔ H 0 明 显 / 大 概 率 是 错 的 A 发生\Leftrightarrow H_0明显/大概率是错的 AH0/,于是在 A 发生时拒绝 H 0 H_0 H0
所有使得拒绝 H 0 H_0 H0 的 P-value 的集合叫拒绝域,此例中就是 [ 0 , α ] [0,\alpha] [0,α],即当实验测得 P-value 落在拒绝域时,就拒绝 H 0 H_0 H0 α \alpha α 常取 0.05、0.01 等小值。

Error: Type I, Type II

上帝知道 H 0 H_0 H0 实际上是真的还是假的,但人不知道,所以依据实验结果,决定要拒绝或接受 H 0 H_0 H0 时,此时做出的决策(拒绝/接受)可能是错的,错误分两类:

  • 第 I 类,弃真错误,即 H 0 H_0 H0 其实是真的(上帝视觉),但被拒绝了;
  • 第 II 类,取伪错误,即 H 0 H_0 H0 其实是错的,但被接受了。

犯第 I 类错误的概率,就是 A 发生时拒绝 H 0 H_0 H0 的概率,即 α \alpha α,又叫显著性水平 1 − α 1-\alpha 1α 称为置信度

References

  1. 统计学基础–假设检验
  2. 假设检验(Hypothesis Testing)
  3. 假设检验——这一篇文章就够了
  4. 【r<-Rmarkdown】常用数学符号的 LaTeX 表示方法
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

假设检验笔记 的相关文章

  • 时间序列分析和预测(含实例及代码)

    导论 研究时间序列主要目的 进行预测 根据已有的时间序列数据预测未来的变化 时间序列预测关键 确定已有的时间序列的变化模式 并假定这种模式会延续到未来 时间序列预测法的基本特点 假设事物发展趋势会延伸到未来 预测所依据的数据具有不规则性 不
  • 不要再用简单的加权平均了 用回归做融合吧

  • 拉格朗日插值

    直接上公式 简单的讲 这个玩意就是在给你若干个 f xi yi 的结果 算出f k 的结果 最朴素的实现方法 验证下这个公式的结果 include
  • 方差、标准差、协方差、协方差矩阵、散度矩阵

    方差 统计中的方差 样本方差 是每个样本值与全体样本值的平均数之差的平方值的平均数 概率论中方差用来度量随机变量和其数学期望 即均值 之间的偏离程度 1 统计 方差用来计算每一个变量 观察值 与总体均数之间的差异 为避免出现离均差总和为零
  • 哈夫曼编码最大编码长度

    概念 层数 叶子节点为待编码的数据 根为第0层 编码长度 第 L L L层数据编码后的长度为 L L L 节点概率 若节点为叶子节点 则概率为叶子所编码数据的频率
  • LaTeX 数学公式大全!

    LaTeX 数学公式大全 这里是来自一篇教程的截图 很全面
  • 正定Hermiltian矩阵分解的两种方法

    对于正定Hermiltian矩阵 B B B 想要求解 D D D 使其满足
  • 三角函数常见基本公式

    定义式 图形 正弦 sin 余弦 cos 正切 tan或tg 余切 cot或ctg 正割 sec 余割 csc 函数关系 商数关系 倒数关系 平方关系 和差角公式 二角和差公式 三角和公式 积化和差公式 倍角公式 二倍角公式 三倍角公式 四
  • 矩阵求导常用公式

    矩阵求导常用公式 1 引言 2 向量的导数 2 1 向量对标量求导 Vector by scalar 2 2 标量对向量求导 Scalar by vector 2 3 向量对向量求导 Vector by vector 3 矩阵的导数 3 1
  • 贝叶斯网络学习

    状态空间搜索 如果按专业点的说法就是将问题求解过程表现为从初始状态到目标状态寻找这个路径的过程 通俗点说 两点之间求一线路 这两点是求解的开始和问题的结果 而这一线路不一定是直线 可以是曲折的 由于求解问题的过程中分枝有很多 主要是求解过程
  • 【华为OD机试真题 python】数字加减游戏【2022 Q4

    题目描述 数字加减游戏 小明在玩一个数字加减游戏 只使用加法或者减法 将一个数字s变成数字t 在每个回合中 小明可以用当前的数字加上或减去一个数字 现在有两种数字可以用来加减 分别为a b a b 其中b没有使用次数限制 请问小明最少可以用
  • 什么是矩阵的范数

    原文地址 在介绍主题之前 先来谈一个非常重要的数学思维方法 几何方法 在大学之前 我们学习过一次函数 二次函数 三角函数 指数函数 对数函数等 方程则是求函数的零点 到了大学 我们学微积分 复变函数 实变函数 泛函等 我们一直都在学习和研究
  • 完美数

    按照毕达哥拉斯的说法 数的完满取决于它的真因数 即除了自身以外的约数 例如 12的因数是 1 2 3 4 和 6 当一个数的各因数之和大于该数本身时 该数称为 盈 数 于是 12 是一个盈数 因为它的因数加起来等于 16 另一方面 当一个数
  • Mathematica函数大全

    一 运算符及特殊符号 Line1 执行Line 不显示结果 Line1 line2 顺次执行Line1 2 并显示结果 name 关于系统变量name 的信息 name 关于系统变量name 的全部信息 command 执行Dos 命令 n
  • 绘图框 p 值显着性注释

    我已经开始使用并喜欢绘制箱线图来表示我的数据 然而 我很难找到一种方法来对比这两个群体 使用Plotly时有没有办法引入数据之间的统计显着性比较 我想创建这样的图表 其中 对应于 p 值 0 05 我发现使用scipy stats ttes
  • 离散数学知识点-期末复习

    目录 一 利用真值表求主析取范式 主合取范式 1 例题 二 推理证明 1 推理规则 2 例题 三 符号化命题 四 有穷集的计数 1 包含互斥原理 2 例题 1 文氏图法 2 包含互斥原理法 五 关系的闭包 1 三种闭包 2 Warshall
  • 将星星添加到 p 值

    我计算了多个变量均值差异的 Anova F 检验 p 值 现在我想添加 星星 来指示 p 值的显着性水平 我希望 表示 10 水平的显着性 表示 5 水平的显着性 表示 1 水平的显着性 我的数据如下所示 structure list Va
  • 高中数学:不等式(初接高)

    1 二次不等式 2 分式不等式 最后的例题 是为了说明第三种情况 就是 不等号右边不为0时 要先进行移项操作 将右边化为0 这样 就转化成1 2两种情况了 3 其它复杂不等式 3 1 高次不等式 3 2 绝对值不等式 3 3 根式不等式 补
  • ggsignif 包错误 stat_signif 需要以下缺失的美观: y

    这是我的数据的发明示例 x lt c Control Case Case Case Control Control Control Case Case Case y lt c Dead Dead Dead Alive Alive Dead
  • 使用 p 值的逐步回归删除 p 值不显着的变量

    我想表演一个逐步线性回归 using p values作为选择标准 例如 在每个步骤中删除具有最高即最不显着 p 值的变量 当所有值均由某个阈值定义的显着时停止alpha 我完全知道我应该使用 AIC 例如命令step or stepAIC

随机推荐

  • Vue2项目练手——通用后台管理项目第六节

    Vue2项目练手 通用后台管理项目 用户管理页 table表格 获取表格数据 目录列表 user js mock js index js Users vue 新增和编辑功能 Users vue 删除功能 使用的组件 Users vue 用户
  • 深度学习的优化方法

    优化方法 深度学习的优化方法 梯度下降算法 反向传播算法 BP算法 前向传播与反向传播 链式法则 反向传播算法 梯度下降优化方法 动量算法 Momentum 指数加权平均 动量梯度下降算法 AdaGrad RMSprop Adam 学习率退
  • Java 多线程联系5:模拟叫号看病

    需求说明 1 package KanBing 2 3 4 治病 5 6 7 public class CureThread implements Runnable
  • confluence安装和使用markdown编辑公式

    参考 https marketplace atlassian com apps 1211438 markdown macro for confluence hosting server tab installation https www
  • C++库大全

    基础类 1 Dinkumware C Library 参考站点 http www dinkumware com P J Plauger编写的高品质的标准库 P J Plauger博士是Dr Dobb s程序设计杰出奖的获得者 其编写的库长期
  • 自编译已集成视频播放功能CEF3.3239版本库 (官方版本编译类似)详解介绍步骤(含编译错误解决)

    工具及编译环境 VS2015 Cmake cmake官网 https cmake org CEF工程官网 https cef builds spotifycdn com index html 1 下载CEF源码 下面的源码是已经集成了播放视
  • MTK Android Driver知识大全

    转载请注明出处 http blog csdn net cbk861110 article details 40931835 一 Display 1 lcm 相关概念 1 1 MIPI接口 一共有三种接口 DBI 也做CPU或MCU接口 DP
  • Vue框架开发Electron12 - 动态改变Element-Ui默认el-Input背景样式

    Element ui是一个非常好的UI设计模块 它提供给我们很多好看的按钮样式 非常适用于快速搭建UI 下面说说如果使用了element ui之后 要更改它默认的el Input样式应该怎么操作 使用调试工具找出他的样式默认表 具体操作如下
  • 爬虫 第三讲 数据解析

    文章目录 爬虫 第三讲 数据解析 一 正则表达式 1 match 函数 search 函数 findall 函数 2 正则表达式中的元字符 3 正则表达式模式 4 正则表达式重复匹配 5 正则表达式中的位置匹配 6 正则表达式中的贪婪与非贪
  • 【Flink】Flink exitCode=239

    1 场景1 1 1 概述 checkpoint 设置3分钟 也失败 我申请的 资源是 yqu realtime yjm 1024 ytm 2048 ys 2
  • ChatGPT和百度文心一言写用例,谁更强?

    文心一言发布的第一时间 就排队申请了邀请码 昨晚看了下 邀请码已经到手 索性就拿一个例子试了一下 看看哪个能够真正意义上的提高生产力 最简单的录制了个GIF动画如下 问题 你是一个软件测试工程师 得到一个需求 软件程序Helios会自动采集
  • shell:遍历目录和子目录的所有文件

    bin bash function getdir for element in ls 1 do dir or file 1 element if d dir or file then getdir dir or file else echo
  • AcWing 861. 二分图的最大匹配

    https www acwing com problem content 863 二分图我不太清楚 我刚做了染色法解决二分图 然后我看了相关资料 https blog csdn net u011815404 article details
  • [4G&5G专题-122]:认证-华为认证概述

    1 链接 https e huawei com cn talent cert navType authNavKey 2 华为认证概述 3 认证等级 HCIA 工程师等级 HCIP 高级工程师等级 HCIE 专家级 4 学习培训 4 1 概述
  • JavaScript中结果转换为带有“千位分隔符”的数字

    在开发有关金额方面需求的时候 我们往往都需要对金额的显示进行一些处理 例如 将金额转换为带有 千位分隔符 的数字 像我们银行卡里的余额 购买商品时的总金额 就会有这一方面的需求 那么到底要怎么样去转换呢 这就需要用到 JavaScript
  • Hexo+Butterfly主题博客添加音乐播放器的简单版教程

    博客添加背景音乐 前言 基于Hexo框架 主题为Butterfly的个人博客 效果图 实现个人博客拥有全局吸底音乐播放器 即背景音乐 实现步骤 添加音乐播放器插件 可选择在vscode webstorm终端运行 一定要在博客项目文件中运行
  • IntelliJ IDEA 的 Spring 项目如何查看 @Value 的配置和值

    当你打开项目或者项目中的文件的时候 如果你有 Spring 的 Value 的配置 Intellij 将会自动将参数替换为值 如果你单击上面的值 那么这个配置参数将会显示为配置的参数名 如果你还想显示值的话 你需要重新打开这个文件或者项目
  • C++ 基础(数组)

    数组 是同一类型的多个元素的集合 声明了一个名为 a 的具有10个整数的数组 数组中的第一个元素 索引为0 设置为50 int a 10 a 0 50 数组初始化语法 int fib 5 0 1 1 2 3 或者使用循环 int array
  • Seaborn5分钟入门(六)——heatmap热力图

    微信公众号 Python读财 如有问题或建议 请公众号留言 Seaborn是基于matplotlib的Python可视化库 它提供了一个高级界面来绘制有吸引力的统计图形 Seaborn其实是在matplotlib的基础上进行了更高级的API
  • 假设检验笔记

    假设检验 就是做了一个假设 H 然后通过实验得到相关的统计数据判断 H 是否 大概率 成立 或者有多大把握认为 H 成立 这个 H 一般是一个与分布 统计量相关的的命题 如 H P 硬 币 朝