Bootstrap统计学方法简介以及中心极限定理

2023-11-05

一、概念

Bootstrap 一词出自英文习语“pull yourself up by your bootstraps”。它的隐含意是“improve your situation by your own efforts”，即“通过你自己的努力（而非他人帮助）来解决困难改善处境”。因此，Bootstrap 一词就代表了“自力更生”；
与参数估计比较，Bootstrap 意味着我们仅仅通过使用手头上的样本数据而不对总体的分布做任何假设（比如传统方法中的正态分布假设），来计算样本统计量在估计总体统计量时的误差；
Bootstrap 原则指出：“Bootstrap 样本统计量 x ‾ ∗ \overline{x}^* x∗ 围绕原始样本统计量 x ‾ \overline{x} x 的变化（简称为 x ‾ ∗ \overline{x}^* x∗ 的变化）”是“原始样本统计量 x ‾ \overline{x} x 围绕总体统计量 μ \mu μ 的变化（简称为 x ‾ \overline{x} x 的变化）”的一个很好的近似。

二、工作原理

Bootstrap对原始数据集进行重抽样，创建模拟数据数据集，其抽样方法具有如下特点：

每次抽样对于每个样本具有相同的概率，具有随机抽取每个原始数据点以将其包含在重抽样数据集中的可能性；
属于"有放回"的抽样方式，某样本可以多次出现在重抽样的数据集中；
该过程将创建与原始数据集大小相同的重抽样数据集。

三、与传统方法的比较

计算置信区间的方法为传统的Normal Theory方法，其背后存有强大假设：中心极限定理和正态分布。如果未知分布不规则未知或样本数不足（本例样本量只有7），则中心极限定理指出的均值近似为正态分布便难以成立，而基于t分布计算出来的均值置信区间也不够准确；
分布未知及样本量不足时，传统的Normal Theory方法局限性很大，使得我们在求解置信区间的很多问题面前举步维艰，Bootstrap方法在计算统计量的置信区间时大有可为；
基于大数据思维，Bootstrap方法得出的真值的置信区间相对更窄（依然未超限度），从统计意义上进一步降低了假阳性；
对于小数据集，bootstrap效果通常很好；
若样本的潜在分布未知，或存在离群点，或样本量过小，以及没有其它合适的参数方法时，bootstrap将是获取置信区间以及进行假设检验的一种有效方法。

题外：

什么是中心极限定理（Central Limit Theorem）

中心极限定理指的是给定一个任意分布的总体。我每次从这些总体中随机抽取 n 个抽样，一共抽 m 次。然后把这 m 组抽样分别求出平均值。这些平均值的分布接近正态分布。

我们先举个栗子?

现在我们要统计全国的人的体重，看看我国平均体重是多少。当然，我们把全国所有人的体重都调查一遍是不现实的。所以我们打算一共调查1000组，每组50个人。然后，我们求出第一组的体重平均值、第二组的体重平均值，一直到最后一组的体重平均值。中心极限定理说：这些平均值是呈现正态分布的。并且，随着组数的增加，效果会越好。最后，当我们再把1000组算出来的平均值加起来取个平均值，这个平均值会接近全国平均体重。

其中要注意的几点：
1. 总体本身的分布不要求正态分布
  上面的例子中，人的体重是正态分布的。但如果我们的例子是掷一个骰子（平均分布），最后每组的平均值也会组成一个正态分布。（神奇！）
2. 样本每组要足够大，但也不需要太大
  取样本的时候，一般认为，每组大于等于30个，即可让中心极限定理发挥作用。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

统计学

bootstrap

前端

html

Bootstrap统计学方法简介以及中心极限定理的相关文章

HTML标签阻止HTML标签被执行？

我想问超级用户的基本问题但我认为这是一个编程问题我刚刚开始学习 HTML 所以请耐心等待如何防止程序解释 HTML 标签语法例如我想写一个这样的闪存卡 html 代码为 lt is lt 我想要一个适用于任何或大多数语法的解决方
使用 bootstrap 将搜索图标放入文本框中

我默认使用引导程序文本框占据列的全宽我想将搜索图标放在文本框的末尾我的代码是这样的 div class container div class row div class form group col lg 4 div div div
如何仅使用CSS设置某个角的边框半径

如上所示我可以只给顶部部分而不给底部提供半径或者有时给底部而不是顶部提供半径吗有没有办法只给一个角提供边界半径 Like border radius top left top right bottom right bottom lef
通过 Javascript 将图像切割成碎片

我正在创建一个简单的拼图游戏为了做到这一点我需要将我正在使用的图片切成 20 块 Javascript 有没有办法将一张图片切成 20 个相等的部分并将它们保存为网页中的 20 个不同的对象或者我只需要进入 Photoshop 自己
使用 PHP 获取 2 个同名 HTML 输入标签的值

假设我有下表
如何在表格的 tbody/thead 部分周围创建边框？

我正在尝试创建一个包含表格数据的页面该页面必须显示为多个表格然而我有两个相互冲突的要求需要解决每个表格周围都必须有边框每个表格的列宽必须能够根据内容重新调整大小但是所有表中的列宽必须一致即列的大小基于所有表中该列中最大的单元
如何解决此错误：属性 rel 的原始源值错误

我正在尝试使用 w3c 验证我的网站但出现错误 Bad value original source for attribute rel on element link The string original source is not a
如何将 HTML 转换为 Markdown？

我有一个类似 stackoverflow 的网站有一个文本区域人们可以在其中写答案我用这个 PHP 库 http parsedown org 转换降价我的意思是我使用该函数来转换 italic to i italic i inclu
理解 z-index：该元素如何出现在其父级同级元素的前面？

为什么当我删除时红色 div 位于绿色 div 前面z index from wrapperRed 感觉像z index是沿着链条向上继承的如果我改变z index将绿色 div 更改为 6 即使删除第一句中描述的行后它仍保留在红色 d
createHTMLNotification() 替换

我创建了一个 Chrome 扩展程序其中使用createHTMLNotification 在所有内容之上显示一个窗口然而从 Chrome 28 开始谷歌决定放弃createHTMLNotification 完全为什么谷歌为什么
使用 python 在一个 html 页面中显示分割数据框的 HTML 代码

我是 html css 新手所以对以 html 格式显示的数据有疑问我有一个很长的列表我想将其拆分并以 html 格式显示为两个单独的列例如而不是 Col1 Col2 1 a 2 a 3 a 4 a 5 b 6 b 7 b 8 b
jQuery mobile 中的文本区域高度和宽度？

我修复了 jQuery mobile 中文本区域元素的高度并且在纵向中得到了完美的高度和宽度但在横向中宽度没有放大谁能帮我提前致谢 HTML
在 HTML5 Javascript 中将 BlobBuilder 转换为字符串

function blobToString blob var reader new FileReader var d reader onloadend function d callback reader result console lo
使用本地存储在从另一个表保存的 HTML TABLE 中打印 JSON，以便我在另一个页面上打印我的表

在我的作业中我必须使用用户输入中的数据并将数据保存在本地存储中我必须以水平表格式将这些数据从本地存储打印到其他页面为此我编写了用于用户输入并将数据保存在本地存储中的代码 div p p div
最佳 JSON-LD 实践：使用多个