Bootstrap统计学方法简介以及中心极限定理

2023-11-05

一、概念

  • Bootstrap 一词出自英文习语“pull yourself up by your bootstraps”。它的隐含意是“improve your situation by your own efforts”,即“通过你自己的努力(而非他人帮助)来解决困难改善处境”。因此,Bootstrap 一词就代表了“自力更生”;
  • 与参数估计比较,Bootstrap 意味着我们仅仅通过使用手头上的样本数据而不对总体的分布做任何假设(比如传统方法中的正态分布假设),来计算样本统计量在估计总体统计量时的误差;
  • Bootstrap 原则指出:“Bootstrap 样本统计量 x ‾ ∗ \overline{x}^* x 围绕原始样本统计量 x ‾ \overline{x} x 的变化(简称为 x ‾ ∗ \overline{x}^* x 的变化)”是“原始样本统计量 x ‾ \overline{x} x 围绕总体统计量 μ \mu μ 的变化(简称为 x ‾ \overline{x} x 的变化)”的一个很好的近似。

二、工作原理

Bootstrap对原始数据集进行重抽样,创建模拟数据数据集,其抽样方法具有如下特点:

  • 每次抽样对于每个样本具有相同的概率,具有随机抽取每个原始数据点以将其包含在重抽样数据集中的可能性;
  • 属于"有放回"的抽样方式,某样本可以多次出现在重抽样的数据集中;
  • 该过程将创建与原始数据集大小相同的重抽样数据集。

三、与传统方法的比较

  • 计算置信区间的方法为传统的Normal Theory方法,其背后存有强大假设:中心极限定理和正态分布。如果未知分布不规则未知或样本数不足(本例样本量只有7),则中心极限定理指出的均值近似为正态分布便难以成立,而基于t分布计算出来的均值置信区间也不够准确;
  • 分布未知及样本量不足时,传统的Normal Theory方法局限性很大,使得我们在求解置信区间的很多问题面前举步维艰,Bootstrap方法在计算统计量的置信区间时大有可为;
  • 基于大数据思维,Bootstrap方法得出的真值的置信区间相对更窄( 依然未超限度),从统计意义上进一步降低了假阳性;
  • 对于小数据集,bootstrap效果通常很好;
  • 若样本的潜在分布未知,或存在离群点,或样本量过小,以及没有其它合适的参数方法时,bootstrap将是获取置信区间以及进行假设检验的一种有效方法。

题外:

什么是中心极限定理(Central Limit Theorem)

中心极限定理指的是给定一个任意分布的总体。我每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。 然后把这 m 组抽样分别求出平均值。 这些平均值的分布接近正态分布。

  • 我们先举个栗子?

现在我们要统计全国的人的体重,看看我国平均体重是多少。当然,我们把全国所有人的体重都调查一遍是不现实的。所以我们打算一共调查1000组,每组50个人。 然后,我们求出第一组的体重平均值、第二组的体重平均值,一直到最后一组的体重平均值。中心极限定理说:这些平均值是呈现正态分布的。并且,随着组数的增加,效果会越好。 最后,当我们再把1000组算出来的平均值加起来取个平均值,这个平均值会接近全国平均体重。

  • 其中要注意的几点:
    1. 总体本身的分布不要求正态分布
      上面的例子中,人的体重是正态分布的。但如果我们的例子是掷一个骰子(平均分布),最后每组的平均值也会组成一个正态分布。(神奇!)
    2. 样本每组要足够大,但也不需要太大
      取样本的时候,一般认为,每组大于等于30个,即可让中心极限定理发挥作用。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Bootstrap统计学方法简介以及中心极限定理 的相关文章

  • 如何将iframe内容复制到div?

    请参阅下面的代码片段 我希望 iframe 中的输出文本显示在 source div 中 我正在为此苦苦挣扎 并且很感激任何想法 如何将 iframe 中的输出文本复制到 div 中 如果 div sourcediv 包含 文本 则脚本在
  • f:ajax 不工作

    我很难得到f ajax从事某项工作h panelGroup 这就是我正在做的 JSF 代码
  • 文本输入框作为 SVG 中的“foreignObject” - 文本溢出问题

    我使用 foreignObject 标签在 svg 中有一个文本输入框 这很有效 但是如果您在输入框中输入的内容比其宽度长 从而导致其溢出 那么文本实际上会出现在页面上的其他位置 可能是没有外来对象标记的默认位置 这是一些屏幕截图来解释正在
  • JavaScript 表单提交 - 确认或取消提交对话框

    对于带有询问字段是否填写正确的警报的简单表单 我需要一个执行此操作的函数 单击按钮时显示警告框 有两个选项 如果单击 确定 则提交表单 如果单击 取消 警报框将关闭 并且可以调整并重新提交表单 我认为 JavaScript 确认可以工作 但
  • document.querySelectorAll("input[type=checkbox") 的结果数组的顺序是否有保证?

    我在页面正文中有以下 HTML 这些是此 HTML 页面上类型复选框的唯一输入 fieldset legend North Face legend N A1 fieldset
  • jQuery 数据与 Attr?

    两者的用法有什么区别 data and attr使用时data someAttribute 我的理解是 data存储在 jQuery 中 cache 而不是 DOM 因此 如果我想使用 cache对于数据存储 我应该使用 data 如果我想
  • SharePoint

    我的 SharePoint 网站上有一个 aspx 页面 其中包含了标签 由于某种原因 页面上的每个按钮在单击时都会重新加载页面 即使没有属性 id class 等 或功能的按钮在单击时也会重新加载页面 我该如何解决这个问题 我什至看不到调
  • 将单选按钮放置在图像上

    我试图在图像上的确切位置放置一些单选按钮 我已将两者都放在 Div 中 但我不知道下一步该怎么做 这是我想要放置单选按钮的位置 红色圆圈 到目前为止 这是我的代码 center display block margin left auto
  • 使 href(锚标记)请求 POST 而不是 GET? [复制]

    这个问题在这里已经有答案了 a href employee action Employee1 a 当我单击 Employee1 链接时 GET 请求将发送到服务器 我想让它 POST 而不是 GET 请求 有没有办法改变 href 的默认
  • 如何用Python抓取动态网页

    我正在努力做什么 抓取下面的网页以获取二手车数据 Issue 刮掉整个页面 在上面的 url 中 仅显示前 30 项 这些可以通过我在下面编写的代码来抓取 其他页面的链接显示为 1 2 3 但链接地址似乎是用 Javascript 编写的
  • javascript中怪异模式的元素宽度?

    我一直在浏览所有流行的 js 库 但我找不到一个具有 DOM 元素宽度函数的库 该函数实际上可以解释 Internet Explorer 中的怪异模式 问题是 当启用怪异模式时 填充和边框不会计入宽度 据我所知 当省略 doctype 或将
  • BUG - 在 IOS 中没有选择标签的完成按钮

    我正在使用最新的离子并有一个简单的选择标签
  • React JS - 单击时更改颜色并将默认颜色放在所有其他颜色上

    我有 x 个渲染数文章预览依赖于 API 调用的组件 div div Object keys images map index i gt return div div
  • 使用 javascript 禁用按钮:FF 与 IE

    我有一排按钮 它们都会创建一个我想在新选项卡中打开的 pdf 文件 这样按钮页面就会保持在顶部 并且 pdf 会打开以进行打印 为了防止单击按钮两次 我禁用该按钮 如下所示 我使用 python
  • 显示表中的记录

    我的第一个 PHP 项目遇到了一些麻烦 我试图从 MySQL 数据库 有 3 条记录 获取数据并将其显示在表格中 问题是它似乎只显示记录 2 和 3 它跳过了第 1 条记录 请参阅我的代码并在下面显示 if mysqli connect e
  • 如何使用CSS将背景图像放入选择选项标签中

    我有一个从 json 响应接收的国家 地区下拉列表 并且想要在国家 地区名称旁边添加相应的国家 地区国旗图标 也从 json 响应获取图像 我已经尝试了不同的 jQuery 和 bootstrap 插件 但他们所做的是破坏我以前的选择框样式
  • 自定义 WP 主题时,我应该将导航栏放在“”标签之前还是之后?

    我正在通过制作子主题来自定义 WP 主题 我将 Bootstrap 中的导航栏放入子主题目录中的 header php 文件中 但是 我不确定在哪里放置导航栏代码 我可以把它都放在前面and之后标记成功 例如 无论我选择哪一个 导航栏都显示
  • 一个接一个地淡入div

    大家好 我很擅长 HTML 和 CSS 但才刚刚开始接触 jQuery 的皮毛 我希望让 3 个 div 在页面加载时逐渐淡入 到目前为止我有这个 我听说使用 css 将显示设置为 none 对于任何使用非 JavaScript 浏览器的人
  • 更改javascript nodejs中所有页面的href url

    我已经实现了具有多种语言下拉菜单的引导导航栏 当我选择语言时 它将翻译页面 如何更改其他页面的 url 和按钮文本 当我选择french 将所有网址更改为 fr about and fr contact 如何使用 JavaScript 进行
  • 是否可以使“HTML 到语音”与“文本到语音”相同?

    我有一个奇怪的要求 在我现有的应用程序中我有Text2Speech为此 我使用了AVSpeechSynthesizer 到语音文本 但现在要求发生了变化 现在我需要将 HTML 文件数据转换为文本 例如HTML2Speech 我们可以想到的

随机推荐

  • 全排列的价值 python实现 蓝桥杯 2137

    问题描述 对于一个排列 A a1 a2 an 定义价值 ci 为 a1 至 ai 1 中小于 ai 的数 的个数 即 ci aj j
  • AI大语言模型时代构建全新数据平台

    在大语言模型的引领下 数据平台领军企业 Databricks 和 Snowflake 的未来重置 探讨了 Databricks 和 Snowflake 等知名平台 存储领域的 Delta udi Iceberg 还是实时化数据处理领域的 D
  • 双向链表的创建以及增删改查

    实现起来其实不难 于是我把代码做了优化 模仿了stm32的库函数哈哈哈 便于理解和修改 不足之处请指出 include stdio h include stdlib h 宏定义 define ElementType int define u
  • 免费java视频教程大全在线观看

    下面是免费java视频教程大全在线观看 尚学堂马士兵报表组件JFreeChart 尚学堂的项目管理工具 尚硅谷java20天 尚硅谷SVN 更多java视频与学习资料大家就到这里了解一下吧 http java 662p com forum
  • Java启动本机应用程序EXE的三种方式

    第一种方式 利用cmd方式 执行cmd命令 param command throws IOException public static String executeCmd String command throws IOException
  • 解决IE识别ES6语法

    使用jq做项目时 混用了部分es6的语法 导致在IE下项目无法正常运行 于是乎 便在网上找到了下面两种方法 并尝试了一下 一 直接在浏览器中引入browser min js 并且将script的type设置成text babel 尝试了在网
  • laravel 中 使用 composer 的中国镜像安装时报错(找不到包)

    composer require jenssegers mongodb 安装mongodb时报错 Your requirements could not be resolved to an installable set of packag
  • SpringBoot Admin集成诊断利器Arthas实践

    前言 Arthas 是 Alibaba开源的Java诊断工具 具有实时查看系统的运行状况 查看函数调用参数 返回值和异常 在线热更新代码 秒解决类冲突问题 定位类加载路径 生成热点图 通过网页诊断线上应用 如今在各大厂都有广泛应用 也延伸出
  • 使用docker搭建elk

    一 安装前须知 以下步骤在 VMware 中的 centos 7 中操作 ip 地址为 192 168 161 128 注意安装的时候最好统一版本 否则后面会出现许多问题 进官网搜索对应镜像 查看 Tags 标签下的版本 目前我这最新的 T
  • Transformer怎么入门?如何学习Transformer?

    Transformer比较好学 整个路线也非常简单 就三步 第一步 理论学习 理论学习部分首先要了解Attention机制 这里推荐李宏毅老师的机器学习 或者看他的PPT 讲的很清楚 国外的也有斯坦福的CS25 Transformers U
  • 校园资料分享平台的设计与开发、资料分享

    目录 1 使用框架和技术 2 功能展示与说明 3 系统展示 3 1 使用到技术 3 2 前台展示 3 3 后台界面 4 论文资料和程序 在教育领域 使用IT技术可以使任何人 任何地方和任意的时间 都可以获得需要的资料 但现在的校园大多是综合
  • [stable-diffusion-art] 指北-4 模型

    Beginner s guide to Stable Diffusion models and the ones you should know Stable Diffusion ArtHow to install use and merg
  • 史上最全的 Python 3 类型转换指南

    int 支持转换为 int 类型的 仅有 float str bytes 其他类型均不支持 float gt int 会去掉小数点及后面的数值 仅保留整数部分 int 12 94 12 str gt int 如果字符串中有数字 0 9 和正
  • Windows下误删文件解决办法

    推荐几款优秀的数据恢复软件 Disk Drill Disk Drill是一款免费软件 支持支Windows 与 Mac 使用它能我们找回磁盘 U盘 等各种储存装置的视频 照片 文章等各类文件 最早了解这款软件还是当初帮一个妹纸的电脑恢复照片
  • 中国电信定制的中兴 ZXV10 B760H 机顶盒root全程记录

    家里有台机顶盒 是中兴 ZXV10 B760H 它是智能机顶盒 在写这篇文章之前 我已經对它进行了破解 别看是 智能机顶盒 但实际上已經让中国电信阉割的差不多了 只能看IPTV 我这个破解可以让它安装第三方app 今天重点讲root 你需要
  • ————博客永久废止————转到http://1su.net/nsB

    由于CSDN博客太难以管理 博主转向Ghost Blog Node的博客引擎 该博客永久废止 新的博客地址为http 1su net nsB
  • FutureTask 源码 并发设计模式

    一 代码 https www jianshu com p 60f661d95d53 public static void main String args throws Exception Callable
  • spring应用上下文的理解

    spring应用上下文的理解 容器 什么叫容器呢 如果你想要一个手机 好这时候spring就给你一个手机 你想要使用的对象 spring就会给你 但是现在我们就会问那spring给的对象来自于哪里呢 spring要负责的工作很多 那么多对象
  • Matlab矩阵

    1 通用的特殊矩阵 zeros函数 产生全0矩阵 ones函数 产生全1矩阵 eye函数 产生对角线为1的矩阵 当矩阵是方阵时 得到一个单位矩阵 rand函数 产生 0 1 区间均匀分布的随机矩阵 randn函数 产生均值为0 方差为1的标
  • Bootstrap统计学方法简介以及中心极限定理

    一 概念 Bootstrap 一词出自英文习语 pull yourself up by your bootstraps 它的隐含意是 improve your situation by your own efforts 即 通过你自己的努力