Python 中的引导采样

2023-11-12

这是关于 Python 中的 Bootstrap 采样的教程。在本教程中，我们将了解什么是引导，然后了解如何实现它。

让我们开始吧。

什么是引导抽样？

引导抽样的定义如下：

在统计学中，引导抽样是一种方法，涉及从数据源中重复抽取样本数据并进行替换，以估计总体参数。

这基本上意味着引导抽样是一种技术，您可以使用它来估计整个总体的平均值等参数，而无需明确考虑总体中的每个数据点。

我们不是着眼于整个总体，而是着眼于从总体中提取的多个相同大小的子集。

例如，如果您的人口规模是1000.然后找到平均值，而不是考虑所有 1000 个条目50 个样品，每个尺寸 4并计算每个样本的平均值。这样你就可以平均得到200 个条目(50X4) 随机选择。

市场研究人员使用类似的策略对大量人群进行研究。

如何在Python中实现Bootstrap采样？

现在让我们看看如何在Python中实现引导采样。

我们将生成一些具有预定平均值的随机数据。为此，我们将使用Python 中的 NumPy 模块.

让我们从导入必要的模块开始。

1.导入必要的模块。

我们需要的模块是：

Numpy
Random

要导入这些模块，请使用：

import numpy as np
import random

在下一步中，我们需要生成一些随机数据。让我们使用 Numpy 模块来做到这一点。

2. 生成随机数据

让我们生成一个平均值为的正态分布300与1000条目。

其代码如下：

x = np.random.normal(loc= 300.0, size=1000)

我们可以使用以下方法计算该数据的平均值：

print (np.mean(x))

Output :

300.01293472373254

请注意，这是总体的实际平均值。

3. 使用 Bootstrap Sampling 来估计平均值

让我们创建 50 个样本，每个样本大小为 4 来估计平均值。

这样做的代码是：

sample_mean = []

for i in range(50):
  y = random.sample(x.tolist(), 4)
  avg = np.mean(y)
  sample_mean.append(avg)

列表样本平均值将包含所有 50 个样本的平均值。为了估计总体的平均值，我们需要计算样本平均值.

您可以使用以下方法来做到这一点：

print(np.mean(sample_mean))

Output :

300.07261467146867

现在，如果我们再次运行本节中的代码，我们将得到不同的输出。这是因为每次运行代码时，我们都会生成新的样本。然而，每次输出都会接近实际平均值 (300)。

再次运行本节中的代码，我们得到以下输出：

299.99137705245636

再次运行，我们得到：

300.13411004148315

在 Python 中实现 Bootstrap 采样的完整代码

这是本教程的完整代码：

import numpy as np
import random

x = np.random.normal(loc= 300.0, size=1000)
print(np.mean(x))

sample_mean = []
for i in range(50):
  y = random.sample(x.tolist(), 4)
  avg = np.mean(y)
  sample_mean.append(avg)

print(np.mean(sample_mean))

结论

本教程是关于 Python 中的 Bootstrap 采样。我们学习了如何通过创建较小的样本来估计总体的平均值。这在机器学习领域非常有用，可以避免过度拟合。希望您和我们一起学习愉快！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Python Advanced

Python 中的引导采样的相关文章

如何查看Databricks中的所有数据库和表

我想列出 Azure Databricks 中每个数据库中的所有表所以我希望输出看起来像这样 Database Table name Database1 Table 1 Database1 Table 2 Database1 Table
Python 的键盘中断不会中止 Rust 函数 (PyO3)

我有一个使用 PyO3 用 Rust 编写的 Python 库它涉及一些昂贵的计算单个函数调用最多需要 10 分钟从 Python 调用时如何中止执行 Ctrl C 好像只有执行结束后才会处理所以本质上没什么用最小可重现示例 Ca
Django 管理员在模型编辑时间歇性返回 404

我们使用 Django Admin 来维护导出到我们的一些站点的一些数据有时当单击标准更改列表视图来获取模型编辑表单而不是路由到正确的页面时我们会得到 Django 404 页面模板它是偶尔发生的我们可以通过重新加载三次来重现它
将数据从 python pandas 数据框导出或写入 MS Access 表

我正在尝试将数据从 python pandas 数据框导出到现有的 MS Access 表我想用已更新的数据替换 MS Access 表在 python 中我尝试使用 pandas to sql 但收到错误消息我觉得很奇怪使用 p
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
Django：按钮链接

我是一名 Django 新手用户尝试创建一个按钮单击该按钮会链接到我网站中的另一个页面我尝试了一些不同的例子但似乎没有一个对我有用举个例子为什么这不起作用
PyUSB 1.0：NotImplementedError：此平台不支持或未实现操作

我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位并从以下地址下载 z
如何从网页中嵌入的 Tableau 图表中抓取工具提示值

我试图弄清楚是否有一种方法以及如何使用 python 从网页中的 Tableau 嵌入图形中抓取工具提示值以下是当用户将鼠标悬停在条形上时带有工具提示的图表示例我从要从中抓取的原始网页中获取了此网址 https covid19 colo
SQLALchemy .query：类“Car”的未解析属性引用“query”

我有一个这里已经提到的问题https youtrack jetbrains com issue PY 44557 https youtrack jetbrains com issue PY 44557 但我还没有找到解决方案我使用 Pyt
以编程方式停止Python脚本的执行？ [复制]

这个问题在这里已经有答案了是否可以使用命令在任意行停止执行 python 脚本 Like some code quit quit at this point some more code that s not executed sys e
OpenCV 无法从 MacBook Pro iSight 捕获

几天后我无法再从 opencv 应用程序内部打开我的 iSight 相机 cap cv2 VideoCapture 0 返回并且cap isOpened 回报true 然而 cap grab 刚刚返回false 有任何想法吗示例代码
添加不同形状的 numpy 数组

我想添加两个不同形状的 numpy 数组但不进行广播而是将缺失值视为零可能最简单的例子是 1 2 3 2 gt 3 2 3 or 1 2 3 2 1 gt 3 2 3 1 0 0 我事先不知道形状我正在弄乱每个 np shape
Python 的“zip”内置函数的 Ruby 等价物是什么？

Ruby 是否有与 Python 内置函数等效的东西zip功能如果不是做同样事情的简洁方法是什么一些背景信息当我试图找到一种干净的方法来进行涉及两个数组的检查时出现了这个问题如果我有zip 我可以写这样的东西 zip a b a
Pygame：有没有简单的方法可以找到按下的任何字母数字的字母/数字？

我目前正在开发的游戏需要让人们以自己的名义在高分板上计时我对如何处理按键有点熟悉但我只处理过寻找特定的按键有没有一种简单的方法可以按下任意键的字母而不必执行以下操作 for event in pygame event get if
使用 \r 并打印一些文本后如何清除控制台中的一行？

对于我当前的项目有一些代码很慢并且我无法使其更快为了获得一些关于已完成必须完成多少的反馈我创建了一个进度片段您可以在下面看到当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
Fabric env.roledefs 未按预期运行

On the 面料网站 http docs fabfile org en 1 10 usage execution html 给出这个例子 from fabric api import env env roledefs web hosts
如何在 Python 中追加到 JSON 文件？

我有一个 JSON 文件其中包含 67790 1 kwh 319 4 现在我创建一个字典a dict我需要将其附加到 JSON 文件中我尝试了这段代码 with open DATA FILENAME a as f json obj js
有没有办法检测正在运行的代码是否正在上下文管理器内执行？

正如标题所述有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
如何使用 Pycharm 安装 tkinter？ [复制]

这个问题在这里已经有答案了 I used sudo apt get install python3 6 tk而且效果很好如果我在终端中打开 python Tkinter 就可以工作但我无法将其安装在我的 Pycharm 项目上 pip
Statsmodels.formula.api OLS不显示截距的统计值

我正在运行以下源代码 import statsmodels formula api as sm Add one column of ones for the intercept term X np append arr np ones 50

随机推荐

Bash if..else 语句

本教程将引导您了解 Bash 的基础知识if声明并向您展示如何在 shell 脚本中使用它决策是计算机编程最基本的概念之一与任何其他编程语言一样 if if else if elif else 并嵌套ifBash 中的语句用于根据特定条
Java中的多重继承

今天我们将研究Java中的多重继承不久前我写了几篇关于遗产界面 and 作品在Java中在这篇文章中我们将研究 java 多重继承然后比较组合和继承 Java中的多重继承 Multiple inheritance in java
Java 中的装饰器设计模式示例

装饰器设计模式用于在运行时修改对象的功能同时同一类的其他实例不会受此影响因此单个对象会获得修改后的行为装饰设计模式是结构设计模式之一如适配器模式桥梁图案复合图案并使用抽象类或接口作品来实施装饰设计模式 We use inh
获取R中的行数和列数

各位读者大家好在本文中我们将重点讨论 R 中的行和列的概念即R编程中获取对象的行数和列数详细那么让我们开始吧 Be it a matrix or a 数据框我们按照行和列来处理数据在数据分析领域尤其是统计分析我们需要了解
如何在 CentOS、Rocky Linux、RHEL 和 Fedora 上安装 Java

介绍本教程将向您展示如何在基于 RPM 的 Linux 发行版的当前版本上安装 Java Red Hat Enterprise Linux CentOS Fedora 和 Rocky Linux Java 是一种流行的编程语言和软件平台
如何在 Ubuntu 14.04 上使用 Nginx 安装 WordPress

介绍 WordPress 是世界上最流行的 CMS 内容管理系统它使您可以轻松启动并运行您的网站或博客安装后您可以在简单的 Web 界面中管理几乎所有内容在本指南中我们将介绍如何在 Ubuntu 14 04 服务器上安装 Word
如何使用 Nmap 和 Tcpdump 测试您的防火墙配置

介绍为您的基础设施设置防火墙是为您的服务提供安全性的好方法一旦您制定了满意的策略下一步就是测试您的防火墙规则重要的是要充分了解您的防火墙规则是否按照您的想法进行并了解您的基础设施在外界看来是什么样子在本指南中我们将介绍一些可用
Linux 终端简介

介绍本教程是 Linux 基础知识系列的第一篇涵盖终端 Linux 命令行和执行命令的入门知识如果您是 Linux 新手您将需要熟悉终端因为它是与 Linux 服务器交互的标准方式如果您想充分利用本教程您将需要连接和使用 Li
最小堆二叉树

A Min Heap二叉树是二叉树其中根节点具有树中的最小键上述定义对于树中的所有子树都适用这被称为最小堆属性除了最后两层之外几乎每个节点都必须有两个子节点也就是说除了最后两层之外这几乎是一个完整的二叉树由于上述两个属性成
在 Python 3 中使用循环时如何使用 Break、Continue 和 Pass 语句

介绍 Using for 循环 and while 循环Python 允许您以有效的方式自动化和重复任务但有时外部因素可能会影响程序的运行方式发生这种情况时您可能希望程序完全退出循环在继续之前跳过循环的一部分或者忽略该外部因素
休眠教程

最近写了很多hibernate教程休眠是当前市场上最好的Java ORM工具之一所以这篇文章就像是所有 hibernate 教程和示例文章的索引您可以依次浏览这些 hibernate 教程从头开始学习 hibernate 我很可能会
Java 中的线程安全

Java中的线程安全是一个非常重要的话题 Java使用Java线程提供多线程环境支持我们知道从同一个对象创建的多个线程共享对象变量这可能会导致数据不一致当线程用于读取和更新共享数据时线程安全 The reason for data i
如何使用 Ansible 角色抽象您的基础设施环境

介绍 Ansible 是一种配置管理工具旨在为管理员和运营团队自动控制服务器借助 Ansible 您可以使用单个中央服务器来控制和配置许多不同的远程系统仅使用 SSH 和 Python 作为要求 Ansible 根据任务定义在其管理的
如何在 CentOS 6 上使用 fail2ban 保护 SSH

Status 已弃用本文介绍不再受支持的 CentOS 版本如果您当前运行的服务器运行 CentOS 6 我们强烈建议您升级或迁移到受支持的 CentOS 版本 Reason CentOS 6 于 2020 年 11 月 30 日达到生
如何监控 DigitalOcean Droplet 上的 CPU 使用情况

介绍假设您的网站或应用程序比平时更慢你如何开始调查这个问题导致应用程序缓慢的原因有很多但有时是因为服务器的 CPU 已满本指南将帮助您了解您是否属于这种情况我们将首先了解 Linux 服务器上两个最常引用的资源使用指标 CPU利
如何在 Python 中将字符串转换为浮点数

介绍在这篇文章中我们将使用Pythonfloat 函数将字符串转换为浮点数我们还将使用Python的str 函数将浮点数转换为字符串在使用数据类型进行计算和串联之前正确转换数据类型非常重要以防止运行时错误先决条件为了完成本教程
机器学习简介

介绍机器学习是人工智能 AI 的一个子领域机器学习的目标通常是理解数据的结构并将该数据拟合到人们可以理解和利用的模型中尽管机器学习是计算机科学的一个领域但它与传统的计算方法不同在传统计算中算法是计算机用来计算或解决问题的显式编程
如何将路由解析器与 Angular 路由器一起使用

介绍处理从 API 检索和显示数据的一种方法是将用户路由到组件然后在该组件的ngOnInit钩子调用服务中的方法来获取必要的数据在获取数据时组件也许可以显示加载指示器还有另一种方法可以使用所谓的route resolver 它允许
如何在 Ubuntu 14.04 上安装 LAMP [快速入门]

介绍 LAMP 堆栈 Linux Apache MySQL PHP 是一组开源软件通常安装在一起以使服务器能够托管动态 PHP 网站和 Web 应用程序本指南包括在 Ubuntu 14 04 上的单个服务器上设置 LAMP 堆栈的步骤
Python 中的引导采样

这是关于 Python 中的 Bootstrap 采样的教程在本教程中我们将了解什么是引导然后了解如何实现它让我们开始吧什么是引导抽样引导抽样的定义如下在统计学中引导抽样是一种方法涉及从数据源中重复抽取样本数据并进行替换

Python 中的引导采样

Python 中的引导采样 的相关文章

随机推荐

热门标签

Python 中的引导采样的相关文章