如何简单理解概率分布函数和概率密度函数?

2023-10-29

本篇文章是在《应该如何理解概率分布函数和概率密度函数?》的基础上整理来的。非常感谢原作者。

目录

1 先从离散型随机变量和连续性随机变量说起

2 离散型随机变量的概率函数,概率分布和分布函数

2.1 概率函数和概率分布

2.1.1 概率函数

2.1.1 概率分布

2.2 分布函数

3 连续型随机变量的概率函数和分布函数

4 参考文献


 

1 先从离散型随机变量和连续性随机变量说起

对于如何分辨离散型随机变量和连续性随机变量,在贾俊平老师的《统计学》教材中,给出了这样的区分:

如果随机变量的值都可以逐个列举出来,则为离散型随机变量。如果随机变量X的取值无法逐个列举则为连续型变量。

进一步解释,离散型随机变量是指其数值只能用自然数或整数单位计算的则为离散变量。例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得。反之,在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。例如,生产零件的规格尺寸,人体测量的身高,体重,胸围等为连续变量,其数值只能用测量或计量的方法取得。

形象点来解释::

画一幅画,左边是梯子,右边是斜坡。
像梯子一样能说出有多少层的,可描述的,是离散型随机变量;
像斜坡一样不能说出有多少层阶梯,不可描述的,是连续性随机变量。
需要注意的是,实际操作中梯子的阶高可能很小,看起来很像斜坡,需要放大看。

2 离散型随机变量的概率函数,概率分布和分布函数

在理解概率分布函数和概率密度函数之前,我们先来看看概率函数和概率分布是咋回事。

为什么我们花这么大的力气去研究这个概念。因为它实在太重要了,为什么呢?在这里,直接引用陈希孺老师在他所著的《概率论与数理统计》这本书中说的:

研究一个随机变量,不只是要看它能取哪些值,更重要的是它取各种值的概率如何!

这句是本文的核心内容,本文的所有概念,包括概率密度,概率分布,概率函数,都是在描述概率!

2.1 概率函数和概率分布

2.1.1 概率函数

概率函数,就是用函数的形式来表达概率。

pi=P(X=ai)(i=1,2,3,4,5,6)

在这个函数里,自变量(X)是随机变量的取值,因变量(pi)是取值的概率。它就代表了每个取值的概率,所以顺理成章的它就叫做了X的概率函数。从公式上来看,概率函数一次只能表示一个取值的概率。比如P(X=1)=1/6,这代表用概率函数的形式来表示,当随机变量取值为1的概率为1/6,一次只能代表一个随机变量的取值。

2.1.1 概率分布

接下来讲概率分布,顾名思义就是概率的分布,这个概率分布还是讲概率的。我认为在理解这个概念时,关键不在于“概率”两个字,而在于“分布”这两个字。为了理解“分布”这个词,我们来看一张图。

                                                                 离散型随机变量的值和概率的分布列表

在很多教材中,这样的列表都被叫做离散型随机变量的“概率分布”。其实严格来说,它应该叫“离散型随机变量的值分布和值的概率分布列表”,这个名字虽然比“概率分布”长了点,但是肯定好理解了很多。因为这个列表,上面是值,下面是这个取值相应取到的概率,而且这个列表把所有可能出现的情况全部都列出来了!

举个例子吧,一颗6面的骰子,有1,2,3,4,5,6这6个取值,每个取值取到的概率都为1/6。那么你说这个列表是不是这个骰子取值的”概率分布“?

长得挺像的,上面是取值,下面是概率,这应该就是骰子取值的“概率分布”了吧!大错特错!少了一个最重要的条件!对于一颗骰子的取值来说,它列出的不是全部的取值,把6漏掉了!

2.2 分布函数

说完概率分布,就该说说分布函数了。这个分布函数是个简化版的东西!全名应该叫概率分布函数

看看下图中的分布律,这里的分布律明明就是我们刚刚讲的“概率函数”,完全就是一个东西。但是我知道很多教材就是叫分布律的。

                                                                概率分布函数就是把概率函数累加

我们来看看图上的公式,其中的F(x)就代表概率分布函数啦。这个符号的右边是一个长的很像概率函数的公式,但是其中的等号变成了小于等于号的公式。你再往右看看,这是一个一个的概率函数的累加!

发现概率分布函数的秘密了吗?它其实根本不是个新事物,它就是概率函数取值的累加结果!所以它又叫累积概率函数!

概率函数和概率分布函数就像是一个硬币的两面,它们都只是描述概率的不同手段!


3 连续型随机变量的概率函数和分布函数

连续型随机变量的“概率函数”换了一个名字,叫做“概率密度函数”。

为啥要这么叫呢?我们还是借用大师的话来告诉你,在陈希孺老师所著的《概率论与数理统计》这本书中,

如果这么解析你还是不太懂的话,看看下面的这个公式:

概率密度函数用数学公式表示就是一个定积分的函数,定积分在数学中是用来求面积的,而在这里,你就把概率表示为面积即可!

左边是F(x)连续型随机变量分布函数画出的图形,右边是f(x)连续型随机变量的概率密度函数画出的图像,它们之间的关系就是,概率密度函数是分布函数的导函数

两张图一对比,你就会发现,如果用右图中的面积来表示概率,利用图形就能很清楚的看出,哪些取值的概率更大!所以,我们在表示连续型随机变量的概率时,用f(x)概率密度函数来表示,是非常好的!

但是,可能读者会有这样的问题:

Q:概率密度函数在某一点的值有什么意义?

A:比较容易理解的意义,某点的 概率密度函数 即为 概率在该点的变化率(或导数)。很容易误以为 该点概率密度值 为 概率值.

比如: 距离(概率)和速度(概率密度)的关系.

  • 某一点的速度, 不能以为是某一点的距离
  • 没意义,因为距离是从XX到XX的概念
  • 所以, 概率也需要有个区间.
  • 这个区间可以是x的邻域(可以无限趋近于0)。对x邻域内的f(x)进行积分,可以求得这个邻域的面积,就代表了这个邻域所代表这个事件发生的概率。

4 参考文献

【1】https://www.jianshu.com/p/b570b1ba92bb

【2】https://www.zhihu.com/question/23237834

 


 

 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何简单理解概率分布函数和概率密度函数? 的相关文章

随机推荐

  • 一文玩转pytorch转onnx-tensorRT ——(A)onnx转tensorRT

    说明 onnx和tensorRT是分开的 onnx像是prototxt和weight的打包在一起的东西 所以由onnx转到tensorRT下 还需要让onnx能搜索到 或parsing 所对应的层 caffeparsing有注册自定义层的函
  • C# 中的依赖注入模式

    依赖注入模式 DI 首先 依赖注入模式 是一种软件设计模式 它被称为 模式 因为它建议针对特定问题的低级特定实现 该模式旨在解决的主要问题是如何创建 松散耦合 的组件 它通过将组件的创建与其依赖项分开来实现这一点 此模式中有四个主要角色 类
  • Bitbucket入门手册

    老大要我去调研一下有什么好用的免费软件版本管理工具 有利于小团队开发的 我第一个想到的就是git 经常在git下东西 听说它的代码仓库好用 于是就注册了一个github的账号 创建仓库的时候才发现只能创建开源项目 私有仓库要收费 于是就在网
  • pyglet 绝对路径 相对路径

    加载绝对路径 加载 3D 模型文件 model path path to model obj model pyglet resource file model path import pyglet window pyglet window
  • 复现BART finetune历程

    复现BART finetune历程 准备 安装fairseq 使用fairseq官方提供的finetune代码 git clone https github com pytorch fairseq cd fairseq pip instal
  • 【科研论文】找到中文论文的英文引用格式

    引用 1 梁秀英 周风燃 陈欢 梁博 许锡晨 杨万能 基于运动恢复结构的玉米植株三维重建与性状提取 J 农业机械学报 2020 51 6 209 219 1 找到对应的期刊 基于运动恢复结构的玉米植株三维重建与性状提取 中国知网 2 打开期
  • 数据库设计的三大范式(举例详解)

    为了建立冗余较小 结构合理的数据库 设计数据库时必须遵循一定的规则 在关系型数据库中这种规则就被称为范式 范式是符合某一种设计要求的总结 因此要设计一个结构合理的关系型数据库 就必须要满足下面这三大范式 1NF 不可再分 1NF要求数据库的
  • 2023-2024 计算机信息安全专业毕设题目推荐

    0 简介 毕业季马上就要开始了 不少同学询问学长网安专业选题以及开题相关的问题 今天跟大家分享信息安全毕设选题 最新的信息安全 网络安全 专业毕设选题 难度适中 适合作为毕业设计 大家参考 学长整理的题目标准 相对容易 工作量达标 题目新颖
  • poi 合并单元格添加边框_如何在Excel中的文本和单元格边框之间添加空间

    poi 合并单元格添加边框 Adding a bit of extra padding to your cell boundaries can make it easier for you to read through data in a
  • 学习笔记-Matlab三维绘图

    三维绘图 plot3 x y z t 0 0 05 15 x exp 0 05 t cos 2 t y exp 0 05 t sin 2 t z t figure plot3 x y z xlabel x meters ylabel y m
  • Unity Shader数学基础——矩阵

    矩阵的定义 由m n个数a 排成的m行n列的数表称为m行n列的矩阵 简称m n矩阵 记作 这m n个数称为矩阵A的元素 简称为元 数a位于矩阵A的第i行第j列 称为矩阵A的 i j 元 以数a为 i j 元的矩阵可记为 a 或 a m n
  • Datawhale 零基础入门CV赛事-Task03 利用卷积神经网络建立字符识别模型

    在前面的章节 讲解了赛题的背景知识和赛题数据的读取 本章开始构建一个字符识别模型 基于对赛题理解本章将构建一个定长多字符分类模型 3 1 卷积神经网络 CNN介绍 卷积神经网络 Convolutional Neural Network CN
  • 使用socket多线程多客户端传输信号

    一 需求 需要将一个c 可执行文件中的两个信号实时传送给两个不同的C 可执行文件 服务端 include
  • IEEE 802.11标准协议下载

    IEEE协会对外免费提供各版本的802 11标准协议 笔者下载了最新发布的版本 2016 给各位大佬附上传送门 授人予鱼不如授人予渔 下面介绍获取标准协议的方法 访问IEEE Xplore Digital Library官网 点击搜索802
  • SpringBoot部署的两种方式 - jar方式 和 war 方式

    SpringBoot 和我们之前学习的 web 应用程序不一样 其本质上是一个 Java 应用程序 那么又如何部署呢 通常来说 SpringBoot 部署会采用两种方式 全部打包成一个 jar 包 或者打包成一个 war 包 测试运行情况的
  • 通信 / 网络地址转换(NAT)过程

    一 英文全称 Network Address Translation 二 诞生原因 解决因为可用 IP 过少导致有些设备无法连入网络的问题 该技术的核心思想是多个私有网络 ip 通过一个公共 ip 连入网络 三 过程说明 为了实现上述思想
  • js实现多选,全选,反选的功能

    需求 在前端页面实现一个多选的模块 我们可以全选 不选 多选 反选 思路 需要按钮或者是多选框 最主要的是什么 能获取到四个等待选择的对象 足球 篮球这些 还有一个 被选中的状态是什么 没有被选中的状态又是什么 通过查阅手册 第三项 che
  • 没有网关可以互相通信_网络知识,分分钟通俗了解网关、DNS、子网掩码、MAC地址、DHCP...

    弱电智能化工程2018 什么是网关 DNS 子网掩码 它有什么作用 确实 我们平时在网络中总是在不断的提到网关 却很少真正的去了解它 一 什么是网关 1 什么是网关 网关是一种充当转换重任的计算机系统或设备 在使用不同的通信协议 数据格式或
  • 电学基本概念

    电压 电流 电阻 功率 交流 直流 电压 电流 电阻功率之间关系
  • 如何简单理解概率分布函数和概率密度函数?

    本篇文章是在 应该如何理解概率分布函数和概率密度函数 的基础上整理来的 非常感谢原作者 目录 1 先从离散型随机变量和连续性随机变量说起 2 离散型随机变量的概率函数 概率分布和分布函数 2 1 概率函数和概率分布 2 1 1 概率函数 2