加权回归估计_比率估计与回归估计

2023-11-17

本章讨论简单随机抽样和分层随机抽样下比率估计和回归估 计的构造及性质。要求:

①掌握总体比率、比率估计量及回归估计量的概念。

②了解比率估计量、回归估计量的偏倚、方差及方差的估计量。

③掌握应用比率估计量及回归估计量的条件。

抽样调查从本质上看是利用不完整的并且带有随机干扰的信息 给出总体目标量的估计。在实际问题中,我们在抽样调查之前对总 体及调查单位往往不是一无所知的,而是事先掌握某些可以利用的 总体辅助信息。这些辅助信息对提高估计精度有积极作用,如不充分利用必将造成信息资源的浪费。基于这种考虑利用已知的辅助变量信息构造比率估计量就可使估计精度加以改进。

前两章讨论了只涉及一个调查变量的总体指标(总体目标量)的估计问题,但在许多实际问题中常常会涉及到两个调查变量(指标)Y和X。除了要对

进行估计外,还常常要估计两个变量的总体总值或总体均值之比,称为总体比率。

定义:总体比率指两个变量的总体总值或总体均值之比,令R为总体比率,则R

需要应用比率估计的情况

(1) 利用双变量样本对总体比率进行估计需应用比率估计量,此时两个变量均为调查变量。

(2) 一个变量为调查变量,另一个变量表现为与调查变量有密切关系的辅助变量,在对调查变量总体总值、总体均值等目标量进行估计时,利用已知的辅助变量信息构造比率估计量可以改进估计的精度。

一、比率估计量

定义: (总体比率R的比率估计)在简单随机抽样下,若分别以y, x表示样本总值,以

表示样本均值,以
表示样本比率,则

称为R的比率估计。

定义:(总体均值、总体总值的比率估计)在简单随机抽样下,若X是与Y高度相关的辅助变量,且总体均值

或总体总值X已知,则

分别称为总体均值

、总体总值
的比率估计量。

复杂估计量与简单估计量的比较

前两章所讨论的估计量都是只使用调查变量样本信息的线性估计量,称为简单估计量

比率估计量除了使用调查变量样本信息外,还要使用辅助变量总体信息与样本信息,而且是非线性估计量。这类估计量称为复杂估计量

由于比率估计量使用的信息比简单估计量多,因而有可能比简单估计量有更高的精度。

二、比率估计量的偏差与方差

比率估计量的偏差

比率估计量是有偏估计量,样本量比较大时,

,
分别为
的近似无偏估计量。

比率估计量的方差

结论

比率估计量的方差主要取决于

之间的差异,当差异很小时,估计量方差将很小。换言之,比率估计量将有很高的精度。这告诉我们,只有当两个变量大致成正比例关系时,应用比率估计量才能使估计精度有较大改进。

三、比率估计量方差的估计与置信区间

比率估计量方差的估计

比率估计量的置信区间

对于一般的n,比率估计量呈右偏分布。但当n>30,

,
,可以用正态分布构造置信区间。
R的置信区间为

其中

是标准正态分布的上α/2上侧分位点,0<α<1。类似可得
Y的置信区间

解:要估计的是总体比率R

即该地区人均每天食品支出7.33元, 区间估计为[6.28, 8.38]元。

四、比率估计量优于简单估计量的条件

比率估计量

的方差为

简单估计量

的方差为

两者比较可知,

的条件是
,即

结论

并非任何情况下比率估计量都优于简单估计量,只有当调查变量与辅助变量有较高的正相关性时,比率估计量才能使估计精度有较大提高。若

,则
>0.5时比率估计量就比简单估计量精度高。

五、多元比率估计

对于调查变量Y,若有p个具有正相关性的辅助变量

,则可构造多元比率估计。

的基于第k个辅助变量的比率估计,则
的多元比率估计量为

其中

是相应变量的样本总值,
是辅助变量总体均值,
是适当选取的权,满足

例2:为精确地估计某地区皮棉总产量,在该地区301个村庄中简单随机抽取18个村庄,在调查皮棉产量

的同时记录了皮棉种植面积
和良种比例

该地区皮棉种植总面积为

=7450公顷,采用良种的平均比例为
=40.10%。对调查数据经过计算得如下结果:
=13.7987,
=24.43899,
=38.4444,
=35.4858,
=74.6789187,
=174.9671,
=42.26167,
=46.5118。 现以种植面积和良种比例为辅助变量对皮棉产量进行比率估计。

解:先考虑一元比率估计,即只以种植面积或只以良种比例为辅助变量。得:

再考虑二元比率估计。

由此可见,二元比率估计比两个一元比率估计精度都高,这是由于它 使用了更多的正相关性辅助信息的缘故。

六、乘积估计

当辅助变量X与调查变量Y呈负相关关系时,不能应用比率估计而应改用乘积估计,

乘积估计优于简单估计的条件是

此时,

一、定义

当调查变量与辅助变量有大致正比例关系时,可采用比率估计量来估计

(或Y )当
的回归直线不通过原点时,
不成正比例关系比率估计不能使用,应改用回归估计。

定义:在简单随机抽样下,总体均值

和总体总值Y的回归估计量定义为

其中

分别为调查变量、辅助变量的样本均值,
是辅助变量的总体均值,β称为回归系数。

具有线性回归关系

时,可得

的经验回归值为:

其中b是回归系数β的估计量.回归值的均值为:

因此用

估计
就是用
的回归值的均值对
进行估计。

回归估计与简单估计、比率估计的关系

(1) 当β=0时,

=
,即为简单估计量;

(2)当β=

时,
,即为比率估计量。

结论:简单估计量和比率估计量可视为回归估计量的特例。

二、β为设定常数情形

是设定常数,取
则回归估计量

回归估计

的性质

(1)

的无偏估计;

(2)

的方差为

(3)

的一个无偏估计是:

如何设定

的值

取值不同会影响
的方差。

的方差公式中

是关于

的非负二次函数,故
时,
达到最小值,且最小值为

B称为有限总体回归系数

三、β取样本回归系数情形

若β需根据样本确定,一个合理的选择是取β为样本回归系数

此时

的回归估计量

为一复杂估计量,不再具有无偏性。

回归估计

的性质

(1)当n充分大时,

(2)

的方差为

(3)

的方差的近似估计为

四、回归估计与比率估计及简单估计的大样本比较

回归估计与简单估计比较

当样本量n大时,回归估计

的近似方差为

简单估计

的方差为

由于0≤ρ≤1,因此对于大的样本量n,总有

,就是说在大样本下回归估计总是优于简单估计,仅在
时两者效果相同。

回归估计与比率估计比较

当样本量n大时,回归估计

的方差为

比率估计

的方差为

的充分必要条件为

因此对于大的样本量n,总有

,就是说在大样本下回归估计总是优于比率估计,仅在y关于x的总体回归系数B等于总体比率R时,两者效果相同。

例1:某地区有规模以下工业企业127个,共有固定资产价值6794.5万元,从中随机抽取20个企业调查工业产值及固定资产价值,资料如下表所示。试估计该地区规模以下工业总产值及其抽样标准误。

解:(1)由调查资料直观可以看出,工业产值

与固定资产价值
有线性相关关系,故可采用回归估计量对工业产值进行估计。

故该地区规模以下工业总产值的回归估计为

其抽样标准误的估计为

(2)若采用简单估计,则规模以下工业总产值的估计为

(3)若采用比率估计,则规模以下工业总产值的估计为

可见回归估计的精度比简单估计和比率估计都高

一、分别比率估计与联合比率估计

构造分层比率估计时有两种可行方法:

(1) 对每层样本构造比率估计,然后通过加权或求和给出总体均值或总值的估计量,称为分别比率估计量;

(2) 对两个指标的总体均值分别求出分层估计,然后用它们构造比率估计,称为联合比率估计量

分别比率估计

定义:

是第h层的样本均值,
分别为第h层调查指标均值
及总值
的比率估计,
分别是第h层辅助指标均值和总值,则
及Y 的分别比率估计量分别为:

性质:

(1)近似无偏性:当每层样本量

都比较大时,
都是近似无偏估计,从而
也是近似无偏估计。

(2)估计量的方差

其中

是第h层抽样比,
分别为总体第h层方差、相关系数及比率。

联合比率估计

定义:利用分层随机样本首先给出两个变量总体均值

的分层样本估计量,即

然后求联合比率

,再给出总体目标量的估计量。即

性质:

(1) 近似无偏性:当总样本量n比较大时,

是近似无偏估计。

(2)估计量的方差

其中R为总体比率。

二、分别回归估计与联合回归估计

分别回归估计

定义:在分层随机抽样下,总体均值

及总体总值Y的分别回归估计量为:

性质:

(1) 无偏性:当各层回归系数

取设定值时,
是无偏估计;当各层回归系数需由样本估计时,
是近似无偏估计。

(2)估计量的方差

取设定值时,

取估计值时,

联合回归估计

性质:

(1) 当回归系数β事先设定时,

分别为总体均值
与总体总值Y的无偏估计,且
的方 差为

(2)当回归系数β需由样本估计时,取为

此时,

是总体均值Y的有偏估计,其近似方差为

三、各种估计量的比较

分别比率估计和分别回归估计必须使用总体各层的辅助变量均值或总

值的信息,而联合比率估计和联合回归估计不要求使用总体各层的辅助变

量信息,只要求使用总体的辅助变量均值或总值的信息,分别估计量比联

合估计量对总体信息的使用更详细一些。

结论:

(1) 当各层样本量都比较大时,分别比率估计精度比联合比率估计高,分

别回归估计精度比联合回归估计高;

(2) 当各层样本量较小时,分别比率估计、分别回归估计将有较大偏差,

从而均方误差比较大。此时如果总样本量比较大,则采用联合比率估计、

联合回归估计更好一些。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

加权回归估计_比率估计与回归估计 的相关文章

  • Springboot实现热部署

    所谓的热部署 比如项目的热部署 就是在应用程序在不停止的情况下 实现新的部署 而Springboot在我们每次修改完代码之后 可能只是修改下打印的信息 就得重新启动App类 这样太浪费时间 有没有一种修改完代码让程序自动重启的方法呢 答案是
  • DirectShow中的工具GraphEdit使用小结

    一 安装完Windows SDK 7 0或7 1后 在C Program Files Microsoft SDKs Windows v7 0 Bin下有32位的graphedt exe 及x64目录下有64位版本的graphedt exe
  • Python—PEP8规范

    Python PEP8规范 介绍 代码布局 模块导入顺序 空格 注释 注释块 命名风格 应避免的名字 模块名 类名 异常名 全局变量名 函数名 方法名和实例变量名 设计建议 Python思维导图 app siweidaotu com R06
  • MySql如何获取表头字段?实用技巧

    show columns from 表名
  • Tomcat源码分析之getParameter(String)与getQueryString()

    本文有些地方的描述对某些人来说可能比较罗嗦 如果想直接进入正题 可阅读 源码分析 节 但本文是自己一步步分析解决问题思路的记录 虽然有些地方的思考还不是很深入 主要是由于时间不是很充裕 虽然花了三天时间 但感觉还是不够 我会在后续的博文中
  • OpenZeppelin集成Truffle编写健壮安全的合约

    原文 http truffleframework com tutorials robust smart contracts with openzeppelin 因为智能合约往往涉及金钱 保证Soldity代码没有错误 以及足够的安全是非常根
  • RTP/RTCP/RTSP负载H264的一些问题小结

    以下内容都是基于rfc3984 RTP负载H264时的参数配置 1 在TCP传输时 Transport头中的interleaved参数必须设置 比如0 1 或者2 3 海康的流中出现了4 但是没有配置 所以wireshark也无法解析cha
  • Maven实战(五)使用maven开发的项目,如何更方便地提取第三方包

    如果你的项目使用maven构建的话 当项目要上线 部署到服务器上去的时候或许会碰见这样的问题 问题就是 服务器上没有maven的环境 也就是说 项目所依赖到的那些仓库 repository 中的jar包你需要单独提取出来上传到服务器中去 解
  • 软件测试题答案

    搜索答案的一个方法 点Ctrl F 在页面上查找 输入题目上的部分字 软件测试题及答案 1 单选题 通常 是在编码阶段进行的测试 它是整个测试工作的基础 A 系统测试 B 确认测试 C 集成测试 D 单元测试 正确答案 D 2 单选题 如果
  • 华三ap设置无线服务器,H3C无线控制器V5版本配置AP上线的方法

    H3C无线控制器上没有开启自动上线 需要先手动在控制器上输入AP信息 然后新建vlan 新建vlan接口 新建wlan ess接口 新建无线服务 然后在AP上配置射频参数 交换机上需要开启DHCP 为手机终端分配IP地址 并且交换机上与AP
  • vscode相关问题处理

    1 跳转缓慢 跳转函数 一直转圈圈 比较慢 关闭vscode 删除索引文件 cd config Code User workspaceStorage rm rf 2 重新打开vscode即可 2 波浪线报错 在确认c cpp propert
  • RocketMQ-高级原理

    本节讲解下当MQ消息消费失败 或者发送不成功时如何处理消息 消息发送不成功一般存在于几种情况 网络原因 服务宕机 或者broker配置 消息发送失败 如果是由于broker配置原因 可以通过报错提示排查原因 无法查到路由信息 一般考虑到ro
  • MATLAB算法实战应用案例精讲-【时序模型】循环神经网络-GRU(附MATLAB和Python代码)

    目录 前言 几个高频面试题 1 GRU与LSTM的区别与联系 2 LSTM和RNN的区别 GRU的引入 算法原理
  • 浅析TVSPK稳压二极管,谁能更胜一筹?

    1 符号封装 稳压二极管和TVS管的电路符号和稳压二极管基本相同 封装也差不多 有时候在外观甚至很难分别出来到底哪个是哪个 2 电路接法 稳压二极管和TVS管在电路都是反向接入 也就是利用它的反向特性 利用PN结雪崩效应 在反向击穿前均有一
  • Python3爬虫学习——requests库笔记

    Python3爬虫学习 requests库笔记 前言 本笔记用于记录整理requests库的一些基本知识 内容会根据博主自己的认知作增添或压缩 其实自己看了下之前写的urllib库笔记 觉得那么写万字长文并不妥当 没有起到快速查阅的笔记作用
  • Nginx下载大文件失败

    原因分析 nginx代理nginx时 前端用户请求下载文件 nginx代理会先从后端nginx拿到文件并缓存到本地 然后响应给客户端 其中与proxy buffer相关的配置项如下 proxy buffer size 512k proxy
  • Socket_Tcp加密文件传输系统

    代码下载链接 Socket Tcp 原文链接 https blog csdn net weixin 45746588 article details 107683901 这是一个课程的作业 我是初学者 所以写完这个代码还是花了我好几周的时间
  • JDK8新增锁StampedLock详解

    1 StampedLock是做什么的 它是ReentrantReadWriteLock 的增强版 是为了解决ReentrantReadWriteLock的一些不足 2 ReentrantReadWriteLock有什么不足之处呢 我们都知道
  • extjs打开页面光标自动定位

    网上查了好久 也知道使用focus 当时不知道在哪里使用 调试到最后发现要在view show 之后 具体代码如下 function resp var view createFormWindow 新增 smpsupplyContractMa

随机推荐

  • 推荐几本Linux相关的好书

    应用层开发的 可以看看 Linux Application Development Advanced Linux Programming 第二本废人同学曾经翻译过 译稿可从这里获取 另外Linux和Unix渊源极深 因此 应用层开发也可以看
  • Visual Studio 2022 安装

    1 官网下载 打开浏览器 输入微软官网https visualstudio microsoft com zh hans downloads 下载社区版安装 2 安装社区版 3 安装时组件选择通用Windows10开发平台C 选项
  • python实现抢劵_手把手教你用python抢京东大额神券

    一 背景介绍 我们经常能看到京东上有满200减100之类的大额神券 但是当自己激动的等在电脑旁 手拿鼠标 眼盯屏幕 等着倒计时慢慢临近 期待抢到自己喜爱的优惠券 然而最终得到的往往是 券已抢完 为了弥补手速的缺憾 今天我教大家如何用pyth
  • CentOS 8: yum 设置为阿里源

    1 将源文件备份 cd etc yum repos d mkdir backup mv repo backup 2 下载阿里源文件 curl o etc yum repos d CentOS Base repo http mirrors a
  • [Qt学习笔记]Qt动态切换控件样式属性方法

    目录 1 介绍 2 实现过程 3 效果展示 1 介绍 在编程过程中我们一般使用setStyleSheet 函数来设置控件的样式属性 包括颜色 边框 透明度等属性 如果不同的控件和样式直接在代码中设置 会造成无法统一管理的缺点 反复书写样式属
  • C语言怎么用char输出多个字母,c语言输入一个字符串怎么间隔输出

    Q1 c语言中 如何利用指针对字符串每隔几个输出一个 隔三个 输出一个 也就是每四个输出一个 char s abcdefgh char p s int i 0 for p s p p i if i 4 0 putchar p Q2 c语言
  • 等额本息贷款每月还款金额推导过程

    假设贷款总额是A 而每月利息是b 总共360期 目标是计算每个月应该给银多少钱 推导过程如下 设每个月还银行的本金为 m n 1 n
  • Pattern.compile的flag参数

    Pattern compile函数 Pattern Pattern compile String regex int flag regex为正则表达式 flag的取值范围如下 Pattern CANON EQ 当且仅当两个字符的 正规分解
  • (总结许多容易犯的错误)Ubuntu14.04+cuda8.0+gtx1080+cudnn5.1配置教程

    需要注意 不能按照网上大多数cuda8 0 gtx1080的方法来做 因为他们这些方法都忽略了一个重要的问题 NVIDIA官方的版本更新会影响兼容性导致Ubuntu系统无法进入登录界面 例如 cuda 8 0 27 linux版本对应NVI
  • 数组解构赋值与扩展运算符...

    解构 let a b c 1 3 5 扩展运算符
  • 「从0到1搭建自己的UI组件库」-- button组件

    写在前面 我是 沸羊羊 昵称来自于姓名的缩写 fyy 之前呕心沥血经营的博客因手残意外注销 现经营此账号 本人是个小菜 正向着全栈工程师的方向努力着 文章可能并不高产 也很基础 但每写一篇都在用心总结 请大佬勿喷 如果您对编程有兴趣 请关注
  • vue3封装简易的vue-echarts

    项目场景 数据可视化开发 采用的技术栈是vue3 echarts router 问题描述 在vue2中 才开始开发数据可视化大屏 都是用echarts 之后改用为vue echarts组件 但是到了vue3之后 组件会有一些小问题 所以准备
  • 如何强制解锁或删除被占用的文件或文件夹 - ForceDelete绿色强制文件删除工具

    你可能时常遇到无法删除Windows上的文件和文件夹的情况 并且会收到 无法删除文件 访问被拒绝 或 该文件已被其他程序打开 诸如此类的错误消息 这意味着这些文件和文件夹在Windows中被锁定 无法以常规方式删除 你可以试试ForceDe
  • 计算机如何根据人脸估计年龄,人脸图像算法研究(1)

    今天给大家带来一篇 人脸识别中的年龄估计技术 年龄特征作为人类的一种重要生物特征 计算机要如何基于人脸图像估计年龄呢 概述 简单地说 基于人脸图像的年龄估计是指机器根据面部图像推测出人的大概年龄或所属的年龄范围 年龄段 基于人脸图像的年龄估
  • 4.4.5 密码验证(2)

    4 当且仅当含数字和字母的密码验证 如果密码当且仅当包含数字和字母 那么该密码的强度是中等强度 当然 它的安全性一般 以下正则表达式能够验证当且仅当包含数字和字母的密码 da zA Z d a zA Z da zA Z 74 正则表达式 7
  • C++ 的四种类型转换

    背景 C语言中强制类型转换可以随意转换我们想要的类型 格式如下 类型 变量名 那么为什么C 还要引入新的4种类型转换呢 1 新的类型转换控制符可以很好的控制类型转换的过程 允许控制各种类型不同的转换 2 C 的类型转换控制服能告诉程序员或读
  • 【毕业设计】Python_学生校园消费行为

    资源下载 https download csdn net download wouderw 87357462 1 分析学校校园消费行为的目的 分析学生的消费行为和食堂的运营状况 为食堂运营提供建议 构建学生消费细分模型 为学校判定学生的经济
  • VT是什么?怎么打开教程

    装过虚拟机的朋友都知道 要想虚拟出cpu 就必须电脑打开VT VT指的是CPU的虚拟化技术 有了它就可以单CPU模拟多CPU并行 这样才可以虚拟出电脑出来 而如果你的bios没有打开VT的话 是不能创建虚拟机的 下面就教大家怎么打开VT 1
  • 华为员工自曝,工作四年,每天都哭想裸辞!

    架构师大咖 架构师大咖 打造有价值的架构师交流平台 分享架构师干货 教程 课程 资讯 架构师大咖 每日推送 公众号 该公众号已被封禁 进入华为是一项令人向往的机会 但它并不适合每个人 许多人都希望能够进入这家公司 但实际上 它要求员工具备卓
  • 加权回归估计_比率估计与回归估计

    本章讨论简单随机抽样和分层随机抽样下比率估计和回归估 计的构造及性质 要求 掌握总体比率 比率估计量及回归估计量的概念 了解比率估计量 回归估计量的偏倚 方差及方差的估计量 掌握应用比率估计量及回归估计量的条件 抽样调查从本质上看是利用不完