标准差之间/之内

2023-11-27

在处理分层/多级/面板数据集时，采用返回可用变量的组内和组间标准差的包可能非常有用。

这是带有以下数据的东西Stata可以通过命令轻松完成

xtsum, i(momid)

我进行了研究，但找不到任何R包可以做到这一点..

edit:

只是为了修正想法，分层数据集的一个示例可能是这样的：

son_id       mom_id      hispanic     mom_smoke     son_birthweigth

  1            1            1            1              3950
  2            1            1            0              3890
  3            1            1            0              3990
  1            2            0            1              4200
  2            2            0            1              4120
  1            3            0            0              2975
  2            3            0            1              2980

“多级”结构是由每个母亲（较高级别）有两个或更多儿子（较低级别）这一事实决定的。因此，每个母亲都会定义一组观察结果。

因此，每个数据集变量可以在母亲之间和母亲内部变化，或者仅在母亲之间变化。birtweigth母亲之间的差异不同，同一母亲内部的差异也不同。反而，hispanic是为同一个母亲固定的。

例如，母亲内方差为son_birthweigth is:

# mom1 means
    bwt_mean1 <- (3950+3890+3990)/3
    bwt_mean2 <- (4200+4120)/2
    bwt_mean3 <- (2975+2980)/2

# Within-mother variance for birthweigth
    ((3950-bwt_mean1)^2 + (3890-bwt_mean1)^2 + (3990-bwt_mean1)^2 + 
    (4200-bwt_mean2)^2 + (4120-bwt_mean2)^2 + 
    (2975-bwt_mean3)^2 + (2980-bwt_mean3)^2)/(7-1)

而母亲之间的方差为：

# overall mean of birthweigth:
# mean <- sum(data$son_birthweigth)/length(data$son_birthweigth)
    mean <- (3950+3890+3990+4200+4120+2975+2980)/7

# within variance:
    ((bwt_mean1-mean)^2 + (bwt_mean2-mean)^2 + (bwt_mean3-mean)^2)/(3-1)

我不知道你的 stata 命令应该重现什么，但要回答问题的第二部分层次结构，很容易做到这一点list。例如，您定义如下结构：

tree = list(
      "var1" = list(
         "panel" = list(type ='p',mean = 1,sd=0)
         ,"cluster" = list(type = 'c',value = c(5,8,10)))
      ,"var2" = list(
          "panel" = list(type ='p',mean = 2,sd=0.5)
         ,"cluster" = list(type="c",value =c(1,2)))
)

要创建这个lapply使用列表很方便

tree <- lapply(list('var1','var2'),function(x){ 
  ll <- list(panel= list(type ='p',mean = rnorm(1),sd=0), ## I use symbol here not name
             cluster= list(type = 'c',value = rnorm(3)))  ## R prefer symbols
})
names(tree) <-c('var1','var2')

您可以使用以下命令查看结构str

str(tree)
List of 2
 $ var1:List of 2
  ..$ panel  :List of 3
  .. ..$ type: chr "p"
  .. ..$ mean: num 0.284
  .. ..$ sd  : num 0
  ..$ cluster:List of 2
  .. ..$ type : chr "c"
  .. ..$ value: num [1:3] 0.0722 -0.9413 0.6649
 $ var2:List of 2
  ..$ panel  :List of 3
  .. ..$ type: chr "p"
  .. ..$ mean: num -0.144
  .. ..$ sd  : num 0
  ..$ cluster:List of 2
  .. ..$ type : chr "c"
  .. ..$ value: num [1:3] -0.595 -1.795 -0.439

OP澄清后编辑

我认为那个包reshape2就是你想要的。我将在这里演示这一点。

这里的想法是为了进行多级分析，我们需要重塑数据。

首先将变量分为两组：标识符和测量变量。库（重塑2） dat.m

str(dat.m)
'data.frame':   21 obs. of  4 variables:
 $ son_id  : Factor w/ 3 levels "1","2","3": 1 2 3 1 2 1 2 1 2 3 ...
 $ mom_id  : Factor w/ 3 levels "1","2","3": 1 1 1 2 2 3 3 1 1 1 ...
 $ variable: Factor w/ 3 levels "hispanic","mom_smoke",..: 1 1 1 1 1 1 1 2 2 2 ...
 $ value   : num  1 1 1 0 0 0 0 1 0 0 ..

一旦您拥有“moten”形式的数据，您可以“强制转换”以将其重新排列为您想要的形状：

# mom1 means for all variable
 acast(dat.m,variable~mom_id,mean)
                           1    2      3
hispanic           1.0000000    0    0.0
mom_smoke          0.3333333    1    0.5
son_birthweigth 3943.3333333 4160 2977.5
# Within-mother variance for birthweigth

acast(dat.m,variable~mom_id,function(x) sum((x-mean(x))^2))
                           1    2    3
hispanic           0.0000000    0  0.0
mom_smoke          0.6666667    0  0.5
son_birthweigth 5066.6666667 3200 12.5

## overall mean of each variable
acast(dat.m,variable~.,mean)
[,1]
hispanic           0.4285714
mom_smoke          0.5714286
son_birthweigth 3729.2857143

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

hierarchicaldata

stata

multilevel

标准差之间/之内的相关文章

无法更改 RStudio 中的 R 版本

我的 RStudio V 0 99 491 无法更改 R 版本我以平常的方式行事Global Options gt R Version 然后它挂起并且不再工作或反应 R 运行良好的初始版本是R 3 1 0 我以前从未遇到过这样的问题也许
在 ifelse() 语句内部和外部运行一行时的不同输出

我正在尝试运行一个简单的命令但不知道为什么在内部和外部运行它时输出不同ifelse 功能函数条件评估为FALSE 所以输出应该完全相同但是单独运行时输出为0 0 1 1 0 1 0 1 NA 根据需要但是从ifelse 函数输
麦当劳 omega：R 中的警告

我正在计算几种不同尺度的欧米茄并在 R 中使用不同的 omega 函数获取不同比例的不同警告消息我的问题是如何解释这些警告以及报告检索到的 omega 统计数据是否安全当我使用从 alpha 到 omega 内部一致性估计普遍问题的
在 Shiny 中的用户会话之间共享反应数据集

我有一个相当大的反应数据集该数据集是通过轮询文件然后按预定义的时间间隔读取该文件而派生的数据更新频繁需要不断重新加载诚然重新加载可以增量完成并附加到 R 中的现有对象但事实并非如此然而目前尽管会话中的数据相同但此操作是针对
数据帧初始化 - 字符初始化读取为因素？

我正在尝试初始化这样的数据框因为我想要一个空数据框其中两个字符向量作为列 out frame lt data frame Hospital character State character 但是当我查看该数据框的每一列的类时它显示
R：大向量的高效迭代子集和过滤

我想更快地执行以下操作 Logic 我有一个向量big共 4 个元素1 2 3 4 我还有一个相同长度的阈值向量1 1 3 1 4 1 5 1 我希望每个元素找到第一个元素的索引next元素高于相应的阈值在这种情况下我的预期输出是 2
dplyr / left_join 中的嵌套管链

在尝试获取分组滞后变量的过程中仅使用这是不可能的 lag 建议的解决方案是将数据拉出滞后不同的行然后重新加入它我更喜欢在不创建中间对象的情况下执行此操作并且希望在链中间执行此操作然而它似乎没有像我预期的那样工作问题似乎是使用
R - 在浏览器中获取帮助而不是内置的 R 帮助程序

我见过 R help 的两种不同行为当你输入 density例如帮助已在您的默认浏览器中打开帮助在内置 R 帮助程序中打开 R 中的窗口我目前有第二种行为但我想在浏览器中打开帮助我可以轻松地在这两种行为之间切换吗无需重新安装
从网络源获取 R 中的数据作为数据框

我正在尝试使用 RCurl 包将一些空气污染背景数据作为 data frame 直接加载到 R 中该网站有 3 个下拉框用于在下载 csv 文件之前选择选项如下图所示我试图从下拉框中选择 3 个值并使用下载 CSV 按钮将数据作
如何生成向量的所有组合[重复]

这个问题在这里已经有答案了假设我有 3 个绿球 2 个橙球和 8 个黄球我想订购它们鉴于所有相同颜色的球都是相同的如何生成所有可能的序列在 R 中使用gregmisc 我可以 balls lt c orange orange g
R read_excel：libxls 错误：无法解析文件

我试图使用 readxl read excel 将 xls 文件读入 R 但它给出了以下错误 Error filepath data xls libxls error Unable to parse file 还尝试了 readxl exc
使用 ggplot2 修改点子集的形状

我正在尝试绘制一个沿大量维度变化的大型散点图这是我的起始情节 p lt ggplot mtcars aes wt mpg shape cyl colour gear size carb geom point 使用mtcars数据集我只是
dplyr，do()，从模型中提取参数而不丢失分组变量

R 帮助中关于 do 的示例略有不同 by cyl lt group by mtcars cyl models lt by cyl gt do mod lm mpg disp data coefficients lt models gt d
查找数据帧列表中同一列中的所有重复值并将其转换为 NULL

我有一个清单BELGIAN COAST list包含数百个数据帧 df1 df2 15 列 X 1000 行每个数据帧的最后一列称为Chemicals并包含一些字符例如Sulfate or Ammonia 但是这一列有很多行Chemic
如何获得属于五分位数的x？

我正在大学学习使用 R 进行计量经济学项目所以请原谅我的笨拙基本上使用并给出一个矩阵股票价格行天列公司股票价格另一个矩阵市值行天列公司市值我必须收集第三个矩阵每天观察的属于市值分布第一五分位数的股票价格然后
R.matlab/readMat：readTag(this) 中出错

我正在尝试使用 R matlab 将 matlab 文件读入 R 但遇到此错误 require R matlab r lt readMat file mat verbose T Trying to read MAT v5 file stre
从 R 中的 HTTPS 连接逐行读取

当创建连接时open r 它允许逐行读取这对于批量处理大数据流非常有用例如这个脚本 https gist github com jeroenooms d33a24958d99bb969ac0通过一次读取 100 行来解析相当大的 gzi
在另一个 Rmd 中运行选定的块

我已经在源 Rmd 文件中运行了分析并且希望仅使用few来自源的块我已经看到了一些关于从源 Rmd 中提取所有块的答案来自另一个 Rmd 中的 Rmd 文件的源代码 https stackoverflow com questions 4
R 编程：如何计算数据框中两个单元格之间的差异并将它们保存在新列中

尝试学习 R 并陷入自相关示例中我想将 x 的差异与 y 的差异进行回归我在数据框中有 x 和 y 并且希望将 x2 x1 的差值保存在新列例如 dx 中我不知道该怎么做我拥有的 data1 x y 5 3 8 9 3 1 1 5
将 sf voronoi 多边形裁剪到边界框时出错

我正在尝试将 voronoi polygons 使用 sf package 创建剪辑到边界框但它引发了我无法定义的错误我对 R 的空间世界不太有经验感谢所有帮助样本数据 stations lt structure list ST

随机推荐

UI Thread .Invoke() 导致句柄泄漏？

在什么情况下当使用委托和 InvokeRequired 例如 public delegate void DelegateUIUpdate private void UIUpdate if someControl InvokeRequire
避免 Chrome 中 HTTP 上的 NavigatorUserMediaError“仅允许安全来源”

我正在尝试使用适用于 SIP 电话的 JavaScript 库进行一些音频视频测试自 Chrome 47 起由于以下错误我无法再在本地开发中进行测试 NavigatorUserMediaError constraintName me
Linux 下是否存在 RDP 客户端库？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案 Linux 中是否有用于通过远程桌面协议 RDP 作为客户端进行连接的库使用的语言对于存在问题来说是次要的任何主流语言都可以例如 C Perl
c++03 libstdc++ 与 c++11 中的虚假副本

考虑这段代码 include
终端中无法找到 XML 模式名称空间的 Spring NamespaceHandler 错误

在终端上运行我的代码时它给出了此错误线程 main 中的异常java lang RuntimeException org springframework beans factory parsing BeanDefinitionParsi
通过列表理解将具有重复键的元组列表发送到字典？

我有一个包含重复项的元组列表我已经使用我在这里找到的代码将它们转换为字典 https stackoverflow com a 61201134 2415706 mylist a 1 a 2 b 3 result for i in myli
如何将 pandas 转换为 numy Nan？

我有以下数据集我想将 float 值转换为 int 所以我这样做了data convert dtypes 熊猫将 Nan 转换为 Na 我怎样才能让它回来或阻止熊猫这样做我使用数据插补有些算法不支持 bool object has n
Flask 调试在 Anaconda 下不起作用

我正在使用 Flask 的标准开发环境中工作但无法让调试正常工作仅使用标准的 Hello World 出现如下错误 from flask import Flask app Flask name app route def hello e
无法安装 APK [INSTALL_FAILED_DEXOPT] Android Studio

当尝试将应用程序部署到实际的 Android 设备进行调试时我已经尝试了几乎所有方法来尝试纠正此错误但无法解决问题每次我尝试启动时都会收到失败的 INSTALL FAILED DEXOPT 错误并且在检查 logcat 时总是因为我
Laravel 应用程序升级到 php 8 后停止工作

将我的 mac 更新到 php 8 laravel 应用程序停止工作后这是我收到的错误 Deprecated Method ReflectionParameter getClass is deprecated in Users Sites
Angular - 如何从指令访问和替换innerHTML

我正在尝试创建一个修改元素的指令innerHTML通过添加指向以以下开头的子字符串的链接 symbol 这是我到目前为止所尝试过的 linkify directive ts constructor private elementRef El
为什么添加内容后这个 div 会下移？

我有一个 5x5 网格当我向 div 添加内容时它会向下移动谁能解释为什么会发生这种情况代码笔示例风险矩阵您需要将其添加到vertical align top和margin top 3px r5 gt div r4 gt div
IE8 中的“Array.prototype.slice：‘this’不是 JavaScript 对象”错误

据我了解 IE8可以访问Array prototype slice方法然而当我尝试调用它来转动NodeList到一个数组中它给了我错误Array prototype slice this is not a JavaScript obje
从 C# 中的 DateTime 中提取日期部分[重复]

这个问题在这里已经有答案了代码行DateTime d DateTime Today 结果是10 12 2011 12 00 00 AM 我怎样才能只获取日期部分当我比较两个日期时我需要忽略时间部分 DateTime是一个数据类型用于
如何从 AJAX 调用的事件监听器获取用户 ID

我正在使用 symfony2 和 FOSUserBundle 通常我可以从控制器获取用户数据 user this gt get security context gt getToken gt getUser or user this gt
jQuery.parseJSON - Chrome 和 Safari 自动解析 JSON

以下函数导致响应变量在 Chrome 和 Safari 中为 null 但在 Firefox 中则不然 function updatePage response This argument differs by browser respon
在mysql中使用exclusive or

我有一个如下表表 foobar foo bar 1 1 1 0 0 1 0 0 我需要能够做类似的事情 select from foobar where foo 1 or bar 1 这将返回以下内容 foo bar 1 0 0 1 这意
C++读取二进制文件

我正在尝试将图像读入字符数组这是我的尝试 ifstream file htdocs image png ios in ios binary ios ate ifstream pos type fileSize char fileConte
如何使用 Xcode 6.0.1 添加 OS X Server 3.2.1 的证书

在我升级 Xcode 至 6 0 1 和 OS X Server 至 3 2 1 后我不知道如何为配置文件添加证书以便 Xcode 机器人可以找到它们我已通过将 mobileprovision 文件复制到成功添加了配置文件 Libra
标准差之间/之内

在处理分层多级面板数据集时采用返回可用变量的组内和组间标准差的包可能非常有用这是带有以下数据的东西Stata可以通过命令轻松完成 xtsum i momid 我进行了研究但找不到任何R包可以做到这一点 edit 只是为了修正想法

标准差之间/之内

OP澄清后编辑

标准差之间/之内 的相关文章

随机推荐

热门标签

标准差之间/之内的相关文章