根据原始数据创建队列退出率表

2024-02-26

我需要帮助根据原始数据创建队列退出表。

我有一个如下所示的数据集：

DT<-data.table(
id =c (1,2,3,4,5,6,7,8,9,10,
     11,12,13,14,15,16,17,18,19,20,
     21,22,23,24,25,26,27,28,29,30,31,32,33,34,35),
year =c (2014,2014,2014,2014,2014,2014,2014,2014,2014,2014,
       2015,2015,2015,2015,2015,2015,2015,2015,2015,2015,
   2016,2016,2016,2016,2016,2016,2016,2016,2016,2016,2016,2016,2016,2016,2016),
cohort =c(1,1,1,1,1,1,1,1,1,1,
        2,2,2,1,1,2,1,2,1,2,
        1,1,3,3,3,2,2,2,2,3,3,3,3,3,3))

我想按队列计算辍学率，并得到一个像这样的表：

cohortdt<-data.table(
cohort =c(1,2,3),
drop_rateY1 =c(.60,0.0,0.0),
droprate_Y2 =c (.50,.33,0.0))

对于第 1 组，第 1 年末的辍学率为 60%。（即 60% 最初入学的学生在第 1 年末退学。第 2 年的值意味着 50% 在第 1 年末留下的学生在第 2 年末退学。

如何从原始数据创建这样的表？

这是一种解决方案：

library(tidyverse)

DT %>% 
  group_by(year) %>% 
  count(cohort) %>% 
  ungroup() %>% 
  spread(year, n) %>% 
  mutate(year_1_drop_rate = 1 - (`2015` / `2014`),
         year_2_drop_rate = 1 - (`2016` / `2015`)) %>% 
  replace_na(list(year_1_drop_rate = 0.0,
                  year_2_drop_rate = 0.0)) %>% 
  select(cohort, year_1_drop_rate, year_2_drop_rate)

# A tibble: 3 x 3
  cohort year_1_drop_rate year_2_drop_rate
   <dbl>            <dbl>            <dbl>
1      1              0.6        0.5000000
2      2              0.0        0.3333333
3      3              0.0        0.0000000

group by year
count按年级分组
ungroup
spread列中的年份 2014、2015 和 2016
mutate两次以获得第一年和第二年的辍学率
replace_na to 0
select队列、year_1_drop_rate 和year_2_drop_rate

该解决方案需要一个tidy数据集并使其untidy通过分散年份变量（即 2014 年、2015 年和 2016 年是单独的列）。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

根据原始数据创建队列退出率表的相关文章

par(mfrow=c(1,2)) 不显示并排密度图[重复]

这个问题在这里已经有答案了 par mfrow c 1 2 plot 1 12 log y plot 1 2 xaxs i 然而当我尝试做并排密度图时图会单独输出 load the stud recs dataset library U
将循环转换为并行计算的函数

我正在使用 R 编程语言我遇到这个问题我试图找出两个 shapefile 之间的成对交集即第一个 shapefile 中的每个多边形与第二个 shapefile 中的所有多边形相交的百分比我想我找到了解决这个问题的基本方法 Load
如何在R中计算文本中的句子数？

我使用 R 将文本读入readChar 功能我的目的是测试文本句子中字母 a 出现次数与字母 b 出现次数一样多的假设我最近发现了 stringr 包它帮助我对文本做很多有用的事情例如计算字符数以及整个文本中每个字母出现的总数现在
R 中具有稳健回归的异常值

我正在使用lmrobR 中的函数使用robustbase用于稳健回归的库我会把它用作 rob reg lt lmrob y 0 dat method MM control a1 当我想返回我使用的摘要时summary rob reg 稳健
使用 broom 和 tidyverse 总结 r 平方游戏

我发布了一个问题here https stackoverflow com questions 48627287 getting adjusted r squared value for each line in a geom smooth
如何从 Fortran 调用 R 函数？

根据http gallery rcpp org articles r function from c http gallery rcpp org articles r function from c Rcpp 允许用户从 C 调用 R 函数
我无法下载 R 中的 reshape2 包 [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我在尝试安装 R 包时收到此响应 gt installed packages reshape2 Package LibPath V
在 R 中向散点图添加线条

如何向图表添加线条我做了以下 dat lt data frame xvar 1 20 rnorm 20 sd 10 yvar 1 20 rnorm 20 sd 10 zvar 1 20 rnorm 20 sd 10 plot dat 1
纵向序列数据的三次样条方法？

我有一个串行数据格式如下 time milk Animal ID 30 25 6 1 31 27 2 1 32 24 4 1 33 17 4 1 34 33 6 1 35 25 4 1 33 29 4 2 34 25 4 2 35 24
通过间接引用列来修改数据框中的某些值

我正在整理一些数据我们将失败的数据分类到垃圾箱中并按批次计算每个分类箱的有限产量我有一个描述排序箱的元表这些行按升序测试顺序排列一些排序标签带有非语法名称 sort tbl lt tibble tribble weight lab
将绘图调用拆分为多个块

我正在编写一个图的解释其中我基本上将在第一个块中创建图然后描述该输出并在第二个块中添加一个轴然而似乎每个块都会强制一个新的绘图环境因此当我们尝试使用以下命令运行块时会出现错误axis独自的观察 output html docu
pyomo + 网状错误 6 句柄无效

我正在尝试运行pyomo优化我收到错误消息 Error 6 The handle is invalid 不知道如何解释它环顾四周似乎与特权有关但我不太明白在下面找到完整的错误跟踪以及重现它的玩具示例完整的错误跟踪 py run f
R独特的列或行与NA无可比拟

有谁知道如果incomparables的论证unique or duplicated 曾经被实施过incomparables FALSE 也许我不明白它应该如何工作无论如何我正在寻找一个巧妙的解决方案以仅保留与另一列相同的唯一列或行
在 R 中创建虚拟变量，排除某些情况为 NA

我的数据看起来像这样 V1 V2 A 0 B 1 C 2 D 3 E 4 F 5 G 9 我想创建一个虚拟变量R where 0 1 1 2 3 4 and NA 0 5 9 应该很简单有人可以帮忙吗我们可以转换V2 into a fa
在 R 格子包中微调点图

我正在尝试为不同的数据集和不同的算法绘制一堆 ROC 区域我有三个变量方案指定所使用的算法数据集是正在测试算法的数据集以及 Area under ROC 我正在 R 中使用lattice库命令如下点图方案 Area und
使用 R 选择第一个非 NA 值

df lt data frame ID c 1 1 1 2 3 3 3 test c NA 5 5 6 4 NA 7 3 NA 10 9 我想创建一个名为 value 的变量它是每个单独 ID 测试的第一个非 NA 值对于只有NA的个体
R 中的列乘以子字符串

假设我有一个数据框其中包含多个组件及其在多个列中列出的属性并且我想对这些列运行多个函数我的方法是尝试将其基于每个列标题中的子字符串但我无法弄清楚如何做到这一点下面是数据框的示例 Basket F Type 1 F Qty 1 F
r 中训练和测试数据的最小最大缩放/归一化

我正在创建一个函数它将训练集和测试集作为其参数最小最大缩放标准化并返回训练集并使用这些same最小值和最小最大范围的值标准化并返回测试集到目前为止这是我想出的功能 min max scaling lt function tr
基于时间窗口的不规则时间序列的优化滚动函数

有没有办法使用 rollapply 来自zoo包或类似的东西优化功能 rollmean rollmedian等使用基于时间的窗口计算滚动函数而不是基于大量观察的函数我想要的很简单对于不规则时间序列中的每个元素我想计算一个具有 N
更改闪亮 R 中的默认浏览器

我在 RStudio 中使用 01 hello 虽然在 IE 中默认打开程序时它不会显示直方图但即使在 Chrome 中滑块也不起作用我无法滑动条形图并看到直方图中的变化如何更改 R 中的默认浏览器以便闪亮启动 Chrome 而不

随机推荐

SQL/SQL-LITE - 过滤后计算记录

假设我有一个客户表和一个销售订单表其架构如下客户 id 姓名销售订单 id customer id sales representer 具有以下定义 id 是两个表中的主键 customer id 是外键引用客户我想实现以下查询 F
Python 对 Windows 8 的支持 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
重用存储是否会开始新对象的生命周期？ [复制]

这个问题在这里已经有答案了 include
Rails：如何使用 before_save 更改基于另一个字段的字段值？

我试图根据另一个布尔字段的值将一个布尔字段设置为 false 我使用 ActiveRecord 模型尝试了以下操作 before save reconcile xvent def reconcile xvent self xvent hoo
网络错误：405 方法不允许 AngularJS REST

在 AngularJS 中我有以下功能运行良好 http get fruits json success scope handleLoaded 现在我想将其从文件更改为 url 使用一些可爱的 Laravel 4 返回 json htt
在 AngularJS 中，如何获取作为 URL 一部分的 ID？我正在使用 Restangular 与 REST API 进行通信

我正在使用 Restangular 进行后端调用只要 URL 提供如下所示的数据一切都会正常工作如果我打http mysite responses 回复看起来像 fname some guy lname some name dob 2
如何访问 boost::spirit::karma 中嵌套对象的数据？

In an ItemList包含列表Item对象我如何访问Item生成器中的对象以下示例代码在 VC9 上编译适当设置了 boost 包含和链接目录我不知道如何设置list generator item include
`y = x = x + 1;` 是未定义的行为吗？

这段代码是 y x x 1 C 中未定义的行为回答你的问题 No 会发生什么这将会发生 int x 1 ASSUME THIS IS SO y x x 1 Results y 2 x 2 它是如何编译的与以下相同 x 1 y x 为什么这
pch 上的 #import 是否会减慢编译时间？

我正在读这个post http qualitycoding org import order 关于进口我有一个问题默认情况下 prefix pch 文件中的 import 是否会减慢编译时间我应该删除它并仅在必要时导入吗 ifdef
在 NestJS 中使用与 GraphQL 中的输入和对象类型相同的类

我正在尝试设置我的 graphql resover 来处理对象数组但无法配置 Args 装饰器我创建了自己的 ArgsType import ArgsType Field Int ObjectType from nestjs graph
从 github 中删除文件

我已经在一个项目中使用 github 一段时间了但是仅作为问题跟踪器因此今晚我也花了一些时间来处理代码并犯了一个菜鸟错误我提交了凭证文件和其他不必要的数据我已将它们添加到 gitignore现在提交文件它们应该不再是问题但我
Docker：如何 Dockerize 并部署 LAMP 应用程序的多个实例

我需要部署同一 LAMP 或 LEMP 应用程序的多个实例每个实例都可以通过前端负载均衡器代理从子域访问每个实例必须有自己的数据库数据和文件数据每个实例都可能受到监视内存限制 CPU 可能会针对每个应用程序实例进行设置轻松自动部
从 Oracle 存储过程调用 os_command.exec

我用过os command exec向 Linux shell 发送命令我正在使用 Oracle 12c 这是一个运行良好的示例代码 select os command exec home smucha app smucha produc
Python 3 查找字符串中的最后一个数字

如何找到任何大字符串中的最后一个数字例如在以下字符串中我想要 47 作为输出 tr bgcolor aa77bb td gt font face verdana color white size 2 gt b gt Total b g
WPF Tabcontrol 获取最大选项卡的大小

我有一个绑定到 Viewmodel 集合的 TabControl 这些 Viewmodel 被转换为适当的值以绘制到选项卡中
CosmosDB 存储过程 - Promise 而不是回调

是否可以在 CosmosDB DocumentDB 存储过程 API 调用中使用 JavaScript Promise 而不是常规回调一种用法是实现分页例如 token getToken doSomething token functi
Flutter - iOS：命令 /bin/sh 失败，退出代码为 255

下午好我尝试在 iOS 上运行一个 Flutter 项目之前在 Android 上成功运行过但是我收到一个错误 x86 64 is not an allowed value for option ios arch Run flutt
Delphi 获取 EXE 的句柄

这是我现在正在做的一个例子 var Client String Handle Integer begin Client Window Name GetWindowThreadProcessId FindWindow nil PAnsiCha
从node.js消息调用Windows API

我是 Node 新手我有这个简单的 Node js 服务器可以在 Windows 上运行服务器代码 var ws require websocket server var server ws createServer server ad
根据原始数据创建队列退出率表

我需要帮助根据原始数据创建队列退出表我有一个如下所示的数据集 DT lt data table id c 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

根据原始数据创建队列退出率表

根据原始数据创建队列退出率表 的相关文章

随机推荐

热门标签

根据原始数据创建队列退出率表的相关文章