R中启动库的cv.glm中的成本函数

2024-03-10

我正在尝试使用 R 中启动库中的交叉验证 cv.glm 函数来确定应用 glm 逻辑回归时错误分类的数量。

该函数具有以下签名：

cv.glm(data, glmfit, cost, K)

前两个表示数据和模型，K 指定 k 倍。我的问题是成本参数，其定义为：

成本：指定成本函数的两个向量参数的函数用于交叉验证。 cost 的第一个参数应该对应到观察到的响应，第二个参数应该对应于广义线性模型的预测或拟合响应。 cost 必须返回非负标量值。默认值是平均平方误差函数。

我想对于分类来说，有一个返回错误分类率的函数是有意义的，例如：

nrow(subset(data, (predict >= 0.5  & data$response == "no") | 
                  (predict <  0.5  & data$response == "yes")))

这当然在语法上也是不正确的。

不幸的是，我有限的 R 知识让我浪费了很多时间，我想知道是否有人能给我指出正确的方向。

听起来你可能只使用成本函数（即名为cost）在“示例”部分进一步定义?cv.glm。引用该部分：

 # [...] Since the response is a binary variable an
 # appropriate cost function is
 cost <- function(r, pi = 0) mean(abs(r-pi) > 0.5)

这基本上就是您在示例中尝试执行的操作。将“不”和“是”替换为0 and 1，假设你有两个向量，predict and response. Then cost()设计得很好，可以获取它们并返回平均分类率：

## Simulate some reasonable data
set.seed(1)
predict <- seq(0.1, 0.9, by=0.1)
response <-  rbinom(n=length(predict), prob=predict, size=1)
response
# [1] 0 0 0 1 0 0 0 1 1

## Demonstrate the function 'cost()' in action
cost(response, predict)
# [1] 0.3333333  ## Which is right, as 3/9 elements (4, 6, & 7) are misclassified
                 ## (assuming you use 0.5 as the cutoff for your predictions).

我猜最棘手的一点就是让你的思想完全围绕着将函数作为参数传递的想法。（至少对我来说，在很长一段时间里，这是使用boot包，这需要移动相当多的地方。）

2016年3月22日添加：

功能cost()，在我看来，上面给出的内容是不必要的混淆；下面的替代方案做了完全相同的事情，但以更具表现力的方式：

cost <- function(r, pi = 0) { 
        mean((pi < 0.5) & r==1 | (pi > 0.5) & r==0)
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

GLM

crossvalidation

R中启动库的cv.glm中的成本函数的相关文章

查找数据帧列表中同一列中的所有重复值并将其转换为 NULL

我有一个清单BELGIAN COAST list包含数百个数据帧 df1 df2 15 列 X 1000 行每个数据帧的最后一列称为Chemicals并包含一些字符例如Sulfate or Ammonia 但是这一列有很多行Chemic
从 R 环境中删除对象

我正在阅读 Hadley 的 Advanced R 在第 8 章中他说我们可以使用以下方法从环境中删除对象 rm 但是移除该物体后我仍然可以看到该物体这是我的代码 e lt new env e a lt 1 e b lt 2 e a
在另一个 Rmd 中运行选定的块

我已经在源 Rmd 文件中运行了分析并且希望仅使用few来自源的块我已经看到了一些关于从源 Rmd 中提取所有块的答案来自另一个 Rmd 中的 Rmd 文件的源代码 https stackoverflow com questions 4
将函数应用于 3d 数组的每一层，返回一个数组

假设您有一个包含行列和层的 3 维数组 A lt array 1 27 c 3 3 3 想象你有一个函数它接受一个矩阵作为输入并返回一个矩阵作为输出就像t 如何将该函数应用于数组的每一层返回与第一层大小相同的另一个数组我觉得我应该
解析，用三点参数替换

让我们考虑一个典型的deparse substitute R call f1 lt function u x y print deparse substitute x varU vu varX vx varY vy f1 u varU x
如何将此“for”循环转换为向量解

这个问题与将嵌入其他文本的长州名称转换为两个字母的州缩写 https stackoverflow com questions 25582518 convert long state names embedded with other te
glmnet 未从 cv.glmnet 收敛 lambda.min

我跑了20倍cv glmnet套索模型以获得 lambda 的最佳值但是当我尝试重现结果时glmnet 我收到一个错误内容如下 Warning messages 1 from glmnet Fortran code error c
R：表格格式

我有一个包含以下列的 Excel 文件 Column1 Column2 Column3 ab bb 0 5 ab bc 0 1 ab cd 0 7 ab dd 0 8 ac bb 0 2 ac bg 0 8 ac ee 0 8 ac dd
R 中的字符串作为函数参数

数据框chocolates列出了糖果的类型以及每种糖果的一组评级 ID sweetness filling crash snickers 0 67 0 55 0 40 milky way 0 81 0 53 0 56 我正在编写一个函数它
如何匹配 R 中的所有匹配项？

我有 1000 个名字的列表说A 我还有另外 5 个名字的清单说B 我想找出这5个名字出现在1000个号码列表中的第几行例如 Amy 在 A 中可以出现 25 次 B 里有艾米我想知道 Amy 出现在 A 中的哪些行我以前使用过
非闪亮上下文中的反应式对象绑定

实际问题你怎样才能近似反应性环境行为 http shiny rstudio com tutorial lesson6 建立者shiny http shiny rstudio com函数或者甚至可能在一个函数中使用这些函数无光泽上下文以
从数据框创建稀疏矩阵

我正在做一项作业尝试为 Netflix 奖项数据构建协作过滤模型我使用的数据位于 CSV 文件中我可以轻松地将其导入到数据框中现在我需要做的是创建一个稀疏矩阵其中用户作为行电影作为列每个单元格都由相应的评级值填充当我尝试绘制
如何修改秤包生成的标签？

所以我正在制作金字塔可视化我在用着scale y continuous labels scales label number si accuracy 0 1 来生产标签但是我想去掉图表女性部分的负号我认为保留 SI 后缀但删除负号的
提取部分字符串值，创建新的列名称，并使数据框宽

我想提取字符串列的最后一部分始终用方括号括起来将它们作为新列的名称然后将数据从长调整为宽并用这些值填充新列例如如果我有这个数据框 whatihave lt data frame v1 c abc effort def effor
如何匹配R中列之间的多个对应值

我有一个结构如下的数据框 ID Value1 Value2 1 a d g f 12 14 15 9 2 b c e 5 18 20 3 h i j 6 7 25 所以我有一个 ID 和两个值对于值 1 有多个对应于值 2 的选项我想最
ggplot 直方图相对于轴的位置不正确

我试图这样绘制直方图 Todo lo haremos con base en un variable aleatoria Uniforme 0 1 set seed 26 n 10000 U lt runif n n Supongamos
迭代字符串 R 的字符

有人可以解释一下为什么这不会在 R 中单独打印所有数字 numberstring lt 0123456789 for number in numberstring print number 字符串不就是字符数组吗在 R 中该怎么做 In
根据R中的前一行和当前行按组计算

我可以根据 R 中的前一行和当前行进行计算对于此数据框 df A B 1 2 2 2 2 3 3 4 5 5 B2 A2 0 5 B1 我可以使用这段代码来计算这个函数 for i in 2 nrow df B i lt 1 2 B i
基于条件反应逻辑闪亮的 Flexdashboard

我正在尝试有条件地进行一种类型的渲染 renderPlot 或其他 renderText 基于一些输入这是我尝试过的 title Citation Extraction output flexdashboard flex dashboar
使用函数参数作为 R 中新数据框的名称

这很简单但我已经搜索并未能找到这个小问题的解决方案我想使用函数的参数作为新数据框的名称例如 assign dataset lt function dataname x lt c 1 2 3 y lt c 3 4 5 dataname

随机推荐

使用CSS检测输入中是否有文本——在我正在访问且无法控制的页面上？

有没有办法通过 CSS 检测输入中是否有文本我尝试过使用 empty伪类我尝试过使用 value 这两个都不起作用我似乎无法找到单一的解决方案我想这一定是可能的考虑到我们有伪类 checked and indeterminate
Xcode 突然停止在硬件上运行项目：“无法启动 xxx.app：.. 没有这样的文件..”[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案 Xcode 已停止运行我的应用程序它在我从设备中删除它并尝试通过在 Xcode 中重新运行它来重新安装后立即启动我之前已经做过数百
使用 boost Spirit 解析带有二进制信封的文本文件

我目前正在尝试为 ASCII 文本文件编写一个解析器该文件被一个带有校验和的小信封包围该文件的基本结构是我想将有效负载提取到另一个字符串中以将其提供给下一个解析器我用来解析这个信封的解析器表达式是 qi phrase parse
如何杀死shell的所有子进程？

我正在编写一个 bash 脚本它可以完成几件事一开始它会启动几个监视脚本每个脚本都运行一些其他工具在我的主脚本结束时我想杀死从我的外壳中产生的所有东西所以它可能看起来像这样 bin bash some monitor1 sh
是什么使得树遍历是前序的还是有序的？

为什么通过根左右进行的树遍历称为前序难道这不应该是有序的吗因为根总是第一位的对我来说为什么这样称呼它没有意义因为根始终是第一个元素我们总是有这样的限制左孩子在右孩子之前被访问主要区别在于根在哪里如果根是before两个
Git 拉取失败并出现错误的包头错误

git pull 失败并出现以下错误 remote Counting objects 146 done remote fatal unable to create thread Resource temporarily unavailabl
如何获取硬盘已用空间，可用空间，而不是分区可用空间

我想知道每个硬盘的可用空间已用空间而不是分区可用空间谢谢使用 GetDiskFreeSpaceEx 函数参见这篇文章 http msdn microsoft com en us library aa364937 28v vs 85
ASP.NET 会员提供商

是否有人使用过 ASP NET Membership Provider 代码以及新的 1 3 工具包和 MVC 我正在寻找一些更新的代码到目前为止我所能找到的就是这里的代码 http archive msdn microsoft com
是否可以从 Dart 的控制台读取内容？

我知道我们可以使用 print 语句在 dart 中打印到控制台我想知道是否可以从控制台读取数据我进行了搜索并查看了 dart io 包但找不到任何参考 Thanks 您可以使用字符串输入流 http api dartlang org
用大写字母分割字符串[重复]

这个问题在这里已经有答案了可能的重复将 PascalCase 字符串拆分为单独的单词 https stackoverflow com questions 3216085 split a pascalcase string into se
UIButton 上的文本更改不粘

我的视图中有一个 UIButton 上面写着 STOP 当按下时它应该当然停止播放并且将其标签更改为 RTN TO ZERO 这很简单 stopButton titleLabel text RTN TO ZERO 然而这种变化只出
SheetJS：不要在 json_to_sheet 中包含标题

The SheetJS 文档 https docs sheetjs com array of objects input展示了一种获取 JSON 对象并将其转换为 Excel 工作表的方法从他们的例子来看 var ws XLSX util
Tensorflow 2.2.0 错误：[预测必须 > 0] [条件 x >= y 不满足元素方向：] 使用双向 LSTM 层时

在处理命名实体识别任务时我收到以下错误消息 tensorflow python framework errors impl InvalidArgumentError assertion failed predictions must be
在 asp.net 中按日期过滤 DirectoryInfo 文件

我正在使用指定路径 DirectoryInfo 中的文件填充数据网格控件我想根据用户指定的日期范围开始日期和结束日期过滤文件在搜索 S O 时我发现this https stackoverflow com questions 52
有没有办法在 Android 中创建自定义答录机？

我想创建一个应用程序允许您使用以下命令过滤来电到各种应答消息对于列入黑名单的电话号码此号码不可用给陌生人的正式信息关于您为朋友所做的事情的信息性消息我不知道如何自动接听电话播放录制的消息然后等待应答并录制或者也许只有一种与
如何从给定类 Item 获取数组？

首先我是新手我正在尝试使用媒体存储获取媒体文件详细信息并将详细信息保存在列表中mitems 这就是我正在做的事情 public class MusicRetriever final String TAG MusicRetriever C
Java Date Hibernate 截止时间

我在 Oracle DB 中有一个日期类型列它肯定包含日期和时间但是当我尝试在java应用程序中获取数据时它将返回带有一堆零的日期而不是实时的在代码中它将是这样的 SQLQuery sqlQuery session createSQ
pyspark.sql.utils.AnalysisException：“无法推断 CSV 的架构。必须手动指定。;'

我尝试了这两个 spark read option header true csv s3 spark read format csv option header true load s3 有没有办法在运行时读取架构请确认它是有效的 CS
在 C# 中，是否可以模拟 IMessageReceiver 和相关类进行单元测试？

我希望为以下课程创建单元测试 public class ServiceBusClient private readonly IMessageReceiver messageReceiver private readonly int maxi
R中启动库的cv.glm中的成本函数

我正在尝试使用 R 中启动库中的交叉验证 cv glm 函数来确定应用 glm 逻辑回归时错误分类的数量该函数具有以下签名 cv glm data glmfit cost K 前两个表示数据和模型 K 指定 k 倍我的问题是成本参数其

R中启动库的cv.glm中的成本函数

R中启动库的cv.glm中的成本函数 的相关文章

随机推荐

热门标签

R中启动库的cv.glm中的成本函数的相关文章