异常值返回 NA

2024-03-30

我使用下面的函数使用 3*sd 查找异常值,但在结果中我得到了异常值和 NA 值。异常值中不应该有 NA 值,对吗?

我如何解决它?

findingoutlier<- function (data, cutoff=3, na.rm=TRUE){
  sd <- sd(data, na.rm=TRUE)
  mean <- mean(data, na.rm=TRUE)
  outliers <- (data[data < mean - cutoff * sd | data > mean + cutoff * sd])
  return (outliers)
}

这是一个相当微妙的结果NA比较在 R 中处理。

假设你有一个NA值在data。那么你的标准

data < mean - cutoff * sd | data > mean + cutoff * sd

评估为NA(即,我们不知道不可用的数据点是否是异常值......)

如果我们提出要求,我们会得到什么data[NA]? From ?"[":

提取时,数字、逻辑或字符“NA”索引 选择一个未知元素,因此在相应的元素中返回“NA” 逻辑、整数、数字、复数或字符的元素 结果 ...

(这是一种技术性的说法“NA in, NA out").

所以你应该要么放弃NA来自您输入的值(例如na.omit(), or use

!is.na(data) & (data < mean - cutoff * sd | data > mean + cutoff * sd)

作为你的标准。

我想不出你最终会遇到的任何其他原因NA在输出中(并且因为您没有给出可重现的例子 https://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example我无法猜测它们会是什么......)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

异常值返回 NA 的相关文章

  • 使用神经网络包进行多项分类

    这个问题应该很简单 但文档没有帮助 我正在使用 R 我必须使用neuralnet多项式分类问题的包 所有示例均针对二项式或线性输出 我可以使用二项式输出进行一些一对一的实现 但我相信我应该能够通过使用 3 个单元作为输出层来做到这一点 其中
  • 将模式的所有元素与向量以相同的顺序匹配

    我创建了一个函数yes seq需要两个参数 一个模式pat和数据dat 该函数以相同的顺序查找数据中是否存在模式 例如 dat lt letters 1 10 dat 1 a b c d e f g h i j pat lt c a c g
  • 在ggplot2中,箱线图线的末尾代表什么?

    我找不到箱线图线条端点代表什么的描述 For example here are point values above and below where the lines end 我意识到盒子的顶部和底部是第 25 个和第 75 个百分位数
  • R 中具有 p 值的相关矩阵

    假设我想要传导相关矩阵 library dplyr data iris iris gt select if is numeric gt cor y iris Petal Width method spearman gt round 2 现在
  • 如何在R中创建for循环? [复制]

    这个问题在这里已经有答案了 可能的重复 如何在 R 编程中启动 for 循环 https stackoverflow com questions 4162363 how to start a for loop in r programmin
  • 使用 R Markdown 文档作为函数源

    我正在研究 R Markdown 来记录我经常使用的功能 我会将它们放入 R Markdown 文件中以记录它们 然后如果我几个月后回来查看它 就能够阅读我在函数背后的想法 我的问题是 如果我开始一个新的 R 项目 是否可以获取 r mar
  • 来自大型数据帧的共现

    我有一个数据框 其中包含有关每个用户访问过哪些城市的信息 df visited lt data frame user c john john claire claire doe doe city c Antananarivo Barcelo
  • 使用 R 将日期格式的字符串列表/向量转换为 posix 日期类

    我有一个日期格式的字符串列表 我想将其转换为可以使用 R 操作的 posix 日期列表 我该怎么做 这就是我所拥有的 但我最终得到了一个列表 a lt c 2009 01 01 00 00 00 2009 01 01 00 00 00 z
  • 使用矢量相应地更改传单线条的颜色

    无论如何 是否可以根据某些变量的值更改传单线条的颜色 我用谷歌搜索 发现了这个link http hgoebl github io Leaflet MultiOptionsPolyline demo 然而 我想知道是否有一种简单的方法可以在
  • ggplot2 中的中心图标题

    这个简单的代码 以及今天早上我的所有脚本 已经开始在 ggplot2 中给我一个偏离中心的标题 Ubuntu version 16 04 R studio version Version 0 99 896 R version 3 3 2 G
  • 使用 data.table 左连接

    假设我有两个数据表 s dataA A B 1 1 12 2 2 13 3 3 14 4 4 15 dataB A B 1 2 13 2 3 14 我有以下代码 merge test merge dataA dataB by A all d
  • 按名称包含在单个对象中的多个列对 data.frame 进行排序?

    我想排序一个data frame由多列组成 理想情况下使用基础 R 无需任何外部包 尽管如果有必要 就这样吧 读过如何按列对数据框进行排序 https stackoverflow com questions 1296646 how to s
  • 如何在闪亮的observeEvent中监听多个事件表达式

    我想要两个不同的事件触发观察者 有人建议here https stackoverflow com questions 34731975 how to listen for more than one event expression wit
  • 如何编写固定宽度的文件?

    我应该编写一个基于固定宽度列的特定格式的 txt 文件 例如 第 1 8 列中的第一个变量 第 9 15 列中的第二个变量 原始数据有不同的长度 它们必须放在指定列的右侧 例如 值 15 96 和 12 489 必须写入第一行和第二行的第1
  • 在 R 中计算大矩阵的零空间

    我找不到任何函数或包来计算 a 的零空间或 QR 分解 bigmatrix from library bigmemory 在 R 中 例如 library bigmemory a lt big matrix 1000000 1000 typ
  • 如何比较数据框1的每一行与数据框2的每一行?

    我有两个数据框 如下所示 x data frame Name c 200003 200260 400826 400863 500710 Chr c chr1 chr1 chr2 chr3 chr3 Position c 11880 1441
  • R:使用数据框 A 中某个日期之前的值填充数据框 B 中的行

    这可能非常复杂 我怀疑需要先进的知识 我现在有两种不同类型的 data frames 我需要组合 数据 数据框A 按患者 ID 列出所有输血日期 每次输血均由单独的行表示 患者可以进行多次输血 不同的患者可以在同一天进行输血 Patient
  • 有什么方法可以禁用 PDF/Postscript 输出中的“减号破解”吗?

    在 R 中 将绘图保存到 PDF 或 Postscript 文件时 轴标签中的连字符会变成减号 显然 这是设计使然 根据 postscript 设备的文档 正常编码规则 有一个例外 字符 45 始终设置为负号 其在 Adob e ISOLa
  • R ggplot:加权 CDF

    我想使用绘制加权 CDFggplot 一些旧的非 SO 讨论 例如this https stat ethz ch pipermail r help 2012 October 337288 html从 2012 年起 建议这是不可能的 但我想
  • 时间序列,将月度数据改为季度

    现在我有一些每月数据 例如 1 1 90 620 2 1 90 591 3 1 90 574 4 1 90 542 5 1 90 534 6 1 90 545 etc 如果我使用 ts 函数 很容易将数据转换为时间序列结构 例如 Jan F

随机推荐

  • 在 C# 中使用 iTextSharp 在 PDF 中添加多个数字签名

    我已经使用 iTextSharp Dll 实现了数字签名 以使用单个签名对 PDF 文件进行签名 现在 我想在之前或已经进行数字签名的 PDF 中添加另一个数字签名 但在验证一个签名时出现错误 如何在一份 PDF 中添加多个数字签名并验证所
  • 宏可以从其参数中删除字符吗?

    是否可以定义一个宏来修剪传入的字符串参数的一部分 例如 can this be defined define MACRO o int main printf MACRO ObjectT prints Object not ObjectT 宏
  • (rails) 如何验证上传的 .txt 文件是否不是图像文件?

    我有一个上传文本文件字段 我计划用它来将文件保存在某个地方 然后将文件的位置存储在数据库中 但是 我想确保他们上传的文件是 txt 文件 而不是图像文件 我想这会发生在验证步骤中 如何验证这样的事情呢 另外 如何获取上传文件的文件名 我总是
  • Golang:变量参数

    当我编译以下程序时 func myPrint v interface fmt Println Hello v func main myPrint new world 我收到编译错误 too many arguments in call to
  • 在java中为八通道声卡选择输出线

    编辑 我现在使用杰克 杰克音频连接套件 请参阅下面的答案 我的 Raspberry Pi 上有一个带有 8 个输出通道 四个立体声通道 的声卡 即 Octosound 卡 我想要做的是选择将声音路由到的通道之一 使用此代码我打印声卡的信息
  • 使用 EntityTypeConfiguration 时的抽象域模型基类

    是否有一些技巧可以获取基本对象属性的中央映射 使用 EntityTypeConfiguration 时抽象类是否有一些简单的模式 非常感谢任何提示 我无法声明一个类 Public class BaseEntityConfig
  • 错误:没有 ChildrenOutletContexts 的提供者[重复]

    这个问题在这里已经有答案了 我无法以任何方式在 Angular 5 中使用角度 材质 我跟着这个简单教程 https coursetro com posts code 113 How to Build an Angular 5 Materi
  • jquery选择器数组

    我遇到添加到购物篮的问题 有些产品有颜色 尺寸等选项 我绘制了颜色 尺寸的选择框和数量的输入
  • 将每秒位数 (bps) 转换为人类可读的大小格式

    我如何在 iOS 中将每秒位数 bps 转换 计算为可读大小格式 例如 10 Mbps 7 Gbps 5 Tbps 4 Pbps 3 Ebps 等 Best Objective C NSString convertBitrateToHuma
  • 在 C# .NET 4.5 中使用 SAML 2.0

    我正在尝试使用纯 NET 无外部类 控件 帮助程序 来创建 SAML 消息 我在互联网上找到了一些代码 这就是我所拥有的 private static SamlAssertion createSamlAssertion Here we cr
  • 如何从 Angular 中的 SVG 图标生成 webfont

    我有一些 SVG 图标 但我想在我的项目中使用它们作为字体 有人知道如何在角度项目中将图标作为字体导入吗 这个网址里有一个答案 https www npmjs com package webfonts generator https www
  • 通过 Azure Runbook 部署 ARM 模板

    我按照 Microsoft 文档使用 Runbook 将模板部署到 azure 中 但是我看不到标题下脚本的参数来自哪里 创建 PowerShell Runbook 脚本 完整指南在这里https learn microsoft com e
  • Firebase 自定义声明不会传播

    我正在使用 angularfire2 开发 Angular6 应用程序 我将角色设置为用户创建中的自定义声明 但它似乎没有传播 当我创建用户时 我将用户 ID 业务 ID 和角色发送到云功能 出价 gt 业务ID 尿素 gt 作用 req
  • 如何使 numpy.argmax 返回所有出现的最大值?

    我正在尝试找到一个返回的函数all给定列表中最大值的出现次数 numpy argmax http docs scipy org doc numpy reference generated numpy argmax html但是只返回它找到的
  • 在 Google API v2 中,为什么会出现“用于调用 Google Play Developer API 的项目 id 尚未链接”的错误?

    当我使用 Google API v2 时 要获得应用程序内列表 https developers google com android publisher api ref inappproducts list 当我进行 API 调用时 出现
  • 在 Include 语句中使用Where子句的Linq查询[重复]

    这个问题在这里已经有答案了 我正在尝试替换我的又大又丑的查询 虽然丑陋 但它可以按预期工作 using var ctx new Data Model xxxTrackingEntities var result ctx Offenders
  • 如何覆盖默认浏览器 HTML5 视频控件?

    我正在尝试将视频播放器的自定义快捷方式更改为 Youtube 的自定义快捷方式 在 Youtube 上 箭头键快退和快进各 5 秒 默认情况下 在 Firefox 和 Google 上 按下向左箭头键时 视频快退 15 秒 按下右箭头键时
  • 使用 querySelectorAll()。方法返回的结果是有序的吗?

    我正在尝试编写一个适用于多个页面的js代码 我正在尝试使用 querySelectorAll 来获取 DOM 中的元素 我需要订购元素 为此 我可以使用 xPath 或选择器 我更喜欢使用选择器 但 xPath 也可以 问题是 queryS
  • 将 List 转换为 IEnumerable

    我仍在学习一些 c 的东西 但我找不到这个问题的答案 假设我有一个实现 MyInterface 的 MyObject 列表 public class MyObject IMyInterface public List
  • 异常值返回 NA

    我使用下面的函数使用 3 sd 查找异常值 但在结果中我得到了异常值和 NA 值 异常值中不应该有 NA 值 对吗 我如何解决它 findingoutlier lt function data cutoff 3 na rm TRUE sd