计算数据框中每列的非 NA 值的数量[重复]

2024-02-25

我有一个很大的数据集，其中包含很多NAs 和一些非 Na 值。此刻我数着我的非NA每列的值如下所示：

 attach(df)
 1000 - (sum(is.na(X1)))
 1000 - (sum(is.na(X2)))
 1000 - (sum(is.na(X3)))
 1000 - (sum(is.na(X4)))
 1000 - (sum(is.na(X5)))
 ...
 detach(df)

所以我的观察的总长度 - 我的观察的总和NA values.

有没有一种更快的方法，可以使用更少的代码行和打字工作，并让我快速概览所有列和非非列的数量NA values?

比如for循环之类的？

我正在寻找这样的东西：

  X1     Amount of Non-Na-Values
  X2     ...
  X3     ...
  X4
  X5
  X6

谢谢：）

您也可以致电is.na在整个数据帧上（隐式强制到逻辑矩阵）并调用colSums关于反向响应：

# make sample data
set.seed(47)
df <- as.data.frame(matrix(sample(c(0:1, NA), 100*5, TRUE), 100))

str(df)
#> 'data.frame':    100 obs. of  5 variables:
#>  $ V1: int  NA 1 NA NA 1 NA 1 1 1 NA ...
#>  $ V2: int  NA NA NA 1 NA 1 0 1 0 NA ...
#>  $ V3: int  1 1 0 1 1 NA NA 1 NA NA ...
#>  $ V4: int  NA 0 NA 0 0 NA 1 1 NA NA ...
#>  $ V5: int  NA NA NA 0 0 0 0 0 NA NA ...

colSums(!is.na(df))
#> V1 V2 V3 V4 V5 
#> 69 55 62 60 70

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

计算数据框中每列的非 NA 值的数量[重复] 的相关文章

dplyr 中的 Summarize 是否可以不删除数据框中的其他列？

我有一个包含三列的数据框我正在尝试进行简单的总结以查找数据框中每个城市的最高温度但同时保留每个最高温度列出的日期这是数据框我们称之为 maxT new ID Date Max TemperatureF 1 TUS 1960 04 0
检查是否存在多列

是否有更复杂的方法来检查数据框df包含 2 个名为Column 1 and Column 2 if numpy all map lambda c c in df columns Column 1 Columns 2 do something
如何在 Pandas Python 中按 id 对行进行排名

我有一个像这样的数据框 id points1 points2 1 44 53 1 76 34 1 63 66 2 23 34 2 44 56 我想要这样的输出 id points1 points2 points1 rank points2
错误：“rjags”的包或命名空间加载失败

在终端的 conda 环境之一中我能够成功安装包 rjags 但是当我在该环境中运行 R 并运行库 rjags 时出现以下错误加载所需的包 coda 错误 rjags 的包或命名空间加载失败 rjags 的 loadNamespac
将 VLMC 拟合到很长的序列

我正在尝试将 VLMC 拟合到最长序列为 296 个状态的数据集我这样做如下所示 Load libraries library PST library RCurl library TraMineR Load and transform d
根据另一列中的键累积一列中的值时出现问题

我有一个看起来像这样的数据框我需要使用 PROJ ID 列中的字符串创建一个新的值列并形成 PROJ NAME 列中的值字符串这里提供的解决方案根据 r 中另一列的键累积一列中的值 https stackoverflow com q
如何将此“for”循环转换为向量解

这个问题与将嵌入其他文本的长州名称转换为两个字母的州缩写 https stackoverflow com questions 25582518 convert long state names embedded with other te
使用outer代替expand.grid

我正在寻找尽可能快的速度并留在基地做该做的事expand grid做我用过outer为过去类似的目的创建一个向量像这样的东西 v lt outer letters LETTERS paste0 unlist v lower tri v
r 中的 5 维图

我正在尝试在 R 中绘制 5 维图我目前正在使用rgl包以 4 个维度绘制数据使用 3 个变量作为 x y z 坐标另一个变量作为颜色我想知道是否可以使用这个包添加第五个变量例如空间中点的大小或形状这是我的数据和当前代码的示例
带 R 的多彩标题

我想添加颜色某些词在我的图表标题中我已经能够在这里找到一些先例 http blog revolutionanalytics com 2009 01 multicolor text in r html 具体来说我希望用撇号括起来的文本在
表单提交时出现 rvest 错误

我想从以下网页中抓取数据 https swgoh gg u zozo collection 180 emperor palpatine https swgoh gg u zozo collection 180 emperor palpati
pandas DataFrame.join 的运行时间是多少（大“O”顺序）？

这个问题更具概念性理论性与非常大的数据集的运行时间有关所以我很抱歉没有一个最小的例子来展示我有一堆来自两个不同传感器的数据帧我需要最终将它们连接成两个very来自两个不同传感器的大数据帧 df snsr1 and df snsr2
为什么 geom_boxplot 比基本箱线图识别更多异常值？

这是一个可重复的示例与基本箱线图相比最后一个治疗组又发现了一个异常值 dta lt structure list Treatment c A A A A A A A A A A A A A A A A B B B B B B B B B
使用 dplyr::filter 的整洁方式是什么？

使用下面的函数调用foo c b 输出以内联方式显示正确的写作方式是什么df gt filter x gt x 我已经包含了一个使用的示例mutate以整洁的风格与之对比filter foo lt function variables x
16 位以上整数的计算

我有两个大整数两者都超过 16 位确切地说是 20 位而且我知道由于双精度浮点运算我在使用这些数字进行计算甚至将它们存储在变量中独立于编程语言时受到限制不过我想也许gmp图书馆应该处理它们但不幸的是它没有可以计算更大的整
如何匹配 R 中的所有匹配项？

我有 1000 个名字的列表说A 我还有另外 5 个名字的清单说B 我想找出这5个名字出现在1000个号码列表中的第几行例如 Amy 在 A 中可以出现 25 次 B 里有艾米我想知道 Amy 出现在 A 中的哪些行我以前使用过
ggplot2、R 中的单条形条形图

我有以下数据和代码 gt ddf var1 var2 1 aa 73 2 bb 18 3 cc 9 gt gt dput ddf structure list var1 c aa bb cc var2 c 73L 18L 9L Names
R 中的 Websocket

我设法在 R 中建立到 Mtgox websocket 的连接规格如下 url https socketio mtgox com mtgox Currency USD https socketio mtgox com mtgox Curr
重新分配唯一值 - pandas DataFrame

我在尝试着assign unique值在pandas df给特定的个人 For the df below Area and Place 会一起弥补unique不同的价值观jobs 这些值将分配给个人总体目标是使用尽可能少的个人诀窍在于这
如何将 ggrough 图表另存为 .png

说我正在使用R包裹ggrough https xvrdm github io ggrough https xvrdm github io ggrough 我有这个代码取自该网页 library ggplot2 library ggroug

随机推荐

时间戳和合成时间偏移

H 264 缓冲区是否包含时间戳和解码时间戳信息当我们获得 H 264 nalu 数据时其中是否包含计时信息如果您指的是原始 H 264 NAL 单元那么它们不包含计时信息如果指的是 PTS DTS 之类的内容 MKV MP4 T
尝试将日期插入日期时间列时出错

我有一个表单试图将一些数据插入 SQL Server 2008 数据库该表单有一个函数来获取当前日期时间然后将其插入数据库如下所示 now date Y m d H i s q INSERT INTO TBL USERS usern
如何在Perl6中加载Perl5的Data::Printer？

我一直在尝试加载 Perl5 模块Data Printer进入 Perl6 但我遇到了困难我之前问过这个问题无法使用 Inline Perl5 将 Perl5 模块导入 Perl6 https stackoverflow com que
从 FTP 下载文件以及如何提示用户在 ASP.NET C# 中保存/打开文件

我想从 FTP 下载文件并在用户单击 ASP NET C 页面上的下载按钮时在用户的 Web 浏览器中打开下载保存提示 string strDownloadURL System Configuration ConfigurationSe
没有应用程序与此操作的指定文件关联 (VB.NET)

我们有一个 Win Forms 应用程序它使用 iTextSharp 生成 pdf 将其保存到本地目录然后应用程序打开该文件对于一名客户所有 XP 机器和 Adob e Reader 11 它会抛出以下错误 No applicati
文本区域的值？怎样填写呢？

我正在尝试填补一个textarea使用javascript 问题是我发现textarea没有值标签并且
Android 资源 ID

我正在从自定义 xml 视图类型检索自定义资源 ID 我被要求为检索指定一个默认的 int 值并且想知道 ID 的范围是多少它们总是正数还是包含零即 1 是一个有效的空引用和或 0 是一个有效的空引用吗 Thanks EDI
将嵌套的 for 循环转换为单个 LINQ 语句

有人可以帮我将此嵌套结构转换为单个 LINQ 语句吗 EventLog logs EventLog GetEventLogs for int i 0 i lt logs Length i if logs i LogDisplayName E
尝试为 ARM 构建 GDB 时出错

我正在尝试为我的 Ubuntu 16 04 机器上的手臂构建 GDB 版本 8 0 我打算直接在arm机器上调试目前没有服务器我已经执行了这些指令正如所解释的那样here https sourceware org gdb wiki B
在 Python 中使用数量时消除单位

我正在使用伟大的数量 http pypi python org pypi quantitiesPython 的包我想知道如何在没有单位的情况下仅获得数量的数值即如果我有 E 5 3 quantities joule 我只想得到5 3
Android 是否将从 HTTP 下载的图像保留在缓存中？

这就是我的程序的工作原理 1 显示来自服务器的图片 2 用户更改图片并上传到服务器 3 从服务器重新下载显示图片这是我从服务器获取图片的方式 String src http www getyourpicture com mypicture
Scala Map 实现按插入顺序保留条目？

在Java中我使用LinkedHashMap以此目的 Java 的文档LinkedHashMap很明显它有可预测的迭代顺序我在 Scala 中也需要同样的东西斯卡拉有ListMap and LinkedHashMap 但是关于他们到
将数据框中的列乘以向量

我想要做的是将 data frame 的第 1 列中的所有值乘以向量中的第一个元素然后将第 2 列中的所有值乘以向量中的第二个元素依此类推 c1 lt c 1 2 3 c2 lt c 4 5 6 c3 lt c 7 8 9 d1 lt
使用 XMLHTTP 方法时等待页面加载

在下面的工作代码中我尝试导航到特定的 YouTube 频道要将视频名称放入 Excel 中它可以工作但部分工作因为代码只列出了大约 30 个视频 Dim x html As Object ele As Object sKeyWor
当 ASP.net 验证摘要已填写时，如何调用 javascript 函数

我的页面中有一个validationSummary 我想在validationSummary填充后调用一个javascript函数我怎样才能做到这一点我认为我应该在后面的代码中添加一个属性但我无法弄清楚该属性的键是什么有什么帮助吗
VirtualPathUtility 的 ASP.Net Core 替换

有替代品吗VirtualPathUtility ToAbsolute在 ASP Net Core 中似乎不可用我想转换相对路径例如将 bob 转换为绝对路径例如应用程序鲍勃我试图从类库中执行此操作因此无法访问控制器和视图的常
每个块的最大线程数

我有以下信息 Maximum number of threads per block 512 Maximum sizes of each dimension of a block 512 x 512 x 64 这是否意味着 2d 线程块中的
Git：添加非暂存文件

我对文件进行了更改尝试暂存文件后git add 像往常一样我继续承诺git commit m 然而终端向我吐出了这样的信息 no changes added to commit use git add and or git commi
pandas 中 DataFrame.div 和 DataFrame.divide 的区别

我试图将 pandas 数据帧的一列元素与另一列的相同行索引元素分开在尝试寻找库函数来实现此目的时我遇到了两个函数数据框 div https pandas pydata org pandas docs stable generated
计算数据框中每列的非 NA 值的数量[重复]

这个问题在这里已经有答案了我有一个很大的数据集其中包含很多NAs 和一些非 Na 值此刻我数着我的非NA每列的值如下所示 attach df 1000 sum is na X1 1000 sum is na X2 1000 sum i

计算数据框中每列的非 NA 值的数量[重复]

计算数据框中每列的非 NA 值的数量[重复] 的相关文章

随机推荐

热门标签