什么时候适合使用 df.value_counts() vs df.groupby('...').count()?

2024-02-22

我听说 Pandas 通常有多种方法可以做同样的事情,但我想知道 -

如果我尝试按特定列中的值对数据进行分组并计算具有该值的项目数,那么什么时候使用才有意义df.groupby('colA').count()什么时候使用才有意义df['colA'].value_counts() ?


有区别value_counts http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.value_counts.html return:

生成的对象将按降序排列,以便第一个元素是最常出现的元素。

but count http://pandas.pydata.org/pandas-docs/stable/generated/pandas.core.groupby.DataFrameGroupBy.count.html不,它对输出进行排序index(由列创建groupby('col')).


df.groupby('colA').count() 

用于聚合所有列df按功能count.所以它计算排除的值NaNs.

所以如果需要的话count仅一列需要:

df.groupby('colA')['colA'].count() 

Sample:

df = pd.DataFrame({'colB':list('abcdefg'),
                   'colC':[1,3,5,7,np.nan,np.nan,4],
                   'colD':[np.nan,3,6,9,2,4,np.nan],
                   'colA':['c','c','b','a',np.nan,'b','b']})

print (df)
  colA colB  colC  colD
0    c    a   1.0   NaN
1    c    b   3.0   3.0
2    b    c   5.0   6.0
3    a    d   7.0   9.0
4  NaN    e   NaN   2.0
5    b    f   NaN   4.0
6    b    g   4.0   NaN

print (df['colA'].value_counts())
b    3
c    2
a    1
Name: colA, dtype: int64

print (df.groupby('colA').count())
      colB  colC  colD
colA                  
a        1     1     1
b        3     2     2
c        2     2     1

print (df.groupby('colA')['colA'].count())
colA
a    1
b    3
c    2
Name: colA, dtype: int64
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

什么时候适合使用 df.value_counts() vs df.groupby('...').count()? 的相关文章

随机推荐

  • 在数基之间转换数字

    我正在开发一个在数字基数之间进行转换的程序 例如八进制是 8 十进制是 10 字母A to Z可以被视为基数 26 我想将 A 转换为0 Z转换为25 AA 转换为27 BA 转换为53 在开始编码之前 我会在纸上进行编码 以便我了解整个过
  • 为什么 date() 不能正确地将 YYMMDDHHMM 转换为 MySQL 可接受的日期格式?

    我想要一个像这样的字符串 1511030830 YYMMDDHHMM 并创建一个 MySQL 时间戳 如下所示 2015 11 03 08 30 00 但是 当尝试这样做时 它将不起作用 string 1511030830 date dat
  • 以编程方式启动时 Appium 不会初始化驱动程序

    我正在使用 Java 和 Selenium 通过命令行初始化 Appium 以便在 Android chrome 浏览器上运行测试 然而 该过程运行无限时间 并且代码来自 DesiredCapabilities 该行没有被执行 代码 Pro
  • 列出给定类的所有内部类 - Python

    给定一个类 我如何列出它的所有inner课程 class Car some var var class Engine some other var var2 class Body another var var3 现在给出Car我希望能够列
  • Next JS在arcgis地图上的多个坐标上显示信息窗口

    下面是我的下一个 JS 代码 它显示了一个简单的 ArcGIS 地图 其中包含特定坐标上的点或标记 谁能告诉我如何在地图上显示点的弹出 信息窗口 例如我单击任意点 它将在其上打开相应的弹出窗口 import NavBar from comp
  • 从 Swift 初始化器调用方法

    假设我在 Swift 中有以下类 有明显的问题 class MyClass let myProperty String init super init self setupMyProperty func setupMyProperty my
  • 如何在 AWS Cognito 中编辑尝试更改密码的限制?

    我已经实现了更改密码功能 现在我想测试一下 但我面临着尝试的极限 我应该做什么来防止这个错误 已超出尝试次数限制 请稍后再试 我是 Cognito 团队的成员 这是不可配置的 我们确实有保护机制来防止用户滥用忘记密码的 API 这可能就是您
  • Keras 中的 add_loss 函数的用途是什么?

    目前 我偶然发现了变分自动编码器 并尝试使用 keras 让它们在 MNIST 上工作 我找到了一个教程github https github com keras team keras blob master examples variat
  • 如何按周添加两个日期中的日期?

    I have a table in which rows have dates as monday dates of the weeks Some consecutive rows may not have consecutive week
  • 如何在 F# 模块中定义可选参数?

    我正在尝试用 F 重写一个小型 C 库 但遇到了错误 我试图为模块中的方法定义可选参数 但编译器说 可选参数仅允许在类型成员上使用 我查过为什么你不能在松散的函数中使用它们 https stackoverflow com questions
  • 使用 jQuery.extend 覆盖函数的原因可能是什么?

    我正在寻找扩展引导插件的正确方法 并找到了这个答案 https stackoverflow com a 12689534 1276032 https stackoverflow com a 12689534 1276032 让我烦恼的是最后
  • OpenCV,与教程中的代码进行特征匹配

    我复制了代码与 FLANN 的特征匹配 http docs opencv org doc tutorials features2d feature flann matcher feature flann matcher html featu
  • Jquery 移动:ui-state=dialog

    我正在使用 JQuery mobile 作为用户菜单列表 但它似乎保存了按下的按钮链接 ui state dialog 当我使用网络浏览器上的后退按钮时 这会干扰导航 如何删除添加到 URL 的 ui state dialog 例子 htt
  • 如何计算集群所需的zookeeper服务器数量?

    有没有公 式可以计算我需要的zookeeper服务器数量 假设一个集群可能有 50 500 或 5000 个服务器在运行 我如何将这些数字转换为我想要启动的 Zookeeper 服务器数量 换句话说 对 zk 服务器可以处理的工作负载有什么
  • 无法导入 scala.reflect.runtime.universe

    我想按照 scala 2 10 2 中的示例来尝试反射本教程 http docs scala lang org overviews reflection environment universes mirrors html 当我启动 sbt
  • 快速解析对象内的json数组

    这是一个样本json我必须在我的项目中实现的代码 请告诉我如何编写代码 我写了很多次代码 这根本不是工作 所以我希望请提供完整的例子 在这里我可以看到 首先有一个对象 接下来有一个多个对象 最后是一个对象内的数组 请查看详情 Activit
  • Tkinter Canvas 将项目移动到顶层

    我有一个 Tkinter Canvas 小部件 Python 2 7 而不是 3 在这个 Canvas 上我有不同的项目 如果我创建一个与旧项目重叠的新项目 它将位于前面 现在 我如何才能将旧项目移动到新创建的项目前面 甚至移动到画布上所有
  • jQuery 从链接获取带有变量的 url 并通过 Ajax 发送它

    我可以使用此链接通过 GET 将产品添加到购物车 div a href Add to Cart a div 我想使用 jQuery Ajax 保持在同一页面上 如果启用了 JS 我已经写出了以下内容 但当然它不起作用 有人可以看看出了什么问
  • C ++,stl,map如何按值而不是键排序

    我想仅使用值而不是键对地图容器中的元素进行排序 怎么做 我知道地图可以按键值排序 但反之亦然怎么办 我在 stackoverflow 中发现了同样的问题 我喜欢这个solution https stackoverflow com a 269
  • 什么时候适合使用 df.value_counts() vs df.groupby('...').count()?

    我听说 Pandas 通常有多种方法可以做同样的事情 但我想知道 如果我尝试按特定列中的值对数据进行分组并计算具有该值的项目数 那么什么时候使用才有意义df groupby colA count 什么时候使用才有意义df colA valu