获取 pandas 数据框中所有唯一行的计数

2024-02-01

我有一个 Pandas DataFrame -

>>> import numpy as np
>>> import pandas as pd
>>> data = pd.DataFrame(np.random.randint(low=0, high=2,size=(5,3)),
...                       columns=['A', 'B', 'C'])
>>> data
   A  B  C
0  0  1  0
1  1  0  1
2  1  0  1
3  0  1  1
4  1  1  0

现在我用它来获取仅 A 列的行数

>>> data.ix[:, 'A'].value_counts()
1    3
0    2
dtype: int64

获取 A 列和 B 列的行数的最有效方法是什么，即类似于以下输出 -

0    0    0
0    1    2
1    0    2
1    1    1

最后如何将其转换为 numpy 数组，例如 -

array([[0, 2],
       [2, 1]])

请给出一个也符合的解决方案

>>>> data = pd.DataFrame(np.random.randint(low=0, high=2,size=(5,2)),
...                       columns=['A', 'B'])

您可以使用分组size http://pandas.pydata.org/pandas-docs/stable/generated/pandas.core.groupby.GroupBy.size.html进而unstack http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.unstack.html:

In [11]: data.groupby(["A","B"]).size()
Out[11]:
A  B
0  1    2
1  0    2
   1    1
dtype: int64

In [12]: data.groupby(["A","B"]).size().unstack("B")
Out[12]:
B   0  1
A
0 NaN  2
1   2  1

In [13]: data.groupby(["A","B"]).size().unstack("B").fillna(0)
Out[13]:
B  0  1
A
0  0  2
1  2  1

However每当你执行 groupby 和 unstack 操作时，你应该思考：数据透视表 http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.pivot_table.html:

In [21]: data.pivot_table(index="A", columns="B", aggfunc="count", fill_value=0)
Out[21]:
   C
B  0  1
A
0  0  2
1  2  1

这将是最有效也是最直接的解决方案。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

pandas

获取 pandas 数据框中所有唯一行的计数的相关文章

导入错误：没有名为 _ssl 的模块

带 Python 2 7 的 Ubuntu Maverick 我不知道如何解决以下导入错误 gt gt gt import ssl Traceback most recent call last File
Flask 和 uWSGI - 无法加载应用程序 0 (mountpoint='')（找不到可调用或导入错误）

当我尝试使用 uWSGI 启动 Flask 时出现以下错误我是这样开始的 gt cd gt root localhost uwsgi socket 127 0 0 1 6000 file path to folder run py ca
如何在Windows上模拟socket.socketpair

标准Python函数套接字套接字对 https docs python org 3 library socket html socket socketpair不幸的是它在 Windows 上不可用从 Python 3 4 1 开始我
如何等到 Excel 计算公式后再继续 win32com

我有一个 win32com Python 脚本它将多个 Excel 文件合并到电子表格中并将其另存为 PDF 现在的工作原理是输出几乎都是 NAME 因为文件是在计算 Excel 文件内容之前输出的这可能需要一分钟如何强制工作簿计算值
SQL Alchemy 中的 NULL 安全不等式比较？

目前我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
如何使用 Scrapy 从网站获取所有纯文本？

我希望在 HTML 呈现后可以从网站上看到所有文本我正在使用 Scrapy 框架使用 Python 工作和xpath body text 我能够获取它但是带有 HTML 标签而且我只想要文本有什么解决办法吗最简单的选择是ext
安装后 Anaconda 提示损坏

我刚刚安装张量流GPU创建单独的后环境按照以下指示here https github com antoniosehk keras tensorflow windows installation 但是安装后当我关闭提示窗口并打开新航站楼弹出
keras加载模型错误尝试将包含17层的权重文件加载到0层的模型中

我目前正在使用 keras 开发 vgg16 模型我用我的一些图层微调 vgg 模型拟合我的模型训练后我保存我的模型model save name h5 可以毫无问题地保存但是当我尝试使用以下命令重新加载模型时load mod
从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

我有一个清单 things A1 B2 C3 我有一个 pandas 数据框其中有一列包含用分号分隔的值某些行将包含与上面列表中的一项的匹配它不会是完美的匹配因为它在其中包含字符串的其他部分该列例如该列中的一行可能有哇这里
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
Python：字符串不会转换为浮点数[重复]

这个问题在这里已经有答案了我几个小时前写了这个程序 while True print What would you like me to double line raw input gt if line done break else f
ExpectedFailure 被计为错误而不是通过

我在用着expectedFailure因为有一个我想记录的错误我现在无法修复但想将来再回来解决我的理解expectedFailure是它会将测试计为通过但在摘要中表示预期失败的数量为 x 类似于它如何处理跳过的 tets 但是当我
Python：尝试检查有效的电话号码

我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字现在我有了这个如果启动不正确它将允许您重新输入正确的数字然后它会翻译输入的原始数字我该如何解决 def main phon
Python - 在窗口最小化或隐藏时使用 pywinauto 控制窗口

我正在尝试做的事情我正在尝试使用 pywinauto 在 python 中创建一个脚本以在后台自动安装 notepad 隐藏或最小化 notepad 只是一个示例因为我将编辑它以与其他软件一起使用 Problem 问题是我想在安装程序
Numpy 优化

我有一个根据条件分配值的函数我的数据集大小通常在 30 50k 范围内我不确定这是否是使用 numpy 的正确方法但是当数字超过 5k 时它会变得非常慢有没有更好的方法让它更快 import numpy as np N 5000
通过数据框与函数进行交互

如果我有这样的日期框架氮 EG 00 04 NEG 04 08 NEG 08 12 NEG 12 16 NEG 16 20 NEG 20 24 datum von 2017 10 12 21 69 15 36 0 87 1 42 0 76
为美国东部以外地区的 Cloudwatch 警报发送短信？

AWS 似乎没有为美国东部以外的 SNS 主题订阅者提供 SMS 作为协议我想连接我的 CloudWatch 警报并在发生故障时接收短信但无法将其发送到 SMS YES 经过一番挖掘后我能够让它发挥作用它比仅仅选择一个主题或输入闹钟
检查所有值是否作为字典中的键存在

我有一个值列表和一本字典我想确保列表中的每个值都作为字典中的键存在目前我正在使用两组来确定字典中是否存在任何值 unmapped set foo set bar keys 有没有更Pythonic的方法来测试这个感觉有点像黑客您的方
VSCode：调试配置中的 Python 路径无效

对 Python 和 VSCode 以及 stackoverflow 非常陌生直到最近我已经使用了大约 3 个月一切都很好当尝试在调试器中运行任何基本的 Python 程序时弹出窗口The Python path in your
Pandas 与 Numpy 数据帧

看这几行代码 df2 df copy df2 1 df 1 df 1 values 1 df2 ix 0 0 我们的教练说我们需要使用 values属性来访问底层的 numpy 数组否则我们的代码将无法工作我知道 pandas Data

随机推荐

Mac 版 Github 如何同步？

根据Mac 版 Github 博客公告 https github com blog 878 announcing github for mac 一旦您准备好共享您的提交或拉入远程提交只需按同步分支按钮即可我们将执行更智能的版本pul
Swift - “sharedApplication 不可用。”在适当的情况下使用基于视图控制器的解决方案

我正在使用以下行在 Swift 应用程序中打开外部 URL UIApplication sharedApplication openURL url 在我通过 CocoaPods 将 Realm 添加到我的项目之前这一切都工作得很好那时
在specflow中传递变量数组

有没有办法传递参数数组而不是单独传递每个参数例如我有以下场景 When i login to a site then
Neo4j 复制替代 Neo4j 企业版？

看来 Neo4J 高可用性仅适用于付费的企业版是否有其他替代方案可以在没有该模块的情况下实现复制即无成本谢谢你的帮助 Update 这个答案已经改变了 Neo4j 现在是开放核心因此企业代码不再是双重许可的仅保留商业许可选项您可
需要未知模块“607”。如果您确定该模块存在，请尝试重新启动 Metro 捆绑程序

在模拟器中重新加载项目后突然我一次又一次地收到此错误需要未知模块 607 如果您确定该模块存在请尝试重新启动 Metro 捆绑程序您可能还想运行 yarn 或 npm install 取决于您的环境关闭所有终端并重新启动模拟器并运
Firebug 不会加载 JavaScript 文件或在断点处停止执行

我是 Firebug 的新手遇到了很多麻烦 JavaScript 文件通常显示为空或部分加载有时无法频繁设置断点的行行号显示为灰色当我设置断点时脚本执行通常不会在断点处停止我正在使用 Firebug 1 3 3 和 Fire
gcc/g++ 中“-l”（小写“L”）标志的含义

是什么意思 l 小写 L 标志传递给 gcc g 我在哪里可以找到有关它的文档或教程我尝试过搜索man gcc and man ld for l 但有数千个匹配项的例子 l flag in this gcc Wall Wextra We
网络位置提供商是否需要互联网来确定位置？

Android 设备在使用网络提供商获取位置时是否需要互联网我看到很少有文章说它无需互联网即可工作也很少有人说它需要互联网我正在更多地研究 Android 内部如何进行位置获取而不是代码文章说我们需要互联网设备捕获手机 ID 和
VS2015 UCRT源文件在哪里？

TL DR 我在哪里可以找到引用为的 MS 源文件d th minkernel crts ucrt 在 Visual Studio 2015 中调试时我正在尝试调试 CRT 调用以查看 MS 实际上在做什么不幸的是它似乎ucrt安装
打印ModalPanel的内容

是否可以只打印内容
如何在 Heroku 上的 Rails 应用程序上完全关闭资源编译？

我有一个 Rails 应用程序它运行一个没有资产的服务当我部署时我看到 gt Preparing app for Rails asset pipeline Running rake assets precompile rake abo
如何将 AES Decrypt 从 Javascript 转换为 php

我正在使用以下脚本并在控制台上运行它如下所示 JSON parse CryptoJS AES decrypt U2FsdGVkX1 S8UNrljj2STY8bBrYmr1qUbD2GYuJgIja1rzXY2y4BBkTf9GQxUG
Flutter : PlatformException(no_available_camera, 没有可用于拍照的相机。, null, null)

伙计们我面对的是这个相机版本它发生在我合并我的项目之后它说没有可用的相机但当时运行良好请看一看 E flutter ERROR flutter lib ui ui dart state cc 177 Unhandled Exce
使用拆分减速器更新相关状态字段的最佳方法？

我正在尝试找出更新状态树上的几个顶级字段的理想方法同时仍然维护拆分减速器这是我想出的一个简单的解决方案 var state fileOrder 0 files 0 id 0 name asdf function handleAddFil
Flutter - 如何将嵌套 json 解析为具有泛型的类？

我想知道如何将嵌套 json 解析为具有泛型类型的类我的目的是用代码和消息包装来自后端的响应例如包含令牌的loginRespose I have class BaseResponse
如何获取安卓手机的电话号码？ [复制]

这个问题在这里已经有答案了我尝试使用获取电话号码getLine1Number 在android中但它返回 null 有时我还需要使用另一个SIM卡并获取其号码如何随时获取电话号码如果您指的是从 Android 获取电话号码您可以尝
如何使用 Meteor 将图像从 FileReader 上传到 Amazon s3

我正在尝试使用 Meteor 构建一个图像上传器到 Amazon S3 感谢 Hubert OG 我发现AWS SDK https github com peerlibrary meteor aws sdk这让事情变得简单我的问题是上传的
TFS-“找不到路径的一部分”错误[重复]

这个问题在这里已经有答案了完全重新组织项目的文件夹结构后我收到此错误我猜有很多我在尝试签入或推广更改时收到此错误您遇到的错误主要是当您尝试签入计算机上不再存在的文件时引起的要解决此问题请转到源代码管理资源管理器 gt 选择这些
Cobertura：如何覆盖 spring-data @Repository 接口

关于以下信息 https stackoverflow com a 14601831 704246 https stackoverflow com a 14601831 704246 Cobertura 不检测接口我想知道如何将 sprin
获取 pandas 数据框中所有唯一行的计数

我有一个 Pandas DataFrame gt gt gt import numpy as np gt gt gt import pandas as pd gt gt gt data pd DataFrame np random rand

获取 pandas 数据框中所有唯一行的计数

获取 pandas 数据框中所有唯一行的计数 的相关文章

随机推荐

热门标签

获取 pandas 数据框中所有唯一行的计数的相关文章