Pandas 非常简单 分组总大小的百分比

2023-12-03

我在看似极其简单的操作中遇到了麻烦。通过诸如此类的操作从组中获取总数百分比的最简洁方法是什么df.groupby['col1'].size()。分组后我的 DF 看起来像这样,我只想要总数的百分比。我记得过去使用过此语句的变体,但现在无法使其工作:percent = totals.div(totals.sum(1), axis=0)

原始DF:

       A   B   C
    0  77   3  98
    1  77  52  99
    2  77  58  61
    3  77   3  93
    4  77  31  99
    5  77  53  51
    6  77   2   9
    7  72  25  78
    8  34  41  34
    9  44  95  27

Result:

df1.groupby('A').size() / df1.groupby('A').size().sum()

    A
    34    0.1
    44    0.1
    72    0.1
    77    0.7

到目前为止,这是我想到的,这似乎是相当合理的方法:

df.groupby('col1').size().apply(lambda x: float(x) / df.groupby('col1').size().sum()*100)

我不知道我是否遗漏了一些东西,但看起来你可以做这样的事情:

df.groupby('A').size() * 100 / len(df)

or

df.groupby('A').size() * 100 / df.shape[0]
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Pandas 非常简单 分组总大小的百分比 的相关文章

  • 计算另一个字符串中多个字符串的出现次数

    在 Python 2 7 中 给定以下字符串 Spot是一只棕色的狗 斑点有棕色的头发 斑点的头发是棕色的 查找字符串中 Spot brown 和 hair 总数的最佳方法是什么 在示例中 它将返回 8 我正在寻找类似的东西string c
  • pandas DataFrame.join 的运行时间是多少(大“O”顺序)?

    这个问题更具概念性 理论性 与非常大的数据集的运行时间有关 所以我很抱歉没有一个最小的例子来展示 我有一堆来自两个不同传感器的数据帧 我需要最终将它们连接成两个very来自两个不同传感器的大数据帧 df snsr1 and df snsr2
  • 为什么 web2py 在启动时崩溃?

    我正在尝试让 web2py 在 Ubuntu 机器上运行 所有文档似乎都表明要在 nix 系统上运行它 您需要下载源代码并执行以下操作 蟒蛇 web2py py 我抓住了source http www web2py com examples
  • 更好地相当于这个疯狂的嵌套 python for 循环

    for a in map for b in map a for c in map b for d in map c for e in map d print a b c d e 上面的代码用于创建图中一定长度的所有路径 map a 表示从
  • MongoEngine 查询具有以列表中指定的前缀开头的属性的对象的列表

    我需要在 Mongo 数据库中查询具有以列表中任何前缀开头的特定属性的元素 现在我有一段这样的代码 query mymodel terms term in query terms 并且这会匹配在列表 term 上有一个项目的对象 该列表中的
  • Tensorboard SyntaxError:语法无效

    当我尝试制作张量板时 出现语法错误 尽管开源代码我还是无法理解 我尝试搜索张量板的代码 但不清楚 即使我不擅长Python 我这样写路径C Users jh902 Documents logs因为我正在使用 Windows 10 但我不确定
  • Python 内置的 super() 是否违反了 DRY?

    显然这是有原因的 但我没有足够的经验来认识到这一点 这是Python中给出的例子docs http docs python org 2 library functions html super class C B def method se
  • 从 Powershell 脚本安装 Python

    当以管理员身份从 PowerShell 命令行运行以下命令时 可以在 Windows 11 上成功安装 Python c temp python 3 11 4 amd64 exe quiet InstallAllUsers 0 Instal
  • 使用 python/numpy 重塑数组

    我想重塑以下数组 gt gt gt test array 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 为了得到 gt gt gt test2 array 11 12 21 22 13 14
  • 无法导入 langchain.agents.load_tools

    我正在尝试使用 LangChain Agents 但无法导入 load tools 版本 langchain 0 0 27 我尝试过这些 from langchain agents import initialize agent from
  • 嵌套作用域和 Lambda

    def funct x 4 action lambda n x n return action x funct print x 2 prints 16 我不太明白为什么2会自动分配给n n是返回的匿名函数的参数funct 完全等价的定义fu
  • Django 视图中的“请求”是什么

    在 Django 第一个应用程序的 Django 教程中 我们有 from django http import HttpResponse def index request return HttpResponse Hello world
  • 如何将 ascii 值列表转换为 python 中的字符串?

    我在 Python 程序中有一个列表 其中包含一系列数字 这些数字本身就是 ASCII 值 如何将其转换为可以在屏幕上回显的 常规 字符串 您可能正在寻找 chr gt gt gt L 104 101 108 108 111 44 32 1
  • Protobuf 如何编码 oneof 消息结构

    对于这个 python 程序 在编码时运行 protobuf 编码会给出以下输出 0a 10 08 7f8a 0104 08 02 10 0392 0104 08 02 10 03 18 01 我不明白的是为什么8a后面有一个01 为什么9
  • python 中的“槽包装器”是什么?

    object dict 和其他地方的隐藏方法设置为这样的
  • Firebase Firestore:获取文档的生成 ID (Python)

    我可以创建一个新文档 带有自动生成的 ID 并存储对其的引用 如下所示 my data key value doc ref db collection u campaigns add my data 我可以像这样访问数据本身 print d
  • 如何使用 Boto3 启动具有 IAM 角色的 EC2 实例?

    我无法弄清楚如何使用指定的 IAM 角色在 Boto3 中启动 EC2 实例 以下是迄今为止我如何成功创建实例的一些示例代码 import boto3 ec2 boto3 resource ec2 region name us west 2
  • 在virtualenv中下载sqlite3

    我正在尝试使用命令创建应用程序python3 manage py startapp webapp但我收到一条错误消息 django core exceptions ImproperlyConfigured 加载时出错 pysqlite2 或
  • pandas.read_csv 将列名移动一倍

    我正在使用位于的 ALL zip 文件here http www fec gov disclosurep PDownload do 我的目标是用它创建一个 pandas DataFrame 但是 如果我跑 data pd read csv
  • NLTK:查找单词大小为 2k 的上下文

    我有一个语料库 我有一个词 对于语料库中该单词的每次出现 我想获取一个包含该单词之前的 k 个单词和该单词之后的 k 个单词的列表 我在算法上做得很好 见下文 但我想知道 NLTK 是否提供了一些我错过的功能来满足我的需求 def size

随机推荐

  • PHP mySQL - 你能返回一个带有数字索引的关联数组吗?

    我的数据库类中有这个方法 public function query queryString if this gt connected this gt connectToDb connect to database results mysq
  • PS4 控制器 - 当值为 1 时光标不移动

    我试图编写程序来使用 PS4 控制器控制鼠标 一切正常 我获取数据并且可以相应地移动鼠标 然而 当我将操纵杆固定在任何轴上时 鼠标不会移动 这不仅在我握住它时发生 而且在操纵杆值没有改变时也会发生 有什么办法可以解决这个问题吗 import
  • 为可变参数模板函数中的每个模板类型调用 void 函数?

    我的目标是编写一个简单的通用函数来注册任意 C 类型的转换器 为了简单起见 我将只打印 C 类型名称 我希望能够调用我的通用函数print type name适用于任何类型的函数 包括同时使用多种类型 可变参数 template
  • 如何使用 C# 读取/加载 datagridview 中的文本 (*.txt) 文件值?

    谁能帮我 在这里 我需要在我的 datagridview 中读取 加载文本 txt 文件值 这是我需要加载的示例文本文件 S NO Data1 Data2 Data3 Data4 Data5 Data6 Data7 Data8 Data9
  • Sphinx 中类链接的缩写名称

    seealso Class class apps business models Department Explanation goes here GNU tar manual Basic Tar Format
  • 如何使用 TXMLDocument 将名称空间前缀添加到每个节点

    我使用 XML 绑定向导创建了 TXMLDocument 的后代 此类生成的文件将在根节点中声明名称空间 并为文档的其余部分创建简单的 未经修饰的节点
  • 带有外语数字字段的 MS Access 数据库

    我有一个 MS Access 2007 数据库 我在哥伦比亚和厄瓜多尔的一些客户遇到了一个问题 我相信还会出现更多问题 他们的编号格式与美国不同 他们使用 小数点 或句点 字符作为百万和千位分隔符 并使用 逗号字符作为小数位 这要么导致类型
  • 从嵌套对象数组中删除对象 mongodb

    我收集了包含志愿者信息的集合 并将志愿者列为对象数组 我可以显示每个志愿者的所有班次 但从数组中删除一个对我来说很困难 样本数据 id ObjectId 59180305c19dbaa4ecd9ee59 where Merchandise
  • 如何使用具有相应别名的java代码在密钥库中仅存储公钥?

    我已经创建了密钥库 我只想在密钥库中存储公钥 并且不想存储私钥 因为私钥将位于客户端设备中 并且他将使用rest API共享公钥 另外 我应该如何在一个密钥库中保留多个公钥 具有不同的别名 如果有人有示例代码或示例链接 那将对我很有帮助 这
  • Java 中可靠且快速的 FFT [关闭]

    Closed 这个问题不符合堆栈溢出指南 目前不接受答案 因为我不想自己做 所以我正在寻找一个好的 Java 的 FFT 实现 首先我在这里使用这个FFT普林斯顿但它使用对象 我的分析器告诉我 由于这个事实 它并不是很快 于是我又用谷歌搜索
  • 使用VSTO读取Excel中的ActiveCell内容

    我正在尝试从 Excel 加载项中读取 ActiveCell 但没有走得太远 有人有什么想法吗 Excel Window W this Application ActiveWindow as Excel Window Excel Range
  • 上传图片MVC始终为空

    大家好 我正在尝试上传一个简单的图像 但 HttpPostedFileBase 始终保持为空 这是我的代码 我不知道我做错了什么 这是我在设计视图中的代码 fieldset legend PictureModel legend div cl
  • 常量和 Matlab Coder

    在 Matlab Coder 中运行时 某些函数要求输入为常量 我希望找到一种方法在输入之前将输入声明为常量作为有问题的情况的示例 function foo subsubfunction x y B A butter 1 x y 这将返回错
  • 将地图图钉添加到 Google 地图 Android 的最佳方法

    我已成功添加图钉 但当用户单击地图并提供新位置时需要刷新图钉 我收到错误 请记住 我需要在后台发生此操作 以便它不会影响地图交互 我的问题是 当用户单击地图时 地图图钉列表已经更新 我得到一个ConcurrentModificationEx
  • 使用 HTML5 设置视频播放时长

    我有一个使用 TimeJump js 的简单 HTML5 视频播放器 http davatron5000 github io TimeJump 以允许直接跳转到特定时间代码 IE 跳转到视频的第 25 分钟 我想添加对视频播放时长的限制 因
  • 上传文件[重复]

    这个问题在这里已经有答案了 可能的重复 如何在网页上实现文件上传进度条 Hello 我见过很多网页 用户可以上传文件 并且会得到某种进度作为视觉反馈 水平条 百分比等 我的 html 表单是
  • 通过连接传播 pandas 系列元数据

    我希望能够将元数据附加到一系列数据帧 特别是原始文件名 以便在加入两个数据帧后我可以看到有关每个系列来自何处的元数据 我看到 github 问题有关 metadata here here 包括一些与当前相关的 metadata属性 here
  • 从 .odt 文件填充 QTextDocument

    我正在使用 C 和 Qt 编写一个富文本编辑器 目前 我希望它支持 至少 odt 格式 我发现 QTextDocumentWriter 用于将 QTextDocument 的内容写入文件 但我似乎找不到任何东西可以将其读回到 QTextDo
  • 从类外部访问类属性

    假设我有以下课程 class MyClass public function Talk Say Something return Say 然后我启动了该类的一个实例 Inst new MyClass 现在 我如何在 MyClass 之外调用
  • Pandas 非常简单 分组总大小的百分比

    我在看似极其简单的操作中遇到了麻烦 通过诸如此类的操作从组中获取总数百分比的最简洁方法是什么df groupby col1 size 分组后我的 DF 看起来像这样 我只想要总数的百分比 我记得过去使用过此语句的变体 但现在无法使其工作 p