pandas

计算每行中缺失/NaN 的数量

我有一个包含大量行的数据集有些值为 NaN 如下所示 In 91 df Out 91 1 3 1 1 1 1 3 1 1 1 2 3 1 1 1 1 1 NaN NaN NaN 1 3 1 1 1 1 1 1 1 1 我想计算每行中 Na

python pandas DataFrame count NaN

熊猫显示所有行的组总和[重复]

这个问题在这里已经有答案了给定以下数据框 col a col b tosum b 5 b 5 b 1 c 6 c 3 a 2 a 2 我想显示所有行上每个 col 组的总和如下所示 col a col b tosum group sum

python3x pandas groupby Sum

列标题中的多个分隔符也会分隔行值

我在读取文件时遇到了一些关于定义多个分隔符的问题最初在我之前的帖子中解决了读取列标题中带有多个分隔符的文件并跳过某些行 https stackoverflow com questions 45695040 reading files wi

python pandas delimiter csv

具有重复组名称的长到宽转换[重复]

这个问题在这里已经有答案了我需要将以下数据从长格式转换为宽格式问题是该组的名称可能重复另外重复条目的数量未知因此我也需要考虑到这一点这是期望的结果 desired data 1 Joe Tell 111 222 3333 Al

python3x pandas

pandas直方图绘图错误：ValueError：num必须是1 <= num <= 0，而不是1

我正在从 pandas 数据框中绘制一列的直方图 matplotlib notebook import matplotlib pyplot as plt import matplotlib df hist column column A b

pandas DataFrame Histogram

pandas groupby 对象的聚合

我正在尝试从数据块的 groupby 对象中聚合一些统计信息我必须对数据进行分块因为有很多 1800 万行我想找到每个块中每个组的行数然后将它们加在一起我可以添加 groupby 对象但当一项中不存在组时结果为 NaN 看这

python pandas

将 Pandas 绘制成子图

da 是我的数据框我想把这个图变成我将拥有的 2 个子图中的一个当我为这个图添加 plt subplots 2 1 2 时它最终会将该图分成一个单独的图并且子图是一个空图我怎样才能把这段代码变成一个子图 Thank you in

python pandas matplotlib

将一个系列分配给 Pandas DataFrame 的几行

我有一个用索引和列准备的 pandas DataFrame 所有值都是 NaN 现在我计算了一个结果该结果可用于 DataFrame 的多行并且我想一次将它们全部分配这可以通过循环来完成但我很确定这个分配可以一次完成这是一个场景

python pandas

从 pandas 数据框中删除“重叠”日期

我有一个 pandas 数据框如下所示 ID date close 1 09 15 07 123 45 2 06 01 08 130 13 3 10 25 08 132 01 4 05 13 09 118 34 5 11 07 09 14

python pandas

大熊猫数据框并行处理

我正在访问一个非常大的 Pandas 数据框作为全局变量该变量通过并行访问joblib https pythonhosted org joblib parallel html Eg df db query select id a lot

python pandas joblib

在 Pandas 中加载通用 Google 电子表格

当我尝试在 pandas 中加载 Google 电子表格时 from StringIO import StringIO import requests r requests get https docs google com spreads

python pandas gdata

如何加快大型 xlsx 文件的导入速度？

我想要处理一个 200MB 的大型 Excel xlsx 文件包含 15 个工作表和 100 万行每行 5 列并根据数据创建 pandas 数据框 Excel 文件的导入速度非常慢最多 10 分钟不幸的是 Excel 导入文件格式

python pandas openpyxl Dask xlrd

GroupBy 列标题前缀上的列

我有一个数据框其列名以一组前缀列表开头我想获取数据框中按以相同前缀开头的列分组的值的总和 df pd DataFrame 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 columns abc abd wxy wxz p

python pandas DataFrame groupby pandasgroupby

Pandas GroupBy 中的计数和连接整数

假设这是我的 df A B C 0 a 33 13 1 b 44 14 2 a 55 15 3 a 66 16 4 b 77 17 5 c 88 18 我尝试得到这样的东西 A B B C count list sum 0 a 3 33 5

python pandas concatenation pandasgroupby

pandas 对布尔类型应用过滤器

这些是我的 DataFrame 的类型 count int64 word object cat1 bool cat2 object cat3 bool dtype object 如何对 cat1 和 cat2 中的布尔值进行过滤就像是 d

python pandas

将 Pandas Dataframe 导出为 CSV

这是一个关于如何允许用户在 Python 3 中将 Pandas 数据框导出为 CSV 格式的问题对于上下文我有一个 Djangoview接受来自 jQuery 的 POST 请求这样当用户单击我网站上的按钮时就会触发对该 Djan

python pandas DataFrame csv

在 Pandas Dataframe 中聚合、转置和提取价值

Input DF ID Time Value 0 1 5 0 2 7 0 3 8 1 1 1 1 2 4 1 3 6 Output DF 1 2 3 0 5 7 8 1 1 4 6 Goal 我目前有类似于输入 DF 的东西并且希望将其转

python pandas

GroupBy - 如何使用 diff() 从 DateTime 中提取秒数

我有以下数据框 In 372 df 2 Out 372 A ID3 DATETIME 0 B 028 b76cd912ff 2014 10 08 13 43 27 1 B 054 4a57ed0b02 2014 10 08 14 26 19

python python3x pandas DataFrame

从 pandas 数据框的列或行获取列表？

我有一个数据框df从 Excel 文档导入如下所示 cluster load date budget actual fixed price A 1 1 2014 1000 4000 Y A 2 1 2014 12000 10000 Y A

python pandas list DataFrame

Pandas GroupBy 和计算 Z 分数 [重复]

这个问题在这里已经有答案了所以我有一个如下所示的数据框 pd DataFrame 1 10 14 1 12 14 1 20 12 1 25 12 2 18 12 2 30 14 2 4 12 2 10 14 columns A B C A

python pandas