Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
计算每行中缺失/NaN 的数量
我有一个包含大量行的数据集 有些值为 NaN 如下所示 In 91 df Out 91 1 3 1 1 1 1 3 1 1 1 2 3 1 1 1 1 1 NaN NaN NaN 1 3 1 1 1 1 1 1 1 1 我想计算每行中 Na
python
pandas
DataFrame
count
NaN
熊猫显示所有行的组总和[重复]
这个问题在这里已经有答案了 给定以下数据框 col a col b tosum b 5 b 5 b 1 c 6 c 3 a 2 a 2 我想显示所有行上每个 col 组的总和 如下所示 col a col b tosum group sum
python3x
pandas
groupby
Sum
列标题中的多个分隔符也会分隔行值
我在读取文件时遇到了一些关于定义多个分隔符的问题 最初在我之前的帖子中解决了读取列标题中带有多个分隔符的文件并跳过某些行 https stackoverflow com questions 45695040 reading files wi
python
pandas
delimiter
csv
具有重复组名称的长到宽转换[重复]
这个问题在这里已经有答案了 我需要将以下数据从长格式转换为宽格式 问题是该组的名称可能重复 另外 重复条目的数量未知 因此我也需要考虑到这一点 这是期望的结果 desired data 1 Joe Tell 111 222 3333 Al
python3x
pandas
pandas直方图绘图错误:ValueError:num必须是1 <= num <= 0,而不是1
我正在从 pandas 数据框中绘制一列的直方图 matplotlib notebook import matplotlib pyplot as plt import matplotlib df hist column column A b
pandas
DataFrame
Histogram
pandas groupby 对象的聚合
我正在尝试从数据块的 groupby 对象中聚合一些统计信息 我必须对数据进行分块 因为有很多 1800 万 行 我想找到每个块中每个组的行数 然后将它们加在一起 我可以添加 groupby 对象 但当一项中不存在组时 结果为 NaN 看这
python
pandas
将 Pandas 绘制成子图
da 是我的数据框 我想把这个图变成我将拥有的 2 个子图中的一个 当我为这个图添加 plt subplots 2 1 2 时 它最终会将该图分成一个单独的图 并且子图是一个空图 我怎样才能把这段代码变成一个子图 Thank you in
python
pandas
matplotlib
将一个系列分配给 Pandas DataFrame 的几行
我有一个用索引和列准备的 pandas DataFrame 所有值都是 NaN 现在我计算了一个结果 该结果可用于 DataFrame 的多行 并且我想一次将它们全部分配 这可以通过循环来完成 但我很确定这个分配可以一次完成 这是一个场景
python
pandas
从 pandas 数据框中删除“重叠”日期
我有一个 pandas 数据框 如下所示 ID date close 1 09 15 07 123 45 2 06 01 08 130 13 3 10 25 08 132 01 4 05 13 09 118 34 5 11 07 09 14
python
pandas
大熊猫数据框并行处理
我正在访问一个非常大的 Pandas 数据框作为全局变量 该变量通过并行访问joblib https pythonhosted org joblib parallel html Eg df db query select id a lot
python
pandas
joblib
在 Pandas 中加载通用 Google 电子表格
当我尝试在 pandas 中加载 Google 电子表格时 from StringIO import StringIO import requests r requests get https docs google com spreads
python
pandas
gdata
如何加快大型 xlsx 文件的导入速度?
我想要处理一个 200MB 的大型 Excel xlsx 文件 包含 15 个工作表和 100 万行 每行 5 列 并根据数据创建 pandas 数据框 Excel 文件的导入速度非常慢 最多 10 分钟 不幸的是 Excel 导入文件格式
python
pandas
openpyxl
Dask
xlrd
GroupBy 列标题前缀上的列
我有一个数据框 其列名以一组前缀列表开头 我想获取数据框中按以相同前缀开头的列分组的值的总和 df pd DataFrame 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 columns abc abd wxy wxz p
python
pandas
DataFrame
groupby
pandasgroupby
Pandas GroupBy 中的计数和连接整数
假设这是我的 df A B C 0 a 33 13 1 b 44 14 2 a 55 15 3 a 66 16 4 b 77 17 5 c 88 18 我尝试得到这样的东西 A B B C count list sum 0 a 3 33 5
python
pandas
concatenation
pandasgroupby
pandas 对布尔类型应用过滤器
这些是我的 DataFrame 的类型 count int64 word object cat1 bool cat2 object cat3 bool dtype object 如何对 cat1 和 cat2 中的布尔值进行过滤 就像是 d
python
pandas
将 Pandas Dataframe 导出为 CSV
这是一个关于如何允许用户在 Python 3 中将 Pandas 数据框导出为 CSV 格式的问题 对于上下文 我有一个 Djangoview接受来自 jQuery 的 POST 请求 这样当用户单击我网站上的按钮时 就会触发对该 Djan
python
pandas
DataFrame
csv
在 Pandas Dataframe 中聚合、转置和提取价值
Input DF ID Time Value 0 1 5 0 2 7 0 3 8 1 1 1 1 2 4 1 3 6 Output DF 1 2 3 0 5 7 8 1 1 4 6 Goal 我目前有类似于输入 DF 的东西 并且希望将其转
python
pandas
GroupBy - 如何使用 diff() 从 DateTime 中提取秒数
我有以下数据框 In 372 df 2 Out 372 A ID3 DATETIME 0 B 028 b76cd912ff 2014 10 08 13 43 27 1 B 054 4a57ed0b02 2014 10 08 14 26 19
python
python3x
pandas
DataFrame
从 pandas 数据框的列或行获取列表?
我有一个数据框df从 Excel 文档导入 如下所示 cluster load date budget actual fixed price A 1 1 2014 1000 4000 Y A 2 1 2014 12000 10000 Y A
python
pandas
list
DataFrame
Pandas GroupBy 和计算 Z 分数 [重复]
这个问题在这里已经有答案了 所以我有一个如下所示的数据框 pd DataFrame 1 10 14 1 12 14 1 20 12 1 25 12 2 18 12 2 30 14 2 4 12 2 10 14 columns A B C A
python
pandas
«
1 ...
94
95
96
97
98
99
100
»