pandas

如何将 pandas 中的秒数替换为零

我在 pandas 中有以下数据框 code time 1 003002 1 053003 1 060002 1 073001 1 073003 我想在 pandas 中生成以下数据框 code time new time 1 003002

python pandas

带有 pandas 数据框的子图

我想使用 pandas 数据框称为 df 在图上创建多个子图我原来的情节在这里 df plot x month y number title open by month color blue 我在本网站的使用图形和子图部分尝试了多次

python matplotlib pandas subplot

python 基于部分字符串匹配合并两个 pandas 数据框

我是 Python 新手在连接两个 pandas 数据框时遇到很多麻烦因为合并应该基于部分字符串匹配进一步来说我有一个名为的数据框df看起来像这样 writtenAt 2015 01 01T18 31 01 00 00 conten

python string pandas DataFrame

python 或 dask 并行生成器？

是否有可能在Python中也许使用dask 也许使用多重处理将生成器放置在核心上然后并行地单步执行生成器并处理结果它需要特别是生成器或带有 iter 生成器生成的所有生成元素的列表不适合内存尤其有了熊猫我可以打电话rea

python pandas pythonmultiprocessing Dask

Python - Pandas 删除 Excel 中的特定行/列

我有以下 Excel 文件我想清理特定的行列以便我可以进一步处理该文件我已经尝试过这个但我没有设法删除任何空白行我只能设法从包含数据的行中修剪掉在这里我试图只保存第三行及以后的数据 xl pd ExcelFile MRD x

python pandas row datacleaning

创建一个空的 Pandas DataFrame，然后填充它

我从这里的 pandas DataFrame 文档开始数据结构简介 http pandas pydata org pandas docs stable dsintro html 我想用时间序列计算中的值迭代填充 DataFrame 我想用

python pandas DataFrame python27

根据数据类型获取 pandas 数据框列的列表

如果我有一个包含以下列的数据框 1 NAME object 2 On Time object 3 On Budget object 4 actual hr float64 5 Baseline Start Date datetime64 n

python pandas dtype

多列上的 Pandas 数据框布尔掩码

我有一个数据框 df 其中包含具有实际测量值的几列以及相应数量的列 A B 其中每列具有不确定性 dA dB A B dA dB 0 1 3 0 31 0 08 1 2 4 0 263 0 357 2 5 5 0 382 0 397 3 4

python pandas DataFrame Boolean

ValueError：此工作表太大！您的纸张尺寸为：1220054, 3 最大纸张尺寸为：1048576, 16384

我正在尝试转换 txt文件到Excel文件我遇到了以下错误 Traceback most recent call last File C Users haroo501 PycharmProjects MyLiveRobo convert

python Excel pandas

如何使用 python 跳过数据集数据类型错误的行

一直致力于数据集清理和处理数据以进行进一步分析我使用了不同的清理脚本每当数据集列之间出现任何不需要的异常数据时我的脚本就会中止脚本执行会卡住并且其余数据不会得到处理我尝试使用的脚本 import pandas as pd imp

python pandas DataFrame

Pandas 如何在“loc”之后“替换”工作？

我已经尝试了很多次但似乎在使用 loc 后替换不能很好地工作例如我想将 conlumn b 替换为 conlumn a 值为 apple 的行的正则表达式这是我的示例代码 df loc df conlumn a apple co

python pandas

Pandas：将列中的值与唯一值相加

我有数据框 ID time coeff category 111 12 1 5 shop 111 15 1 5 shop 222 12 0 8 shop 222 18 0 8 shop 我需要得到 category unique users

python pandas

Pandas _metadata的DataFrame持久化错误

我终于弄清楚如何使用 DataFrame 中的 metadata 一切正常除了我无法将其持久化例如 hdf5 或 json 我知道它有效因为我复制框架而 metadata 属性复制到非 metadata 属性则不然 example

python pandas metadata pytables

Pandas：条件组特定计算

假设我有一个带有键例如客户 ID 和两个数字列 C1 和 C2 的表我想按键客户对行进行分组并在其列上运行一些聚合器例如 sum 和 Mean 在计算组聚合器之后我想将结果分配回 DataFrame 中的每个客户行因为一些客

python pandas

python 中的聚合时间序列

我们如何按小时或分钟粒度聚合时间序列如果我有如下所示的时间序列那么我希望这些值按小时聚合 pandas 是否支持它或者是否有一种在 python 中实现它的好方法 timestamp value 2012 04 30T22 25 31

python pandas TimeSeries timeserieschart

MemoryError：无法分配具有形状和数据类型对象的数组

我想在两个数据集之间执行内部联接如下所示 theme ids head id Loan Theme ID Loan Theme Type Partner ID 0 638631 a1050000000skGl General 151 1

python pandas NumPy

nunique 排除 pandas 中的某些值

我正在计算每行的唯一值但是我想排除值 0 然后计算唯一值 d col1 1 2 3 col2 3 4 0 col3 0 4 0 df pd DataFrame data d df col1 col2 col3 0 1 3 0 1 2 4

python pandas DataFrame

Pandas 使用 XLSX Writer - 恒定内存/内存中表现出色

我正在使用熊猫和xlsxwriter在 AWS lambda 中创建 Excel 报告我遇到了一个问题创建 60MB 区域内相当大的 Excel 文件时磁盘空间已满但还有 512MB 的可用磁盘空间我一直在试图弄清楚发生这种情况的

pandas xlsxwriter

将 pandas DataFrame 制作为 dict 并 dropna

我有一些带有 NaN 的 pandas DataFrame 像这样 import pandas as pd import numpy as np raw data A 1 2 2 3 3 4 B 1 np nan 2 44 3 np nan

python pandas

如何使用seaborn在分类数据上获取条形图上的标签值

下面显示的是用于获取 seaborn 上分类数据的条形字符的语法 import seaborn as sn import matplotlib as mpl import matplotlib pyplot as plt IN data c

python pandas NumPy matplotlib Seaborn