Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
如何将 pandas 中的秒数替换为零
我在 pandas 中有以下数据框 code time 1 003002 1 053003 1 060002 1 073001 1 073003 我想在 pandas 中生成以下数据框 code time new time 1 003002
python
pandas
带有 pandas 数据框的子图
我想使用 pandas 数据框 称为 df 在图上创建多个子图 我原来的情节在这里 df plot x month y number title open by month color blue 我在本网站的 使用图形和子图 部分尝试了多次
python
matplotlib
pandas
subplot
python 基于部分字符串匹配合并两个 pandas 数据框
我是 Python 新手 在连接两个 pandas 数据框时遇到很多麻烦 因为合并应该基于部分字符串匹配 进一步来说 我有一个名为的数据框df看起来像这样 writtenAt 2015 01 01T18 31 01 00 00 conten
python
string
pandas
DataFrame
python 或 dask 并行生成器?
是否有可能在Python中 也许使用dask 也许使用多重处理 将生成器 放置 在核心上 然后并行地单步执行生成器并处理结果 它需要特别是生成器 或带有 iter 生成器生成的所有生成元素的列表不适合内存 尤其 有了熊猫 我可以打电话rea
python
pandas
pythonmultiprocessing
Dask
Python - Pandas 删除 Excel 中的特定行/列
我有以下 Excel 文件 我想清理特定的行 列 以便我可以进一步处理该文件 我已经尝试过这个 但我没有设法删除任何空白行 我只能设法从包含数据的行中修剪掉 在这里 我试图只保存第三行及以后的数据 xl pd ExcelFile MRD x
python
pandas
row
datacleaning
创建一个空的 Pandas DataFrame,然后填充它
我从这里的 pandas DataFrame 文档开始 数据结构简介 http pandas pydata org pandas docs stable dsintro html 我想用时间序列计算中的值迭代填充 DataFrame 我想用
python
pandas
DataFrame
python27
根据数据类型获取 pandas 数据框列的列表
如果我有一个包含以下列的数据框 1 NAME object 2 On Time object 3 On Budget object 4 actual hr float64 5 Baseline Start Date datetime64 n
python
pandas
dtype
多列上的 Pandas 数据框布尔掩码
我有一个数据框 df 其中包含具有实际测量值的几列以及相应数量的列 A B 其中每列具有不确定性 dA dB A B dA dB 0 1 3 0 31 0 08 1 2 4 0 263 0 357 2 5 5 0 382 0 397 3 4
python
pandas
DataFrame
Boolean
ValueError:此工作表太大!您的纸张尺寸为:1220054, 3 最大纸张尺寸为:1048576, 16384
我正在尝试转换 txt文件到Excel文件 我遇到了以下错误 Traceback most recent call last File C Users haroo501 PycharmProjects MyLiveRobo convert
python
Excel
pandas
如何使用 python 跳过数据集数据类型错误的行
一直致力于数据集清理和处理数据以进行进一步分析 我使用了不同的清理脚本 每当数据集列之间出现任何不需要的 异常数据时 我的脚本就会中止 脚本执行会卡住并且其余数据不会得到处理 我尝试使用的脚本 import pandas as pd imp
python
pandas
DataFrame
Pandas 如何在“loc”之后“替换”工作?
我已经尝试了很多次 但似乎在使用 loc 后 替换 不能很好地工作 例如 我想将 conlumn b 替换为 conlumn a 值为 apple 的行的正则表达式 这是我的示例代码 df loc df conlumn a apple co
python
pandas
Pandas:将列中的值与唯一值相加
我有数据框 ID time coeff category 111 12 1 5 shop 111 15 1 5 shop 222 12 0 8 shop 222 18 0 8 shop 我需要得到 category unique users
python
pandas
Pandas _metadata的DataFrame持久化错误
我终于弄清楚如何使用 DataFrame 中的 metadata 一切正常 除了我无法将其持久化 例如 hdf5 或 json 我知道它有效 因为我复制框架 而 metadata 属性复制到 非 metadata 属性则不然 example
python
pandas
metadata
pytables
Pandas:条件组特定计算
假设我有一个带有键 例如客户 ID 和两个数字列 C1 和 C2 的表 我想按键 客户 对行进行分组 并在其列上运行一些聚合器 例如 sum 和 Mean 在计算组聚合器之后 我想将结果分配回 DataFrame 中的每个客户行 因为一些客
python
pandas
python 中的聚合时间序列
我们如何按小时或分钟粒度聚合时间序列 如果我有如下所示的时间序列 那么我希望这些值按小时聚合 pandas 是否支持它 或者是否有一种在 python 中实现它的好方法 timestamp value 2012 04 30T22 25 31
python
pandas
TimeSeries
timeserieschart
MemoryError:无法分配具有形状和数据类型对象的数组
我想在两个数据集之间执行内部联接 如下所示 theme ids head id Loan Theme ID Loan Theme Type Partner ID 0 638631 a1050000000skGl General 151 1
python
pandas
NumPy
nunique 排除 pandas 中的某些值
我正在计算每行的唯一值 但是我想排除值 0 然后计算唯一值 d col1 1 2 3 col2 3 4 0 col3 0 4 0 df pd DataFrame data d df col1 col2 col3 0 1 3 0 1 2 4
python
pandas
DataFrame
Pandas 使用 XLSX Writer - 恒定内存/内存中表现出色
我正在使用熊猫和xlsxwriter在 AWS lambda 中创建 Excel 报告 我遇到了一个问题 创建 60MB 区域内相当大的 Excel 文件时 磁盘空间已满 但还有 512MB 的可用磁盘空间 我一直在试图弄清楚发生这种情况的
pandas
xlsxwriter
将 pandas DataFrame 制作为 dict 并 dropna
我有一些带有 NaN 的 pandas DataFrame 像这样 import pandas as pd import numpy as np raw data A 1 2 2 3 3 4 B 1 np nan 2 44 3 np nan
python
pandas
如何使用seaborn在分类数据上获取条形图上的标签值
下面显示的是用于获取 seaborn 上分类数据的条形字符的语法 import seaborn as sn import matplotlib as mpl import matplotlib pyplot as plt IN data c
python
pandas
NumPy
matplotlib
Seaborn
«
1 ...
90
91
92
93
94
95
96
...100
»