pandas

使用 NumPy 函数计算 Pandas 的加权平均值

假设我们有一个像这样的 pandas 数据框 a b id 36 25 2 40 25 3 46 23 2 40 22 5 42 20 5 56 39 3 我想执行一个操作 a div b 然后按 id 分组最后使用 a 作为权重计算加权

python python3x pandas NumPy weightedaverage

联合超过 2 个 pandas 数据框

我正在尝试将 sql 查询转换为 python sql语句如下 select from table 1 union select from table 2 union select from table 3 union select fro

python join pandas MERGE concatenation

在查找表中查找字符串值以填充第二个数据帧

我有两个数据框 main df header 1 0 value 1 1 value 2 2 value 3 3 value 1 和一个查找数据框lookup df header 1 header 2 0 value 1 lookup va

python python3x pandas vlookup

在 Pandas 中，.iloc 方法是否提供副本或视图？

我发现结果有点随机有时它是副本有时它是视图例如 df pd DataFrame name Marry age 21 name John age 24 index student1 student2 df age name studen

python pandas DataFrame

相当于 pandas 'transform' 的 SQL 是什么？

假设您有以下 SQL 表 A B C 2 1 4 3 4 5 3 1 1 1 4 0 5 0 1 并且您想要添加显示一个列其中包含 A 列对于 B 列的每个不同值的平均值或任何其他聚合函数您想要保留所有列所以结果会是这样的 A B

mysql sql pandas psql

从 MySQL 将数字数据加载到 python/pandas/numpy 数组的最快方法

我想从 MySQL 表中读取一些数字双精度即 float64 数据数据大小约为 200k 行 MATLAB 参考 tic feature accel off conn database c fetch exec conn select

python mysql NumPy pandas MySQLPython

多索引上的 pandas dataframe groupby

我正在使用 Pandas dataframe 来读取 Excel 文件并对其进行一些操作我有一个包含多行的标题现在我想按几个列值进行分组但是我无法找到解决方案 Excel 示例 name address contact info fi

python python27 pandas DataFrame

如何使用 iloc[] 选择 pandas 数据帧的倒数第二行？

我从网上获取数据并将该数据存储在 pandas 数据框中但问题是数据帧格式每次都不相同主要是行数 Print df shape Output 100 9 Print df shape Output 33 9 Print df shape

python python3x pandas DataFrame row

python pandas重命名列名开头

我有多个具有统一列名的 Excel 文件除了一个一个文件将其称为 EndOfMarchStatus 另一个文件将其称为 EndofAprilStatus 依此类推我需要将列名称更改为 EndofMonthStatus 我确实找不到与这

python pandas rename wildcard startswith

idxmax() 不适用于包含 NaN 的 SeriesGroupBy

这是我的代码 from pandas import DataFrame Series import pandas as pd import numpy as np income DataFrame name Adam Bill Chris

python pandas

如果 dtype 是类别，pivot_table 需要更多内存（MemoryError）

我对 pandas pandas 0 23 1 有以下奇怪的错误 import pandas as pd df pd DataFrame t1 a b c 10000 t2 x y z 10000 i1 list range 5000 6

python python3x pandas DataFrame

尽管格式正确，熊猫仍无法推断时间序列频率？

我有以下数据框 1 df index 1 DatetimeIndex 1981 01 01 1981 01 02 1981 01 03 1981 01 04 1981 01 05 1981 01 06 1981 01 07 1981 01

python python3x pandas datetime

Python datetime.now() 和填充日期的 Series 之间的年数差异？

我想在我的数据集中创建一个新列该列与今天和数据集中已有的另一列填充了日期之间有几年的差异上面的代码 df diff years datetime today df some date df diff years 给我以下输出示例

python pandas datetime series datedifference

Pandas 将系列元素打印为“repr”而不是“str”

当你print a Series与 dtypeobject or string 这些元素会被打印就像您调用一样str 例如 print pd Series a b c yields 0 a 1 b 2 c dtype object 是否可

python pandas

将 pandas Dataframe 的列乘以不同的标量

我有一个熊猫数据框df有柱子col 1 col 2 col n 我想将 pandas Dataframe 的每一列乘以基于该列的不同标量例如将中的每个元素相乘col 1 by n 1 中的每个元素col 2 by n 2 etc 做到这

python pandas DataFrame

Python 根据双索引中的星期几创建虚拟变量

我有一个带有双索引日期时间的数据框并且希望创建新列星期一星期二星期三等如果索引日在正确的日期则等于 1 我的原始数据框 Visitor Date Time 2017 09 11 4 45 0 5 00 1 5 15 26

python pandas DataFrame dayofweek dummyvariable

使用 & / np.where() / np.any() 比较 Pandas 中多个列的布尔行值

我有一个数据框如下所示 a A a B a C a D a E a F p A p B p C p D p E p F 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 2 0 1 0

python pandas NumPy Boolean any

如何在 pandas 数据框中的每一行上运行函数并在满足条件时停止它

我有一个 DataFrame 我在每一行上运行一个函数该函数比较行中的值一旦满足条件行元素之一就会添加到字典中此时我想结束该函数它不是传统的循环所以我不能使用break 我应该使用不同的方法将该函数应用于每一行还是有办法停止ap

python pandas NumPy DataFrame

熊猫根据日期获取年龄（例如：出生日期）

如何计算一个人的年龄基于 dob 列并使用新值向数据框中添加一列数据框如下所示 lname fname dob 0 DOE LAURIE 03011979 1 BOURNE JASON 06111978 2 GRINCH XMAS 1

python pandas

在 Pandas 和 Numpy Python 中保留 Nan 的同时进行值比较的更优雅的方式

所以基本上我想要5 gt np nan return np nan或南代替FALSE在 pandas 系列中代码如下 import pandas as pd import numpy as np a pd DataFrame x 1 2

python pandas