Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
使用 NumPy 函数计算 Pandas 的加权平均值
假设我们有一个像这样的 pandas 数据框 a b id 36 25 2 40 25 3 46 23 2 40 22 5 42 20 5 56 39 3 我想执行一个操作 a div b 然后按 id 分组 最后使用 a 作为权重计算加权
python
python3x
pandas
NumPy
weightedaverage
联合超过 2 个 pandas 数据框
我正在尝试将 sql 查询转换为 python sql语句如下 select from table 1 union select from table 2 union select from table 3 union select fro
python
join
pandas
MERGE
concatenation
在查找表中查找字符串值以填充第二个数据帧
我有两个数据框 main df header 1 0 value 1 1 value 2 2 value 3 3 value 1 和一个查找数据框lookup df header 1 header 2 0 value 1 lookup va
python
python3x
pandas
vlookup
在 Pandas 中,.iloc 方法是否提供副本或视图?
我发现结果有点随机 有时它是副本 有时它是视图 例如 df pd DataFrame name Marry age 21 name John age 24 index student1 student2 df age name studen
python
pandas
DataFrame
相当于 pandas 'transform' 的 SQL 是什么?
假设您有以下 SQL 表 A B C 2 1 4 3 4 5 3 1 1 1 4 0 5 0 1 并且您想要添加 显示一个列 其中包含 A 列对于 B 列的每个不同值的平均值 或任何其他聚合函数 您想要保留所有列 所以结果会是这样的 A B
mysql
sql
pandas
psql
从 MySQL 将数字数据加载到 python/pandas/numpy 数组的最快方法
我想从 MySQL 表中读取一些数字 双精度 即 float64 数据 数据大小约为 200k 行 MATLAB 参考 tic feature accel off conn database c fetch exec conn select
python
mysql
NumPy
pandas
MySQLPython
多索引上的 pandas dataframe groupby
我正在使用 Pandas dataframe 来读取 Excel 文件并对其进行一些操作 我有一个包含多行的标题 现在我想按几个列值进行分组 但是我无法找到解决方案 Excel 示例 name address contact info fi
python
python27
pandas
DataFrame
如何使用 iloc[] 选择 pandas 数据帧的倒数第二行?
我从网上获取数据并将该数据存储在 pandas 数据框中 但问题是数据帧格式每次都不相同 主要是行数 Print df shape Output 100 9 Print df shape Output 33 9 Print df shape
python
python3x
pandas
DataFrame
row
python pandas重命名列名开头
我有多个具有统一列名的 Excel 文件 除了一个 一个文件将其称为 EndOfMarchStatus 另一个文件将其称为 EndofAprilStatus 依此类推 我需要将列名称更改为 EndofMonthStatus 我确实找不到与这
python
pandas
rename
wildcard
startswith
idxmax() 不适用于包含 NaN 的 SeriesGroupBy
这是我的代码 from pandas import DataFrame Series import pandas as pd import numpy as np income DataFrame name Adam Bill Chris
python
pandas
如果 dtype 是类别,pivot_table 需要更多内存(MemoryError)
我对 pandas pandas 0 23 1 有以下奇怪的错误 import pandas as pd df pd DataFrame t1 a b c 10000 t2 x y z 10000 i1 list range 5000 6
python
python3x
pandas
DataFrame
尽管格式正确,熊猫仍无法推断时间序列频率?
我有以下数据框 1 df index 1 DatetimeIndex 1981 01 01 1981 01 02 1981 01 03 1981 01 04 1981 01 05 1981 01 06 1981 01 07 1981 01
python
python3x
pandas
datetime
Python datetime.now() 和填充日期的 Series 之间的年数差异?
我想在我的数据集中创建一个新列 该列与今天和数据集中已有的另一列 填充了日期 之间有几年的差异 上面的代码 df diff years datetime today df some date df diff years 给我以下输出 示例
python
pandas
datetime
series
datedifference
Pandas 将系列元素打印为“repr”而不是“str”
当你print a Series与 dtypeobject or string 这些元素会被打印 就像您调用一样str 例如 print pd Series a b c yields 0 a 1 b 2 c dtype object 是否可
python
pandas
将 pandas Dataframe 的列乘以不同的标量
我有一个熊猫数据框df有柱子col 1 col 2 col n 我想将 pandas Dataframe 的每一列乘以基于该列的不同标量 例如 将中的每个元素相乘col 1 by n 1 中的每个元素col 2 by n 2 etc 做到这
python
pandas
DataFrame
Python 根据双索引中的星期几创建虚拟变量
我有一个带有双索引 日期 时间 的数据框 并且希望创建新列 星期一 星期二 星期三 等 如果索引日在正确的日期 则等于 1 我的原始数据框 Visitor Date Time 2017 09 11 4 45 0 5 00 1 5 15 26
python
pandas
DataFrame
dayofweek
dummyvariable
使用 & / np.where() / np.any() 比较 Pandas 中多个列的布尔行值
我有一个数据框 如下所示 a A a B a C a D a E a F p A p B p C p D p E p F 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 2 0 1 0
python
pandas
NumPy
Boolean
any
如何在 pandas 数据框中的每一行上运行函数并在满足条件时停止它
我有一个 DataFrame 我在每一行上运行一个函数 该函数比较行中的值 一旦满足条件 行元素之一就会添加到字典中 此时我想结束该函数 它不是传统的循环 所以我不能使用break 我应该使用不同的方法将该函数应用于每一行还是有办法停止ap
python
pandas
NumPy
DataFrame
熊猫根据日期获取年龄(例如:出生日期)
如何计算一个人的年龄 基于 dob 列 并使用新值向数据框中添加一列 数据框如下所示 lname fname dob 0 DOE LAURIE 03011979 1 BOURNE JASON 06111978 2 GRINCH XMAS 1
python
pandas
在 Pandas 和 Numpy Python 中保留 Nan 的同时进行值比较的更优雅的方式
所以基本上我想要5 gt np nan return np nan或南代替FALSE在 pandas 系列中 代码如下 import pandas as pd import numpy as np a pd DataFrame x 1 2
python
pandas
«
1 ...
4
5
6
7
8
9
10
...100
»