pandas 将函数应用于多列和多行

2024-01-06

我有一个数据帧，其行和列“xpos”、“ypos”中具有连续的像素坐标，我想计算连续像素之间每条路径的角度（以度为单位）。目前我有下面介绍的解决方案，该解决方案工作正常，并且对于我的文件大小来说足够快，但迭代所有行似乎不是 pandas 的方式。我知道如何将函数应用于不同的列，以及如何将函数应用于不同的列行，但不知道如何将两者结合起来。

这是我的代码：

fix_df = pd.read_csv('fixations_out.csv')

# wyliczanie kąta sakady
temp_list=[]
for count, row in df.iterrows():
    x1 = row['xpos']
    y1 = row['ypos']
    try:
        x2 = df['xpos'].ix[count-1]
        y2 = df['ypos'].ix[count-1]
        a = abs(180/math.pi * math.atan((y2-y1)/(x2-x1)))
        temp_list.append(a)
    except KeyError:
        temp_list.append(np.nan)

然后我将临时列表插入 df

编辑：实施评论中的提示后，我有：

df['diff_x'] = df['xpos'].shift() - df['xpos']
df['diff_y'] = df['ypos'].shift() - df['ypos']

def calc_angle(x):
    try:
        a = abs(180/math.pi * math.atan((x.diff_y)/(x.diff_x)))
        return a
    except ZeroDivisionError:
        return 0

df['angle_degrees'] = df.apply(calc_angle, axis=1)

我比较了我的 df 的三种解决方案的时间（df 的大小约为 6k 行），迭代几乎比 apply 慢 9 倍，比不使用 apply 慢约 1500 倍：

迭代解决方案的执行时间，包括将新列插入回 df：1,51s

没有迭代、有 apply 的解决方案的执行时间：0.17s

EdChum 使用 diff() 接受的答案的执行时间，无需迭代且无需应用：0.001s

建议：不要使用迭代或应用，并始终尝试使用向量化计算；）它不仅更快，而且更具可读性。

您可以通过以下方法来完成此操作，我将 pandas 的方式与您的方式进行了比较，它的速度快了 1000 倍以上，而且无需将列表作为新列添加回来！这是在 10000 行数据帧上完成的

In [108]:

%%timeit
import numpy as np
df['angle'] = np.abs(180/math.pi * np.arctan(df['xpos'].shift() - df['xpos']/df['ypos'].shift() - df['ypos']))

1000 loops, best of 3: 1.27 ms per loop

In [100]:

%%timeit
temp_list=[]
for count, row in df.iterrows():
    x1 = row['xpos']
    y1 = row['ypos']
    try:
        x2 = df['xpos'].ix[count-1]
        y2 = df['ypos'].ix[count-1]
        a = abs(180/math.pi * math.atan((y2-y1)/(x2-x1)))
        temp_list.append(a)
    except KeyError:
        temp_list.append(np.nan)
1 loops, best of 3: 1.29 s per loop

另外，如果可能的话，避免使用apply，因为这是按行操作的，如果您能找到可以在整个系列或数据帧上工作的向量方法，那么总是更喜欢这个。

UPDATE

因为您只是从前一行中进行减法，所以有内置方法diff这会产生更快的代码：

In [117]:

%%timeit
import numpy as np
df['angle'] = np.abs(180/math.pi * np.arctan(df['xpos'].diff(1)/df['ypos'].diff(1)))

1000 loops, best of 3: 1.01 ms per loop

另一个更新

还有一个用于系列和数据帧划分的内置方法，这现在可以节省更多时间，并且我实现了低于 1 毫秒的时间：

In [9]:

%%timeit
import numpy as np
df['angle'] = np.abs(180/math.pi * np.arctan(df['xpos'].diff(1).div(df['ypos'].diff(1))))

1000 loops, best of 3: 951 µs per loop

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

pandas 将函数应用于多列和多行的相关文章

Django Rest Framework 是否有第三方应用程序来自动生成 swagger.yaml 文件？

我有大量的 API 端点编写在django rest framework并且不断增加和更新如何创建和维护最新的 API 文档我当前的版本是 Create swagger yaml文件并以某种方式在每次端点更改时自动生成然后使用此文件作
PyQt 使用 ctrl+Enter 触发按钮

我正在尝试在我的应用程序中触发确定按钮我当前尝试的代码是这样的 self okPushButton setShortcut ctrl Enter 然而它不起作用这是有道理的我尝试查找一些按键序列here http ftp ics
Pycharm 在 os.path 连接上出现“未解析的引用”

将pycharm升级到2018 1 并将python升级到3 6 5后 pycharm报告未解析的引用 join 最新版本的 pycharm 不会显示以下行的任何警告 from os path import join expanduser
Tensorboard SyntaxError：语法无效

当我尝试制作张量板时出现语法错误尽管开源代码我还是无法理解我尝试搜索张量板的代码但不清楚即使我不擅长Python 我这样写路径C Users jh902 Documents logs因为我正在使用 Windows 10 但我不确定
GUI（输入和输出矩阵）？

我需要创建一个 GUI 将数据输入到矩阵或表格中并读取此表单数据完美的解决方案是限制输入表单仅允许float 例如 A 1 02 0 25 0 30 0 515 0 41 1 13 0 15 1 555 0 25 0 14 1 21 2
Python 内置的 super() 是否违反了 DRY？

显然这是有原因的但我没有足够的经验来认识到这一点这是Python中给出的例子docs http docs python org 2 library functions html super class C B def method se
未知错误：Chrome 无法启动：异常退出

当我使用 chromedriver 对 Selenium 运行测试时出现此错误 selenium common exceptions WebDriverException Message unknown error Chrome fail
嵌套作用域和 Lambda

def funct x 4 action lambda n x n return action x funct print x 2 prints 16 我不太明白为什么2会自动分配给n n是返回的匿名函数的参数funct 完全等价的定义fu
当字段是数字时怎么说...在 mongodb 中匹配？

所以我的结果中有一个名为城市的字段结果已损坏有时它是一个实际名称有时它是一个数字以下代码显示所有记录 db zips aggregate project city substr city 0 1 sort city 1 我需要修
如何将 ascii 值列表转换为 python 中的字符串？

我在 Python 程序中有一个列表其中包含一系列数字这些数字本身就是 ASCII 值如何将其转换为可以在屏幕上回显的常规字符串您可能正在寻找 chr gt gt gt L 104 101 108 108 111 44 32 1
Protobuf 如何编码 oneof 消息结构

对于这个 python 程序在编码时运行 protobuf 编码会给出以下输出 0a 10 08 7f8a 0104 08 02 10 0392 0104 08 02 10 03 18 01 我不明白的是为什么8a后面有一个01 为什么9
在 Google App Engine 中，如何避免创建具有相同属性的重复实体？

我正在尝试添加一个事务以避免创建具有相同属性的两个实体在我的应用程序中每次看到新的 Google 用户登录时我都会创建一个新的播放器当新的 Google 用户在几毫秒内进行多个 json 调用时我当前的实现偶尔会创建重复的播放器
带有 LSTM 的 GridSearchCV/RandomizedSearchCV

我一直在尝试通过 RandomizedSearchCV 调整 LSTM 的超参数我的代码如下 X train X train reshape X train shape 0 1 X train shape 1 X test X test
如何使用 AWS Lambda Python 读取 AWS S3 存储的 Word 文档（.doc 和 .docx）文件内容？

我的场景是我尝试使用 python 实现从 Aws Lambda 读取 AWS 存储的 S3 word 文档 doc 和 docx 文件内容下面的代码是我使用的我的问题是我可以获取文件名但无法读取内容 def lambda hand
python 中的“槽包装器”是什么？

object dict 和其他地方的隐藏方法设置为这样的
如何以正确的方式为独立的Python应用程序制作setup.py？

我读过几个类似的主题但还没有成功我觉得我错过或误解了一些基本的事情这就是我失败的原因我有一个用 python 编写的应用程序我想在标准 setup py 的帮助下进行部署由于功能复杂它由不同的 python 模块组成但单独
如果 PyPy 快 6.3 倍，为什么我不应该使用 PyPy 而不是 CPython？

我已经听到很多关于PyPy http en wikipedia org wiki PyPy项目他们声称它比现有技术快 6 3 倍CPython http en wikipedia org wiki CPython口译员开启他们的网站 ht
制作一份 Python 文档的 PDF 文件

Python 官方网站提供 PDF 文档下载但它们是按章节分隔的我下载了源代码并构建了 PDF 文档这些文档也是单独的 PDF 我怎么能够从源代码中的 Makefile 构建一个 PDF 文件我认为这样阅读起来会更方便如果连接单独
如何将 Django 中的权限添加到模型并使用 shell 进行测试

我在模型中添加了 Meta 类并同步了数据库然后在 shell 中创建了一个对象它返回 false 所以我真的无法理解错误在哪里或者缺少什么是否在其他文件中可能存在某种配置 class Employer User Employer in
将索引与值交换的最快方法

考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并

随机推荐

闭包中局部变量的错误行为

我被下面的代码困住了首先我将描述用例使用 ColorGradient 实例调用函数 addPreset 打电话时this listController addItem 名为的回调函数onSelect是提供的每次触发 listCont
错误：useHref() 只能在组件的上下文中使用

当我直接在我的路由器组件中写入我的导航栏组件内容时它工作正常但是当我在导航栏组件中写入该内容时它会生成以下错误错误 useHref 只能在组件上下文中使用我在用着 react dom 17 0 2 react router dom
使用 clang 编译时 openmp 无法正确链接

我已经在 Ubuntu 16 04 上从源代码构建了 clang 4 0 并尝试编译一个简单的 OpenMP 程序但收到以下错误 tmp test 7f2c7c o In function main home me sf shared t
选择两列之间的日期

我需要一个 SQL 查询如果我有两列STARTDATE and END DATE 我想选择日期位于这两个日期之间的所有行例如开始日期 1 1 2011 且结束日期 2 2 2011 SELECT FROM table1 WHERE 2
Laravel 4 中的通用访问器和修改器

我知道可以为各个字段定义访问器和修改器如下所示 public function setSomeAttribute value set the attribute public function getSomeAttribute retur
如何在Java中获取客户端计算机上当前登录用户的用户名？

当用户客户端尝试通过键入 URL 进入应用程序时我需要获取该计算机的 Windows 登录用户名我尝试过System getProperty user name 但是当我从其他机器客户端访问应用程序时这仍然显示服务器上登录用户
如何使用本地安装在node_modules中的包中的可执行文件？

如何在中使用模块的本地版本node js 例如在我的应用程序中我安装了咖啡脚本 npm install coffee script 这会将其安装在 node modules咖啡命令是 node modules bin coffee 当我
如何以编程方式从 UIView 获取约束

我想从 UIView 获取 UILabel 约束但我无法得到任何约束我在 CustomView m 中设置约束如下所示 id initWithFrame CGRect frame self super initWithFrame fr
在 OpenGL3 Core Profile 中使用矩阵作为顶点属性

我在 OSX 上使用 OpenGL 3 2 Core Profile 我想要进行实例化绘图 glDrawArraysInstanced 其中我为每个实例传递一个矩阵我的顶点着色器构建得很好 version 150 in mediump v
LIKE 与 Linq to Entities

我知道 Contains 方法确实喜欢LIKE therm the StartsWith 方法确实喜欢LIKE therm 和 EndsWith 方法就像LIKE therm but 有没有办法像下面那样做 Linq to Entities
Flutter iOS 崩溃并出现 EXC_BAD_ACCESS 错误

我正在使用 Flutter 开发一个应用程序并在物理 iOS 设备 iPhone 7 上测试该应用程序 iOS版本是 15 3 1Flutter版本是 2 10 3 当我测试我的应用程序时偶尔会发生崩溃崩溃给出以下错误它并不总是在同
参数索引超出范围

尝试使用 nhibernate 更新对象时出现以下错误我正在尝试更新一个外键字段有什么想法为什么我可能会收到此错误我无法从该错误中找出答案并且我的 log4net 日志也没有给出任何提示 Thanks System IndexOut
是否可以在重构文本中以两栏样式书写？

我想使用重组文本写一篇研究论文是否可以采用此类文档固有的两栏样式我看了看规格 http docutils sourceforge net docs ref rst restructuredtext html但除了使用桌子这将是一个真正的
检测nuxt中元素外部的点击

我有一个 nuxt 项目我需要编写一个 click outside 指令通过它我可以检测元素的外部点击以关闭它们我该如何实施答案是在插件中创建一个directives js 文件并将其注册到config nuxt js 文件中 di
使用 SWIFT 解析 PDF

我想解析一个没有图像只有文本的 PDF 我正在尝试寻找一些文字例如搜索字符串 Name 并能够读取后面的字符我已经能够打开 PDF 获取页数并循环浏览它们问题是当我想使用类似的函数时CGPDFDictionaryGetStream
Reactjs保存组件的当前状态

我有组件 A 和组件 B 在组件 A 中用户可以将过滤器应用于元素列表并使用侧栏在两个组件之间导航每当用户单击转到 B 然后返回 A 时过滤器就会设置回初始状态保存组件 A 状态的最佳方法是什么以便当他们返回组件 A 时他们可
使用 PowerShell 和 Azure CLI 将代码从 GitLab 存储库部署到 Azure Web App

我想使用 PowerShell 脚本和 Azure CLI 设置从 GitLab 存储库到 Azure 应用程序的持续部署已经有一个答案可以使用Azure RM 模块和 Windows PowerShell https stackover
对需要带有模式的整数的元素使用 JAXB 生成的类

我的 XML 架构中有一个元素定义如下
python QTconsole 的数据隐藏

目前我正在制作一个图像身份验证项目其中我需要借助密钥来验证图像我将钥匙作为raw input用户通过 IPython 控制台我想隐藏正在输入的密钥预期结果 Enter the key or Enter the key nothing
pandas 将函数应用于多列和多行

我有一个数据帧其行和列 xpos ypos 中具有连续的像素坐标我想计算连续像素之间每条路径的角度以度为单位目前我有下面介绍的解决方案该解决方案工作正常并且对于我的文件大小来说足够快但迭代所有行似乎不是 pandas 的方式

pandas 将函数应用于多列和多行

pandas 将函数应用于多列和多行 的相关文章

随机推荐

热门标签

pandas 将函数应用于多列和多行的相关文章