计算pandas数据框中每列值的变化

2023-12-15

有没有什么巧妙的方法来计算 pandas 数据框中每列值的变化次数？

我不想在每一列上循环，例如：

import pandas as pd

frame = pd.DataFrame({
    'time':[1234567000,1234567005,1234567009],
    'X1':[96.32,96.01,96.05],
    'X2':[23.88,23.96,23.96]
},columns=['time','X1','X2']) 

print(frame)

changes = []
for column_name in frame.columns.values:
    print('column_name: {0}'.format(column_name))
    changes.append(sum(frame[column_name]!=frame[column_name].shift(1)))

print('changes: {0}'.format(changes))

returns:

         time     X1     X2
0  1234567000  96.32  23.88
1  1234567005  96.01  23.96
2  1234567009  96.05  23.96
column_name: time
column_name: X1
column_name: X2
changes: [3, 3, 2]

如果值是数字，您可以获取相邻行之间的差异并测试差异是否非零。然后对每列求和以计算值的变化次数：

In [48]: (frame.diff(axis=0) != 0).sum(axis=0)
Out[48]: 
time    3
X1      3
X2      2
dtype: int64

如果值不一定是数字，那么更通用的方法是比较frame反对自己shift-ed 向下一行——这与您发布的代码类似，只是操作是在整个 DataFrame 上完成的，而不是逐列完成的：

In [50]: (frame != frame.shift(axis=0)).sum(axis=0)
Out[50]: 
time    3
X1      3
X2      2
dtype: int64

数字版本更快，移位版本更稳健。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

计算pandas数据框中每列值的变化的相关文章

pandas DataFrame.join 的运行时间是多少（大“O”顺序）？

这个问题更具概念性理论性与非常大的数据集的运行时间有关所以我很抱歉没有一个最小的例子来展示我有一堆来自两个不同传感器的数据帧我需要最终将它们连接成两个very来自两个不同传感器的大数据帧 df snsr1 and df snsr2
嵌套列表的重叠会产生不必要的间隙

我有一个包含三个列表的嵌套这些列表由 for 循环填充并且填充由 if 条件控制第一次迭代后它可能类似于以下示例 a 1 2 0 0 0 0 0 0 4 5 0 0 0 0 0 0 6 7 根据条件它们不重叠在第二次迭代之后新
更好地相当于这个疯狂的嵌套 python for 循环

for a in map for b in map a for c in map b for d in map c for e in map d print a b c d e 上面的代码用于创建图中一定长度的所有路径 map a 表示从
Python 内置的 super() 是否违反了 DRY？

显然这是有原因的但我没有足够的经验来认识到这一点这是Python中给出的例子docs http docs python org 2 library functions html super class C B def method se
Java 和 Python 可以在同一个应用程序中共存吗？

我需要一个 Java 实例直接从 Python 实例数据存储中获取数据我不知道这是否可能数据存储是否透明唯一或者每个实例如果它们确实可以共存都有其单独的数据存储总结一下 Java 应用程序如何从 Python 应用程序的数据存
Django 视图中的“请求”是什么

在 Django 第一个应用程序的 Django 教程中我们有 from django http import HttpResponse def index request return HttpResponse Hello world
尽管我已在 python ctypes 中设置了信号处理程序，但并未调用它

我尝试过使用 sigaction 和 ctypes 设置信号处理程序我知道它可以与python中的信号模块一起使用但我想尝试学习当我向该进程发送 SIGTERM 时但它没有调用我设置的处理程序只打印终止为什么它不调用处理程序
如何将 ascii 值列表转换为 python 中的字符串？

我在 Python 程序中有一个列表其中包含一系列数字这些数字本身就是 ASCII 值如何将其转换为可以在屏幕上回显的常规字符串您可能正在寻找 chr gt gt gt L 104 101 108 108 111 44 32 1
Pandas 组合不同索引的数据帧

我有两个数据框df 1 and df 2具有不同的索引和列但是有一些索引和列重叠我创建了一个数据框df索引和列的并集因此不存在重复的索引或列我想填写数据框df通过以下方式 for x in df index for y in df
Python GTK+ 画布

我目前正在通过 PyGobject 学习 GTK 需要画布之类的东西我已经搜索了文档发现两个小部件似乎可以完成这项工作 GtkDrawingArea 和 GtkLayout 我需要一些基本函数如 fillrect 或 drawline
如何使用 Python 3 检查目录是否包含文件

我到处寻找这个答案但找不到我正在尝试编写一个脚本来搜索特定的子文件夹然后检查它是否包含任何文件如果包含则写出该文件夹的路径我已经弄清楚了子文件夹搜索部分但检查文件却难倒了我我发现了有关如何检查文件夹是否为空的多个建议并且我尝
找到一个数字所属的一组范围

我有一个 200k 行的数字范围列表例如开始位置停止位置该列表包括除了非重叠的重叠之外的所有类型的重叠列表看起来像这样 3 5 10 30 15 25 5 15 25 35 我需要找到给定数字所属的范围并对 100k 个数字重复该
Spider 必须返回 Request、BaseItem、dict 或 None，已“设置”

我正在尝试从以下位置下载所有产品的图像我的蜘蛛看起来像 from shopclues items import ImgData import scrapy class multipleImages scrapy Spider name m
如何使用 AWS Lambda Python 读取 AWS S3 存储的 Word 文档（.doc 和 .docx）文件内容？

我的场景是我尝试使用 python 实现从 Aws Lambda 读取 AWS 存储的 S3 word 文档 doc 和 docx 文件内容下面的代码是我使用的我的问题是我可以获取文件名但无法读取内容 def lambda hand
如何以正确的方式为独立的Python应用程序制作setup.py？

我读过几个类似的主题但还没有成功我觉得我错过或误解了一些基本的事情这就是我失败的原因我有一个用 python 编写的应用程序我想在标准 setup py 的帮助下进行部署由于功能复杂它由不同的 python 模块组成但单独
Firebase Firestore：获取文档的生成 ID (Python)

我可以创建一个新文档带有自动生成的 ID 并存储对其的引用如下所示 my data key value doc ref db collection u campaigns add my data 我可以像这样访问数据本身 print d
如何在 Flask 中的视图函数/会话之间传递复杂对象

我正在编写一个 Web 应用程序当且仅当用户登录时该应用程序从第三方服务器接收大量数据这些数据被解析为自定义对象并存储在list 现在用户在应用程序中使用这些数据调用不同的视图例如发送不同的请求我不确定什么是最好的模式在视
将索引与值交换的最快方法

考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并
python 对浮点数进行不正确的舍入

gt gt gt a 0 3135 gt gt gt print 3f a 0 314 gt gt gt a 0 3125 gt gt gt print 3f a 0 312 gt gt gt 我期待 0 313 而不是 0 312 有没有
NLTK：查找单词大小为 2k 的上下文

我有一个语料库我有一个词对于语料库中该单词的每次出现我想获取一个包含该单词之前的 k 个单词和该单词之后的 k 个单词的列表我在算法上做得很好见下文但我想知道 NLTK 是否提供了一些我错过的功能来满足我的需求 def size

随机推荐

XSD schemaLocation、targetNamespace、默认 XML 命名空间匹配

当我根据 XSD 验证 XML 时出现此错误模式和实例都是有效的我能够在 XML 解析器中验证它们但在 Java 中遇到此错误 cvc elt 1 找不到元素 fieldsMapper 的声明下面是我的架构
JSTL fmt 库抛出 500 错误，需要启用会话吗？

我正在 Google App Engine 上开发一个简单的 servlet JSP 数据驱动的网站我开始在一些数据输入表单上使用 JSTL fmt 库并在使用标签时出现以下与会话相关的错误
共享可分配数组

我有一些可分配的数组需要在一些子例程之间共享我通常只会将它们作为参数传递或者可能将所有内容写入模块中但恐怕在我的情况下这是不可能的我只编写一些自己的子例程并使用 FEM 求解器提供和描述的子例程所以我无法更改此子例程的参数或将它
如何测试 SimpleJdbcCall

我需要为此代码创建测试 Autowired JdbcTemplate jdbcTemplate public List
通过 Javascript 调用时，WCF Web 服务返回“错误请求”错误

我正在尝试通过 javascript 向 WCF Web 服务方法发出 ajax GET 请求该请求每次都会返回 400 错误请求错误但是如果我通过 WCF 测试客户端调用相同的 Web 服务方法它会返回正确的结果此外通过 j
定量和定性解释变量之间相互作用的多元 Logistic 回归

作为后续这个问题我拟合了定量和定性解释变量之间相互作用的多重逻辑回归 MWE 如下 Type lt rep x LETTERS 1 3 each 5 Conc lt rep x seq from 0 to 40 by 10 times 3
隐藏 Access 2016 功能区

我试图在运行时禁用 Access 的所有默认工具栏和功能区到目前为止我遇到的剩余问题是功能区我按照这个教程https msdn microsoft com en us library office ff837012 aspx 但当 A
将实例的一个属性与一组其他实例进行比较

我正在尝试编写一个实例方法Card将单张卡与数组进行比较的类该类具有一些属性例如 shape and color The otherCards数组中充满了此类的其他实例这些实例也有它们的shapes and colors 现在我想编
显示所有打开的 RODBC 连接

有谁知道如何做到这一点 showConnections 不会列出来自 odbcConnect 的任何打开的连接您可以通过以下方式缩小搜索范围这将返回当前环境中 RODBC 类的所有变量 envVariables lt ls bools
MongoDB .Net 驱动程序 2.0 Pull（删除元素）

你能帮我用 2 0 驱动程序正确运行拉删除吗我有一个像这样的集合我想通过关注者字段删除第一个名为 fethiye 的关注者 id ObjectId 554e05dfc90d3d4dfcaa2aea username bodrum
为什么设置 MenuItem.InputGestureText 不会导致当我执行输入手势时激活 MenuItem？

我想实现键盘快捷键MenuItem 我使用了下面的代码
在 #define 宏中转义 # 符号？

在不涉及血淋淋的细节的情况下我想使用 define宏将扩展为 include但符号使预处理器感到困惑因为它认为我想引用一个参数例如我想做这样的事情 define MACRO name include name foo 并这样使用它
在 Azure 上找不到“Microsoft.SqlServer.Types”版本 10 或更高版本

我正在尝试在 ASP NET MVC 4 中创建一个 Web api 该 webapi 使用实体框架 5 空间类型并且我编写了一个非常简单的代码 public List area GetAllAreas List area aList d
在 React 功能组件中使用 Cornerstone.js 中的堆栈滚动工具时，如何访问“currentImageIdIndex”？

我目前正在 React 组件中成功显示一堆图像但不确定在哪里放置事件侦听器以便访问currentImageIdIndex滚动时 import React useEffect useRef useCallback from react im
fancybox 图像上的自定义宽度和高度

我想知道是否可以在 fancybox 图像上设置自定义宽度和高度作为标准 fancybox 的宽度和高度相对于图像的宽度和高度而变化但我希望所有图像的宽度为 800 高度为 600 我想创建一些与 Facebook 上的图像框相似的内容
通过使用最小交换交换相邻元素来对序列进行排序

我们有一个未排序的 N 个数字序列 1 2 3 4 N 我们可以通过按特定顺序交换相邻元素来对整个序列进行排序给定一个序列如何计算对序列进行排序所需的最小可能交换作为示例请考虑序列 4 2 5 3 1 对此进行排序的最佳方法是按以下
使用REGEX用SED解析括号

我正在寻找命令sed它转换这个输入流 dummy key1 key2 dummy key3 dummy key4 dummy dummy key5 dummy dummy dummy key6 dummy key7 dummy 进入这个 k
下一个更高的素数和回文数

是否有关于从给定的整数中求解下一个更高的素数和回文数的建议这是我正在尝试的片段但它有点慢请建议我是否有任何好的算法可以测试 usr bin python def next higher n while True s str n if
报告设计无效。未找到字段 Jasper 报告

我正在尝试创建一个基本的碧玉报告JRBeanCollectionDataSource 在那里我有一个 javabean 内的对象列表 public class Course private int id private List
计算pandas数据框中每列值的变化

有没有什么巧妙的方法来计算 pandas 数据框中每列值的变化次数我不想在每一列上循环例如 import pandas as pd frame pd DataFrame time 1234567000 1234567005 123456

计算pandas数据框中每列值的变化

计算pandas数据框中每列值的变化 的相关文章

随机推荐

热门标签

计算pandas数据框中每列值的变化的相关文章