如何判断 Pandas 中的值是否随维度变化

2023-12-09

假设我有一些特定日期的客户数据，我想看看他们的地址是否已更改。超过那些日期。理想情况下，我想将发生更改的两列复制到新表中，或者只是获取总更改量的指标。

所以，如果我有一张像这样的桌子

Date , Customer , Address
12/31/14, Cust1, 12 Rocky Hill Rd
12/31/15, Cust1, 12 Rocky Hill Rd
12/31/16, Cust1, 14 Rocky Hill Rd
12/31/14, Cust2, 12 Testing Rd
12/31/15, Cust2, 12 Testing Ln
12/31/16, Cust2, 12 Testing Rd

我最终会计算出两次变更，客户 1 在 12/31/15 和 12/31/16 之间在 12 Rocky Hill Rd 之间进行的变更，以及 Cust2 在 12/31/14 和 12/31/15 之间进行的变更。

理想情况下我能得到一张这样的桌子

Dates , Customer , Change
12/31/15 to 12/31/16, Cust1, 12 Rocky Hill Rd to 14 Rocky Hill Rd
12/31/14 to 12/31/15, Cust2, 12 Testing Rd to 12 Testing Ln

或者甚至只是更改总数就很好了。有任何想法吗？理想情况下，我会有更多的日期，可能在这些日期之间进行多次更改，并且可能还有我想检查更改的其他列。实际上，只需对每列在某个日期期间内对客户记录的更改进行汇总就足够了。

我是熊猫的新手，不太确定从哪里开始。

编辑：正如我在下面的解决方案中指出的那样，我希望能够传递更大的数据帧，其中不仅仅是一个地址来检测更改。例如，我在 R 中通过以下内容完成了此操作： `在此处输入代码

`#How many changes have occured (unique values - 1)
UniLen <-  function(x){
  x <- length(unique(x))-1
  return(x)
}
#Create a vector of Address Features to check for changes in
Address_Features <- c("AddrLine1", "AddrLine2", "AddrLine3", "CityName", "State", "ZipCodeNum", "County")
#Check for changes in each address 'use this address for description' for each customer
AddressChanges_Detail <- mktData[,c("CustomerNumEID","AddressUniqueRelationDesc",Address_Features)] %>%
  group_by(CustomerNumEID, AddressUniqueRelationDesc) %>%
  summarise_each(funs(UniLen))

#Summarise results (how many changes for each feature)
AddressChanges_Summary <- AddressChanges_Detail[,Address_Features] %>%
  summarise_each(funs(sum))

这使我们能够计算发生了多少更改，但我错过了更改发生的日期以及功能的更改来源和更改内容...看来您提出的 Python 解决方案通过使用解决了这个问题.shift 而不仅仅是某个组的唯一值的摘要。理想情况下，我想要两全其美:)。

df

输入数据框

    Date    Customer    Address
0   12/31/14    Cust1   12 Rocky Hill Rd
1   12/31/15    Cust1   12 Rocky Hill Rd
2   12/31/16    Cust1   14 Rocky Hill Rd
3   12/31/14    Cust2   12 Testing Rd
4   12/31/15    Cust2   12 Testing Ln
5   12/31/16    Cust2   12 Testing Rd

地址变更功能：

def changeAdd(x):
    x=x[x.Address != x.shift(-1).Address]
    df1 = pd.DataFrame({'Date':x.shift(1).Date + ' to '+ x.Date,
              'Customer':x.Customer.max(),
              'Address':x.shift(1).Address +' to ' + x.Address})
    return df1[df1.Address.notnull()]


dm = df.groupby('Customer')\
   .apply(changeAdd)\
   .reset_index(drop=True)[['Date','Customer','Address']]

dm

输出数据帧：

Date    Customer    Address
0   12/31/15 to 12/31/16    Cust1   12 Rocky Hill Rd to 14 Rocky Hill Rd
1   12/31/14 to 12/31/15    Cust2   12 Testing Rd to 12 Testing Ln
2   12/31/15 to 12/31/16    Cust2   12 Testing Ln to 12 Testing Rd

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何判断 Pandas 中的值是否随维度变化的相关文章

python导入模块时如何避免一直写模块名？

我用math最近模块很多我不想写math sqrt x and math sin x 每时每刻我想缩短它并写sqrt x and sin x How 对于较长的模块名称通常会缩短它们例如 import numpy as np 然后您
Spark MLlib - 训练隐式警告

我在使用时不断看到这些警告trainImplicit WARN TaskSetManager Stage 246 contains a task of very large size 208 KB The maximum recommend
编辑 scikit-learn 决策树

我想编辑 sklearn DecisionTree 例如改变条件或切割节点叶子等但似乎没有功能可以做到这一点如果我可以导出到文件编辑它以导入如何编辑决策树环境 Windows 10 python3 3 sklearn 0 17
Python：记录垃圾收集器

我有一个 python 应用程序有一些性能问题我想将垃圾收集器的事件特别是何时调用添加到我的日志中是否可以 thanks http docs python org library gc html gc set debug http
Python + PostgreSQL + 奇怪的ascii = UTF8编码错误

我有包含字符的 ascii 字符串 x80 代表欧元符号 gt gt gt print x80 当将包含该字符的字符串数据插入数据库时我得到 psycopg2 DataError invalid byte sequence for enc
将 API 数据存储到 DataFrame 中

我正在运行 Python 脚本来从 Interactive Brokers API 收集金融市场数据连接到API后终端打印出请求的历史数据如何将数据保存到数据帧中而不是在终端中流式传输 from ibapi wrapper impor
html 解析器 python

我正在尝试解析一个网站我正在使用 HTMLParser 模块问题是我想解析第一个 a href 评论后但我真的不知道该怎么做所以我在文档中发现有一个函数叫做handle comment 但我还没有找到如何正确使用它我有以下内容 i
使用 Scipy imsave 将 Numpy 数组保存到图像时保留未更改的数据

使用 Scipy 保存二维 Numpy 数组单个值时toimage or imsave像素值与 Numpy 数组中的像素值不完全匹配相反在某些区域主要是边缘图像算法似乎使用某种插值是否有一个选项可以停止插值并保留准确的数据例
在Python中创建一个新表

我正在尝试从数控机床中提取数据事件每毫秒发生一次我需要过滤掉一些用管道分隔的变量分隔符 PuTTy exe 程序生成的日志文件我尝试阅读熊猫但列不在同一位置 df pd read table data log sep 日志文件的一
用Python中的嵌套for循环替换重复的if语句？

在我编写的下面的代码中 n 4 所以有五个 if 语句所以如果我想将 n 增加到比如说 10 那么就会有很多 if 语句因此我的问题是如何用更优雅的东西替换所有 if 语句 n p 4 5 number of trials prob
如何使用 Pandas 将巨大的 CSV 转换为 SQLite？

我有一个巨大的表大约 60 GB 采用存档的 CSV 文件形式我想将其转换为 SQLite 文件我现在所做的事情如下 import pandas import sqlite3 cnx sqlite3 connect db sqlite
如何使用 Python 多处理避免在分叉进程中加载父模块

当您创建一个Pool使用Python的进程multiprocessing 这些进程将分叉父进程中的全局变量将显示在子进程中如下面的问题所述如何限制多处理进程的范围 https stackoverflow com questions 2
str.translate 给出 TypeError - Translate 采用一个参数（给定 2 个参数），在 Python 2 中工作

我有以下代码 import nltk os json csv string cPickle from scipy stats import scoreatpercentile lmtzr nltk stem wordnet WordNetL
Django - 电子邮件发送两次

每当我使用如下所示的电子邮件设置从views py调用下面的方法时电子邮件的两份副本都会发送给收件人并且我收到如下所示的错误 def sendEmailBasic request msg EmailMessage Request Cal
RuntimeError: 预期所有张量都在同一设备上，但发现至少有两个设备，cpu 和 cuda:0！使用我的模型进行预测时

我使用变压器训练了一个序列分类模型 BertForSequenceClassification 我收到错误预计所有张量都在同一设备上但发现至少有两个设备 cpu 和 cuda 0 在方法wrapper index select中检查参
Python 视频框架

我正在寻找一个 Python 框架它将使我能够播放视频并在该视频上绘图用于标记目的我尝试过 Pyglet 但这似乎效果不是特别好在现有视频上绘图时会出现闪烁即使使用双缓冲和所有这些好东西而且似乎没有办法在每帧回调期间获取视频中
如何检查列表是否为空？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动例如如果通过以下内容 a 我如何检查是否a是空的 if not a print Lis
smooth_idf 是多余的吗？

The scikit learn 文档 http scikit learn org stable modules generated sklearn feature extraction text TfidfTransformer html
大型数据集上的 Sklearn-GMM

我有一个很大的数据集我无法将整个数据放入内存中我想在这个数据集上拟合 GMM 我可以用吗GMM fit sklearn mixture GMM 重复小批量数据没有理由重复贴合只需随机采样您认为机器可以在合理时间内计算的尽可能多的数据
为什么 bot.get_channel() 会产生 NoneType？

我正在制作一个 Discord 机器人来处理公告命令当使用该命令时我希望机器人在特定通道中发送一条消息并向用户发送一条消息以表明该命令已发送但是我无法将消息发送到频道我尝试了这段代码 import discord import

随机推荐

如何垂直对齐 div 中的文本？

我正在尝试找到将文本与 div 对齐的最有效方法我尝试了一些方法但似乎都不起作用 testimonialText position absolute left 15px top 15px width 150px height 309px
如何使用 python Tkinter 隐藏 Windows 控制台？

我尝试将 py 文件重命名为 pyw 但用 py2exe 编译并没有什么区别我尝试使用 root withdraw 但它所做的只是冻结应用程序防止弹出初始画布并且无论如何都无法删除命令提示符窗口有没有人有办法解决吗我的根是根 T
LINQ to Entities 不支持“日期”。仅支持初始值设定项、实体成员和实体导航属性

我正在尝试执行以下代码并收到错误 public List
有没有办法更改FixedLenNullInSource 和TrimTrailingBlanks 的值？

有没有办法改变值FixedLenNullInSource and TrimTrailingBlanks I use sp help比较不同服务器的输出以查看表是否相同 FixedLenNullInSource and TrimTrailin
在 imageview 中显示来自 Intent 的 jpg 图像

如何显示从 android intent action SEND in an imageview 用户从应用程序列表中选择我的应用程序来共享图像图像是sent via intent我的活动打开了但如何在图像视图中使用此图像 using
istio-proxy 访问日志是什么意思？

我试图通过查看 istio proxy 访问日志它记录每次访问来对我的服务进行故障排除但是我找不到任何解释日志中每个条目含义的文档例如 2018 12 20T11 09 42 302Z GET HTTP 1 1 200 0 614
C# 嵌套类序列化

我正在尝试序列化订单的虚拟集合其中每个订单都包含一个产品该集合序列化良好但订单内的示例产品属性被遗漏订单领取 XmlRoot Orders public class OrderCollection ICollection
上传文件抛出无方法签名异常（在 getFile() 方法中）

我正在尝试上传文件并将其存储在文件中这是 GSP 中的代码
当轴标签分成多条线时会偏离中心

我在用graph twoway scatter并添加我自己的ylabels 我经常有很长的标签并将它们分成多行然而当我想要破解的时候却遇到了问题some标签超过两行但不超过两行当我这样做时单行标签相对于它们的中心是偏离的tick标记
Laravel 如何使用 Eloquent 获取对象的行号？

我想根据用户的创建日期了解用户的位置我该如何使用 Eloquent 来做到这一点我希望能够做这样的事情 User getRowNumber user obj 我想你想要 MySQL 解决方案所以你可以这样做 DB statement
选定的项目数据从表格到 ZK 中的文本框

我正在开发一个小型 Web 应用程序用于存储医院患者的数据以便更多地了解 zk 及其令人惊叹的功能这次我的目标是当我选择一行复选标记时我想将该行的数据红色获取到相应的文本框蓝色当我选择表的任何行时这将起作用也许这是
Python - CSV：具有不同长度行的大文件

简而言之我有一个 20 000 000 行的 csv 文件它具有不同的行长度这是由于陈旧的数据记录器和专有格式造成的我们得到以下格式的最终结果作为 csv 文件我的目标是将此文件插入到 postgres 数据库中我怎样才能做到
HomeAsUp 按钮在 Android 4.2.2 和 Appcompat 21.0.0 中无效

我使用 Appcompat 21 中的工具栏而不是标准操作栏一切都很顺利除了HomeAsUp额外活动中的按钮不起作用当我打开PrefsActivity 下面的代码片段 HomeAsUp按钮正常显示一个向左的小箭头当我单击按钮时从
如何调整 html canvas 元素的大小？

我在 html 中静态定义了一个带有宽度和高度的画布元素如果我尝试使用 JavaScript 动态调整其大小设置新的宽度和高度在画布的属性上或通过样式属性我在 Firefox 中收到以下错误未捕获的异常异常对WrappedNa
WINAPI - 设置组合框下拉列表的背景和文本颜色

所以我尝试使用 Common Controls 和 WINAPI 设置 ComboBox 的背景和文本颜色我确实设法设置了组合框本身的背景和文本颜色但其下拉列表的颜色保持不变这几乎就是我所做的创建组合框时我使用了CBS DROPD
我需要一个 php 正则表达式来用另一个标签替换一个标签

这是我需要能够做到的我需要匹配以下标签 span text sample span 我需要用 html3 兼容标签替换 span 但保留中间的文本替换后的最终标签应如下所示 u text sample u 我只是不擅长正则表达式似乎无
ILMerge 替代方案，如何将应用程序的依赖 DLL 嵌入 EXE 文件中？

如此处所述我试图将 dll 嵌入到 exe 应用程序中以便只分发一个 exe 但是当我尝试在安装了完整 NET 4 的 xp 计算机上运行我的应用程序时它只是崩溃而没有错误我将以下代码放在主要方法 STAThread static v
发布编译时 WCF .SVC Debug="true" 被忽略？

默认情况下 SVC 文件包含 Debug true 我想知道如果您编译发布版本是否会忽略它或者仍然使用调试符号进行编译 Ex Debug true属性在 ServiceHost仅当您将服务编写为inline svc 文件中的代码或在中
如何在不同条件下选择同一字段两次并将结果显示为单独的字段

我想用 C 创建一个表适配器如下所示我希望在不同的条件下在表中使用相同的字段两次并且它必须显示为两个不同的字段这是我的源表来自AttendanceReg我需要的表Count每个学生的记录基于AttendStatus找出他们在的天数
如何判断 Pandas 中的值是否随维度变化

假设我有一些特定日期的客户数据我想看看他们的地址是否已更改超过那些日期理想情况下我想将发生更改的两列复制到新表中或者只是获取总更改量的指标所以如果我有一张像这样的桌子 Date Customer Address 12 31 1

如何判断 Pandas 中的值是否随维度变化

如何判断 Pandas 中的值是否随维度变化 的相关文章

随机推荐

热门标签

如何判断 Pandas 中的值是否随维度变化的相关文章