我有两个 pandas 数据框定义如下:
_data_orig = [
[1, "Bob", 3.0],
[2, "Sam", 2.0],
[3, "Jane", 4.0]
]
_columns = ["ID", "Name", "GPA"]
_data_new = [
[1, "Bob", 3.2],
[3, "Jane", 3.9],
[4, "John", 1.2],
[5, "Lisa", 2.2]
]
_columns = ["ID", "Name", "GPA"]
df1 = pd.DataFrame(data=_data_orig, columns=_columns)
df2 = pd.DataFrame(data=_data_new, columns=_columns)
我需要找到以下信息:
- 查找删除其中df1是原始数据集,df2是新数据集
- 我需要找到两者之间现有记录的行更改。示例 ID == 1 应比较 df2 的 ID == 1 以查看每行是否有任何列值发生更改。
- 找到 df2 诗句 df1 的任何添加内容。示例返回 [4, "John", 1.2] 和 [5, "Lisa", 2.2]
对于查找行中更改的操作,我想我可以查看 df2 并检查 df1,但这似乎很慢,所以我希望在那里找到更快的解决方案。
对于其他两个操作,我真的不知道该怎么做,因为当我尝试比较两个数据帧时,我得到:
ValueError: Can only compare identically-labeled DataFrame objects
熊猫版本:'0.16.1'
建议?