在通过代码连接的两个表之间使用更新时出错

2023-12-10

是以下 python pandas DataFrame：

ID	country	money	code	money_add	other	time
832932	Other	NaN	00000	NaN	[N2,N2,N4]	0 days 01:37:00
217#8#	NaN	NaN	NaN	NaN	[N1,N2,N3]	2 days 01:01:00
1329T2	France	12131	00020	3452	[N1,N1]	1 days 03:55:00
124932	France	NaN	00016	NaN	[N2]	0 days 01:28:00
194022	France	NaN	00000	NaN	[N4,N3]	3 days 02:35:00

If code列不是NaN和money列是NaN，我们更新值money and money_add从下表中。使用code and cod_t列作为键。

cod_t	money	money_add
00000	4532	72323
00016	1213	23822
00030	1313	8393
00020	1813	27328

结果表的示例：

ID	country	money	code	money_add	other	time
832932	Other	4532	00000	72323	[N2,N2,N4]	0 days 01:37:00
217#8#	NaN	NaN	NaN	NaN	[N1,N2,N3]	2 days 01:01:00
1329T2	France	12131	00020	3452	[N1,N1]	1 days 03:55:00
124932	France	1213	00016	23822	[N2]	0 days 01:28:00
194022	France	4532	00000	72323	[N4,N3]	3 days 02:35:00

用户@jezrael，给了我以下问题的解决方案：

df1 = df1.drop_duplicates('cod_t').set_index('cod_t')
df = df.set_index(df['code'])
df.update(df1, overwrite=False)
df = df.reset_index(drop=True).reindex(df.columns, axis=1)

但这段代码给了我一个我不知道如何解决的错误：

TypeError: The DType <class 'numpy.dtype[timedelta64]'> could not be promoted by <class
'numpy.dtype[float64]'>. This means that no common DType exists for the given inputs. 
For example they cannot be stored in a single array unless the dtype is `object`. 
The full list of DTypes is: (<class 'numpy.dtype[timedelta64]'>, <class 'numpy.dtype[float64]'>)

// First DataFrame dtypes
ID                                 object
country                            object
code                               object
money                             float64
money_add                         float64
other                              object
time                      timedelta64[ns]
dtype: object
// Second DataFrame dtypes
cod_t                     object
money                      int64
money_add                  int64
dtype: object

如果您能帮助我解决错误，或者建议使用替代方法，我将不胜感激update.

Because DataFrame.update这里效果不好是替代方案 - 首先对第二个 DataFrame 中的新列使用左连接DataFrame.merge:

df2 = df.merge(df1.drop_duplicates('cod_t').rename(columns={'cod_t':'code'}), 
               on='code', 
               how='left',
               suffixes=('','_'))

print (df2)
       ID country    money  code  money_add         other            time  \
0  832932   Other      NaN   0.0        NaN  [N2, N2, N4] 0 days 01:37:00   
1  217#8#     NaN      NaN   NaN        NaN  [N1, N2, N3] 2 days 01:01:00   
2  1329T2  France  12131.0  20.0     3452.0      [N1, N1] 1 days 03:55:00   
3  124932  France      NaN  16.0        NaN          [N2] 0 days 01:28:00   
4  194022  France      NaN   0.0        NaN      [N4, N3] 3 days 02:35:00   

   money_  money_add_  
0  4532.0     72323.0  
1     NaN         NaN  
2  1813.0     27328.0  
3  1213.0     23822.0  
4  4532.0     72323.0

然后获取带/不带的列名称_:

cols_with_ = df2.columns[df2.columns.str.endswith('_')]
cols_without_ = cols_with_.str.rstrip('_')

print (cols_with_)
Index(['money_', 'money_add_'], dtype='object')

print (cols_without_)
Index(['money', 'money_add'], dtype='object')

Pass to DataFrame.combine_first最后删除辅助列：

df2[cols_without_] = (df2[cols_without_].combine_first(df2[cols_with_]
                                        .rename(columns=lambda x: x.rstrip('_'))))
df2 = df2.drop(cols_with_, axis=1)
print (df2)
       ID country    money  code  money_add         other            time
0  832932   Other   4532.0   0.0    72323.0  [N2, N2, N4] 0 days 01:37:00
1  217#8#     NaN      NaN   NaN        NaN  [N1, N2, N3] 2 days 01:01:00
2  1329T2  France  12131.0  20.0     3452.0      [N1, N1] 1 days 03:55:00
3  124932  France   1213.0  16.0    23822.0          [N2] 0 days 01:28:00
4  194022  France   4532.0   0.0    72323.0      [N4, N3] 3 days 02:35:00

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

在通过代码连接的两个表之间使用更新时出错的相关文章

将每列的值乘以 R 中另一个 data.frame 中的权重

我有两个data frames df and weights 代码如下 df看起来像这样 id a b d EE f 1 this 0 23421153 0 02324956 0 5457353 0 73068586 0 5642554 2
SQL Alchemy 中的 NULL 安全不等式比较？

目前我知道如何表达 NULL 安全的唯一方法 SQL Alchemy 中的比较其中与 NULL 条目的比较计算结果为 True 而不是 NULL 是 or field None field value 有没有办法在 SQL Alchem
Spark的distinct()函数是否仅对每个分区中的不同元组进行洗牌

据我了解 distinct 哈希分区 RDD 来识别唯一键但它是否针对仅移动每个分区的不同元组进行了优化想象一个具有以下分区的 RDD 1 2 2 1 4 2 2 1 3 3 5 4 5 5 5 在此 RDD 上的不同键上所有重复键
__del__ 真的是析构函数吗？

我主要用 C 做事情其中析构函数方法实际上是为了销毁所获取的资源最近我开始使用python 这真的很有趣而且很棒我开始了解到它有像java一样的GC 因此没有过分强调对象所有权构造和销毁据我所知 init 方法对我来说在 py
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
运行多个 scrapy 蜘蛛的正确方法

我只是尝试使用在同一进程中运行多个蜘蛛新的 scrapy 文档 http doc scrapy org en 1 0 topics practices html但我得到 AttributeError CrawlerProcess objec
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
IRichBolt 在storm-1.0.0 和 pyleus-0.3.0 上运行拓扑时出错

我正在运行风暴拓扑 pyleus verbose local xyz topology jar using storm 1 0 0 pyleus 0 3 0 centos 6 6并得到错误线程 main java lang NoClass
python 集合可以包含的值的数量是否有限制？

我正在尝试使用 python 设置作为 mysql 表中 ids 的过滤器 python集存储了所有要过滤的id 现在大约有30000个这个数字会随着时间的推移慢慢增长我担心python集的最大容量它可以包含的元素数量有限制吗您最大
Pandas Dataframe 中 bool 值的条件前向填充

问题如何转发 fill boolTruepandas 数据框中的值如果是当天的第一个条目 True 到一天结束时请参阅以下示例和所需的输出 Data import pandas as pd import numpy as np df
使用 OpenPyXL 迭代工作表和单元格，并使用包含的字符串更新单元格[重复]

这个问题在这里已经有答案了我想使用 OpenPyXL 来搜索工作簿但我遇到了一些问题希望有人可以帮助解决以下是一些障碍待办事项我的工作表和单元格数量未知我想搜索工作簿并将工作表名称放入数组中我想循环遍历每个数组项并搜索包含特
HTTPS 代理不适用于 Python 的 requests 模块

我对 Python 还很陌生我一直在使用他们的 requests 模块作为 PHP 的 cURL 库的替代品我的代码如下 import requests import json import os import urllib impor
如何将 numpy.matrix 提高到非整数幂？

The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
通过数据框与函数进行交互

如果我有这样的日期框架氮 EG 00 04 NEG 04 08 NEG 08 12 NEG 12 16 NEG 16 20 NEG 20 24 datum von 2017 10 12 21 69 15 36 0 87 1 42 0 76
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
设置 torch.gather(...) 调用的结果

我有一个形状为 n x m 的 2D pytorch 张量我想使用索引列表来索引第二个维度可以使用 torch gather 完成然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
如何使用google colab在jupyter笔记本中显示GIF？

我正在使用 google colab 想嵌入一个 gif 有谁知道如何做到这一点我正在使用下面的代码它并没有在笔记本中为 gif 制作动画我希望笔记本是交互式的这样人们就可以看到代码的动画效果而无需运行它我发现很多方法在 Goo
使用基于正则表达式的部分匹配来选择 Pandas 数据帧的子数据帧

我有一个 Pandas 数据框它有两列一列进程参数列包含字符串另一列值列包含相应的浮点值我需要过滤出部分匹配列过程参数中的一组键的子数据帧并提取与这些键匹配的数据帧的两列 df pd DataFrame Proce

随机推荐

将 mvc 4 降级/转换为 mvc 3

我知道这是一个相当奇怪的问题请不要攻击我我具体需要将当前的 Asp Net Mvc 4 net Framework 4 5 应用程序降级到 Asp Net Mvc 3 net Framework 4 0 因为我们的共享托管提供商不支
将通过URL获取的数据转换为post变量

我需要读取使用 POST 操作类型提交的表单的结果那么我是否可以将通过 GET 变量获得的变量转换为 POST 然后我可以使用 file get contents 简单地读取内容请帮助我使用此方法或通过某种替代方法如果可能获取数据
我应该为 jar commons-lang.jar 使用哪个 pom 依赖项

如果 jar 名称中没有版本我如何知道应该使用哪个版本的 pom 依赖项例如 jar commons lang jar 我应该使用什么版本的 pom 依赖项以下是其在 Maven 中央存储库上的搜索结果 http search mav
查找字符串中出现频率最高的单词并检查字符串是否仅包含 [a-z][A-Z] 个字符

我用 Python 创建了一些代码来查找字符串中出现频率最高的单词我对 Python 还很陌生请求你的帮助看看我是否可以更好更有效地编写这个代码代码返回字符串中出现频率最高的单词的一个整数另外我想确保该字符串仅包含 a z A
使用 celery 运行“独特”任务

我使用 celery 来更新我的新闻聚合网站中的 RSS 提要我为每个提要使用一个 task 并且一切似乎运行良好有一个细节我不确定处理得很好所有提要都使用 periodic task 每分钟更新一次但是如果在启动新任务时提要仍在从
溢出：隐藏在 div 标签上会影响背景颜色

的定义overflow hidden指出 the overflowing content is completely hidden not accessible to the user from http quirksmode org cs
使用 import java.* 来使用“java”包下的所有子包怎么样？

import java 为什么我不能进行此导入我没有导入 java 包的特定子包中的所有类而是尝试导入 java 包下的所有子包如何导入所有内置类 java中没有子包这种东西 java util stream不是的子包java ut
STRCHR 与 STRRCHR 有何区别？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心以获得指导我想知道这两种不同用途之间
通过RemoteView设置GradientDrawable

这就是我想要做的我有一个小部件我想根据用户选择的颜色设置其背景它必须是一个渐变背景是通过设置 LinearLayout 的背景来设置的为了进行测试我对虚拟背景进行了如下操作 remoteViews setInt R id lay
WPF DataBound ListBox 添加动画但不滚动

我有一个绑定到 ObservableCollection 的 WPF ListBox 当我向其中添加项目时我想要一些动画来吸引新来者的注意力有许多使用 DataTemplate 触发器和 FrameworkElment Loade
如何为 Telerik RadGrid 中的列标题指定颜色

我在 asp net 中创建了一个 telerik RadGrid 我的要求是为列标题提供我自己的颜色我们怎样才能实现这一点下面是我正在使用的代码结构
Seahorse::Client::NetworkingError 使用 Rails 上传 Amazon S3 文件

在我的 Rails 4 应用程序中我尝试使用 aws sdk 下载常规 png 文件然后将其上传到我的 s3 存储桶使用gem aws sdk gt 2 在开发环境中代码运行完全正常但如果我尝试rails s e producti
IBM MQ 客户端在 10 分钟后断开连接：IBM.XMS.IllegalStateException

我正在使用 IBM 的这个示例我刚刚复制并粘贴了代码 https github com ibm messaging mq dev patterns blob master dotnet dotNetGet cs 我正在连接到 MQ 服务器
如何初始化参数化构造函数的对象数组

我需要初始化参数化构造函数的对象数组我怎样才能以最好的方式做到这一点 include
当您使用 Seq(1,2,3) 创建 Seq 对象时会发生什么？

当您评估表达式时到底会发生什么 Seq 1 2 3 我是 Scala 新手现在对各种集合类型有点困惑 Seq是一种特质对吗所以当你这样称呼它时 Seq 1 2 3 它一定是某种伴生对象吗或不它是某种扩展的类吗Seq 最重要的是返
在 Xamarin 应用程序中使用 Identity Server

我正在尝试让 Xamarin 应用程序与身份服务器一起使用我已按照以下步骤操作 1 下载这个 https github com IdentityModel IdentityModel OidcClient Samples tree mas
为什么这段显示图像的代码在构建到 jar 中时会出现“错误”？

我想通过在 JLabel 上绘制 BufferedImage 来显示图像 x y Offset是在JLabel的中间绘制一个较小的图像如果我在 IDE 中运行代码它会正常工作并在我的 JFrame 上显示图像如果我现在将类构建到 ja
使用 Unicode emoji 动态创建 NSString

我有字符串 Hi there U0001F603 它正确显示了表情符号例如Hi there 如果我把它放在UILabel 但我想像这样动态创建它 NSString stringWithFormat Hi there U0001F60 ld
了解分支预测

有一些关于分支预测的疑问我无法自信地弄清楚假设我必须使用静态分支预测器分支预测应该发生在管道的哪个阶段如何知道预测出错了数据路径如何知道发生了错误预测如果它知道发生了错误预测它如何发送信号以占用未占用的分支出了问题后我必须占
在通过代码连接的两个表之间使用更新时出错

是以下 python pandas DataFrame ID country money code money add other time 832932 Other NaN 00000 NaN N2 N2 N4 0 days 01 37

在通过代码连接的两个表之间使用更新时出错

在通过代码连接的两个表之间使用更新时出错 的相关文章

随机推荐

热门标签

在通过代码连接的两个表之间使用更新时出错的相关文章