使用系列查找表替换 Pandas DataFrame 列中的值

2024-04-15

我想用我准备的系列形式的查找表生成的更准确/完整的一组值替换 DataFrame 中的一列值。

我以为我可以这样做，但结果并不如预期。

这是我要修复的数据框：

In [6]: df_normalised.head(10)
Out[6]: 
  code                                          name
0    8                             Human development
1   11                                              
2    1                           Economic management
3    6         Social protection and risk management
4    5                         Trade and integration
5    2                      Public sector governance
6   11  Environment and natural resources management
7    6         Social protection and risk management
8    7                   Social dev/gender/inclusion
9    7                   Social dev/gender/inclusion

（注意第 2 行中缺少的名称）。

这是我为进行修复而创建的查找表：

In [20]: names
Out[20]: 
1                              Economic management
10                               Rural development
11    Environment and natural resources management
2                         Public sector governance
3                                      Rule of law
4         Financial and private sector development
5                            Trade and integration
6            Social protection and risk management
7                      Social dev/gender/inclusion
8                                Human development
9                                Urban development
dtype: object

这是我认为可以做到的方法：

In [21]: names[df_normalised.head(10).code]
Out[21]: 
code
8                                Human development
11    Environment and natural resources management
1                              Economic management
6            Social protection and risk management
5                            Trade and integration
2                         Public sector governance
11    Environment and natural resources management
6            Social protection and risk management
7                      Social dev/gender/inclusion
7                      Social dev/gender/inclusion
dtype: object

但是，我预计上面的结果系列具有与 df_normalized 的索引相同的索引（即 0、1、2、3），而不是基于代码值的索引。

因此，我不确定如何用这些系列值替换 df_normalized 中“名称”列中的原始值，因为索引不同。

顺便说一句，怎么可能有一个像上面那样有重复值的索引呢？

您可以使用map() http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.map.html函数：

In [38]: df_normalised['name'] = df_normalised['code'].map(name)

In [39]: df_normalised
Out[39]:
   code                                          name
0     8                             Human development
1    11  Environment and natural resources management
2     1                           Economic management
3     6         Social protection and risk management
4     5                         Trade and integration
5     2                      Public sector governance
6    11  Environment and natural resources management
7     6         Social protection and risk management
8     7                   Social dev/gender/inclusion
9     7                   Social dev/gender/inclusion

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

使用系列查找表替换 Pandas DataFrame 列中的值的相关文章

导入错误：没有名为 _ssl 的模块

带 Python 2 7 的 Ubuntu Maverick 我不知道如何解决以下导入错误 gt gt gt import ssl Traceback most recent call last File
pandas 替换多个值

以下是示例数据框 gt gt gt df pd DataFrame a 1 1 1 2 2 b 11 22 33 44 55 gt gt gt df a b 0 1 11 1 1 22 2 1 33 3 2 44 4 3 55 现在我想根据
如何在Windows上模拟socket.socketpair

标准Python函数套接字套接字对 https docs python org 3 library socket html socket socketpair不幸的是它在 Windows 上不可用从 Python 3 4 1 开始我
如何使用装饰器禁用某些功能的中间件？

我想模仿的行为csrf exempt see here https docs djangoproject com en 1 11 ref csrf django views decorators csrf csrf exempt and h
在循环中每次迭代开始时将变量重新分配给原始值（在循环之前定义）

在Python中你使用在每次迭代开始时将变量重新分配给原始值在循环之前定义时也就是说 original 1D o o o for i in range 0 3 new original 1D revert back to orig
在 NumPy 中获取 ndarray 的索引和值

我有一个 ndarrayA任意维数N 我想创建一个数组B元组数组或列表其中第一个N每个元组中的元素是索引最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
将数据框中重叠的范围合并到唯一的组中

我有一个 n 行 3 的数据框 df lt data frame start c 178 400 983 1932 33653 end c 5025 5025 5535 6918 38197 group c 1 1 2 2 3 df sta
Python 中的二进制缓冲区

在Python中你可以使用StringIO https docs python org library struct html用于字符数据的类似文件的缓冲区内存映射文件 https docs python org library mmap
NameError：名称“urllib”未定义”

CODE import networkx as net from urllib request import urlopen def read lj friends g name fetch the friend list from Liv
feedparser 在脚本运行期间失败，但无法在交互式 python 控制台中重现

当我运行 eclipse 或在 iPython 中运行脚本时它失败了 ascii codec can t decode byte 0xe2 in position 32 ordinal not in range 128 我不知道为什么但
使用 OpenPyXL 迭代工作表和单元格，并使用包含的字符串更新单元格[重复]

这个问题在这里已经有答案了我想使用 OpenPyXL 来搜索工作簿但我遇到了一些问题希望有人可以帮助解决以下是一些障碍待办事项我的工作表和单元格数量未知我想搜索工作簿并将工作表名称放入数组中我想循环遍历每个数组项并搜索包含特
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
Nuitka 未使用 nuitka --recurse-all hello.py [错误] 编译 exe

我正在尝试通过 nuitka 创建一个简单的 exe 这样我就可以在我的笔记本电脑上运行它而无需安装 Python 我在 Windows 10 上并使用 Anaconda Python 3 我输入 nuitka recurse all h
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
检查所有值是否作为字典中的键存在

我有一个值列表和一本字典我想确保列表中的每个值都作为字典中的键存在目前我正在使用两组来确定字典中是否存在任何值 unmapped set foo set bar keys 有没有更Pythonic的方法来测试这个感觉有点像黑客您的方
如何从没有结尾的管道中读取 python 中的 stdin

当管道来自打开时不知道正确的名称我无法从 python 中的标准输入或管道读取数据文件我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
用于运行可执行文件的python多线程进程

我正在尝试将一个在 Windows 上运行可执行文件并管理文本输出文件的 python 脚本升级到使用多线程进程的版本以便我可以利用多个核心我有四个独立版本的可执行文件每个线程都知道要访问它们这部分工作正常我遇到问题的地方是当它们
对输入求 Keras 模型的导数返回全零

所以我有一个 Keras 模型我想将模型的梯度应用于其输入这就是我所做的 import tensorflow as tf from keras models import Sequential from keras layers imp
在 Python 类中动态定义实例字段

我是 Python 新手主要从事 Java 编程我目前正在思考Python中的类是如何实例化的我明白那个 init 就像Java中的构造函数然而有时 python 类没有 init 方法在这种情况下我假设有一个默认构造函数就像
改变字典的哈希函数

按照此question https stackoverflow com questions 37100390 towards understanding dictionaries 我们知道两个不同的字典 dict 1 and dict 2例

随机推荐

通过 angular-cli 生成的角度组件的自定义项目级模板

如何将自定义角度组件原理图添加到现有项目我想要例如my page将复制现有的组件模板 node modules schematics angular component 文件但带有编辑过的模板我希望它可以通过以下方式实现angular
UnionBy Linq 实现

我需要 Union 的实现来比较对象的属性而不是对象本身我想出了以下几点 public static IEnumerable
实时清除数据容器的内容

My problem is best explained by the architecture below 基本上我必须清除NSMutableData实时对象或任何其他对象即我无法阻止其包含线程有没有办法 API 来做到这一点 u
32feet.net 如何在 C# 中异步发现附近的蓝牙设备

我正在尝试使用32英尺 NET http 32feet codeplex comC 应用程序中的蓝牙库用于检测附近的设备我的小应用程序的目的是通过人们手机的蓝牙功能让电脑知道谁在房间里执行此类操作的最佳方法是让我想要跟踪的设备连接一
将网络摄像头从浏览器流式传输到 RTMP 服务器

我正在尝试将一些内容从浏览器的网络摄像头实现流式传输到随机 RTMP 服务器我让它工作到每 2 秒将 WEBM 我相信是 VP8 编码的电影片段发送到我的服务器的部分但棘手的部分是从该部分将其发送到 RTMP 服务器对 FFMPEG
如何简单地解析没有指定年份的日期？

我有一个工具它似乎可以给我日期但没有指定我需要转换的年份并且我正在使用 Java 来完成任务实际上是 Groovy 但在本例中足够接近示例日期是 13 Dec 12 00 00 它应该指的是 12 13 2011 因为年份未指定
HTML 俄语

我必须设计一个俄语版本的网站我从翻译那里得到文本我把它复制到Dreamweaver的代码中但它不起作用我有平常的头我应该怎么办您应该将文件的编码更改为 UTF 8 您可以执行此过程当您Save As文件在记事本中或者您可以使用
OpenSSL 上的 EVP_DecryptFinal_ex 错误

我正在使用 OpenSSL EVP 例程使用 AES 128 cbc 模式进行解密我使用 NIST 站点指定的测试向量来测试我的程序该程序似乎在 EVP DecryptFinal ex 例程处失败谁能告诉我有什么问题吗另外我如何在
处理 Swift 2 中异步闭包错误的最佳方法？

我使用了大量的异步网络请求顺便说一句 iOS 中的任何网络请求都需要异步并且我正在寻找更好的方法来处理来自 Apple 的错误dataTaskWithRequest哪个不支持throws 我有这样的代码 func sendRequest
创建名称为“securityConfig”的 bean 时出错：自动装配依赖项注入失败

我正在尝试结合 Java config 和 xml config 进行 Spring 安全身份验证但我收到一个错误创建名称为 securityConfig 的 bean 时出错自动装配依赖项注入失败我的代码似乎有什么问题一直在谷歌
无法在 Ubuntu 上的 PyCharm 上启动终端

我想运行一段代码为此我在我的 Ubuntu 机器上安装了 PyCharm 现在当我打开 PyCharm 应用程序并尝试打开终端时它会抛出错误并且不会打开终端 java io IOException Exec tty错误未知的pyc
管理面板中的 django choicefield 过滤器

默认情况下 django 管理员list filter提供型号选择中所有可用的过滤器但除了那些我还想要一个过滤器我们可以说它是无过滤器 class Mymodel char choice field choices 1 txt1 2
18M+行表的子查询和MySQL缓存

由于这是我的第一篇文章我似乎只能发布 1 个链接因此我在底部列出了我所指的网站简而言之我的目标是让数据库更快地返回结果我尝试包含尽可能多的相关信息以帮助在帖子底部提出问题机器信息 8 processors model name
在 Snowflake 的公共表表达式中使用“match_recognize”

更新已回答here https stackoverflow com questions 68544567 match recognize with cte in snowflake 68550312 68550312 我正在将一个有点复杂
如何找到逻辑回归模型特征的重要性？

我有一个通过逻辑回归算法训练的二元预测模型我想知道哪些特征预测变量对于正类别或负类别的决策更重要我知道有coef 参数来自 scikit learn 包但我不知道它是否足够重要另一件事是我如何评估coef 值对于消极类和积极类的
在 R 中：带有向量变量的子集或 dplyr::filter

df lt data frame a LETTERS 1 4 b rnorm 4 vals lt c B D 我可以过滤子集df值在val with dplyr filter df a in vals subset df a in val
将上三角矩阵转换为对称矩阵的快速方法

我有一个上三角矩阵np float64值像这样 array 1 2 3 4 0 5 6 7 0 0 8 9 0 0 0 10 我想将其转换为相应的对称矩阵如下所示 array 1 2 3 4 2 5 6 7 3 6 8 9 4 7 9
Python：如何获取仅出现在一组列表中的一组中的项目？

我想创建一个函数它接受一个或多个集合的列表并查找列表中所有集合的对称差异即结果应该是一组值每个值仅包含在其中一个值中套如果我对对称差异的理解是错误的请纠正我例如 gt gt gt s1 set 1 2 3 gt gt gt s
如何将Java项目导入到Eclipse中？

我试图导出一个 Java 项目我可以使用选项 Export gt Java gt JAR file 创建 JAR 文件我无法将此 jar 文件导入到 Eclipse 中没有 java 的导入选项我在这里做错了什么吗使用面向 Web
使用系列查找表替换 Pandas DataFrame 列中的值

我想用我准备的系列形式的查找表生成的更准确完整的一组值替换 DataFrame 中的一列值我以为我可以这样做但结果并不如预期这是我要修复的数据框 In 6 df normalised head 10 Out 6 code name

使用系列查找表替换 Pandas DataFrame 列中的值

使用系列查找表替换 Pandas DataFrame 列中的值 的相关文章

随机推荐

热门标签

使用系列查找表替换 Pandas DataFrame 列中的值的相关文章