使用 Series 更新 DataFrame 中的列

2024-01-29

我有一个DataFrame对象在pandas具有多个行和列。出于说明目的，假设我有两个这样的列，名为Address and Age.

我也有一个Series将多个地址映射到年龄的对象。

现在，我想使用该系列更新数据框。这是我目前的做法：

for (address, age) in series.iteritems():
        df[df.address == address].age = age

这似乎有效，但速度太慢。更新所有条目需要一分多钟的时间。

有没有更快的方法来进行此更新（最好不使用 for 循环）？

我想你需要map http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.map.html:

df = pd.DataFrame({'Address':['a','d','f'],
                   'Age':[4,5,6]})

print (df)
  Address  Age
0       a    4
1       d    5
2       f    6

s = pd.Series([10,4,6], index=['a','f','d'])
print (s)
a    10
f     4
d     6
dtype: int64

df.Age = df.Address.map(s)
#a bit faster in big df
#df.Age = df.Address.map(s.to_dict())
print (df)
  Address  Age
0       a   10
1       d    6
2       f    4

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

使用 Series 更新 DataFrame 中的列的相关文章

python导入模块时如何避免一直写模块名？

我用math最近模块很多我不想写math sqrt x and math sin x 每时每刻我想缩短它并写sqrt x and sin x How 对于较长的模块名称通常会缩短它们例如 import numpy as np 然后您
Python Nose 导入错误

我似乎无法理解鼻子测试框架 https nose readthedocs org en latest 识别文件结构中测试脚本下方的模块我已经设置了演示该问题的最简单的示例下面我会解释一下这是包文件结构 init py foo py t
DataFrame 在函数内部修改

我面临一个我以前从未观察到的函数内数据帧修改的问题有没有一种方法可以处理这个问题以便初始数据帧不被修改 def test df df tt np nan return df dff pd DataFrame data 现在当我打印时d
Spark MLlib - 训练隐式警告

我在使用时不断看到这些警告trainImplicit WARN TaskSetManager Stage 246 contains a task of very large size 208 KB The maximum recommend
KFold 和 ShuffleSplit CV 有什么区别？

看起来 KFold 每次迭代对象时都会生成相同的值而 Shuffle Split 每次都会生成不同的索引它是否正确如果是这样其中一个相对于另一个有什么用处 cv cross validation KFold 10 n folds 2
Python的reduce()短路了吗？

If I do result reduce operator and False 1000 得到第一个结果后它会停止吗自从False anything False 相似地 result reduce operator or True 10
为什么在 Windows 中使用 GetConsoleScreenBufferInfoEx 时控制台窗口会缩小？

我正在尝试使用 GetConsoleScreenBufferInfoEx 和 SetConsoleScreenBufferInfoEx 设置 Windows 命令行控制台的背景和前景色我正在 Python 中使用 wintypes 进行此
Scikit-learn 的内核 PCA：如何在 KPCA 中实现各向异性高斯内核或任何其他自定义内核？

我目前正在使用Scikit learn 的 KPCA https scikit learn org stable modules generated sklearn decomposition KernelPCA html对我的数据集执行降
如何找到列表S的所有分区为k个子集（可以为空）？

我有一个唯一元素列表比方说 1 2 我想将其拆分为 k 2 个子列表现在我想要所有可能的子列表 1 2 1 2 2 1 1 2 我想分成 1 1 2 我怎样才能用 Python 3 做到这一点更新我的目标是获取 N 个唯一数字列表的
在Python中创建一个新表

我正在尝试从数控机床中提取数据事件每毫秒发生一次我需要过滤掉一些用管道分隔的变量分隔符 PuTTy exe 程序生成的日志文件我尝试阅读熊猫但列不在同一位置 df pd read table data log sep 日志文件的一
用Python中的嵌套for循环替换重复的if语句？

在我编写的下面的代码中 n 4 所以有五个 if 语句所以如果我想将 n 增加到比如说 10 那么就会有很多 if 语句因此我的问题是如何用更优雅的东西替换所有 if 语句 n p 4 5 number of trials prob
RuntimeError: 预期所有张量都在同一设备上，但发现至少有两个设备，cpu 和 cuda:0！使用我的模型进行预测时

我使用变压器训练了一个序列分类模型 BertForSequenceClassification 我收到错误预计所有张量都在同一设备上但发现至少有两个设备 cpu 和 cuda 0 在方法wrapper index select中检查参
如何使用 PySpark 有效地将这么多 csv 文件（大约 130,000 个）合并到一个大型数据集中？

我之前发布了这个问题并得到了一些使用 PySpark 的建议如何有效地将这一大数据集合并到一个大数据框中 https stackoverflow com questions 60259271 how can i merge this la
求解不等式系统时“多项式错误：仅允许使用单变量多项式”

我想找到以下两个常数的区间cons1 and cons2我写了下面的代码 from sympy import Poly from sympy import Abs from sympy solvers inequalities import
为什么“return self”返回 None ？ [复制]

这个问题在这里已经有答案了我正在尝试获取链的顶部节点getTopParent 当我打印出来时self name 它确实打印出了父实例的名称然而当我回来时self 它返回 None 为什么是这样 class A def init sel
从 IMDbPy 结果中的片目中获取电影 ID

我正在尝试创建一个数据集允许我根据 Python IMDb API 中的演员 ID 和电影 ID 加入演员和电影现在我正在尝试从演员的电影作品中提取电影 ID 列表但无法做到例如我知道 Rodney Dangerfield 在
smooth_idf 是多余的吗？

The scikit learn 文档 http scikit learn org stable modules generated sklearn feature extraction text TfidfTransformer html
Jupyter Notebook：没有名为 pandas 的模块

我搜索了其他问题但没有找到任何有帮助的内容大多数只是建议您使用 conda 或 pip 安装 pandas 在我的 jupyter 笔记本中我试图导入 pandas import pandas as pd 但我收到以下错误 Modul
Spyder 如何在同一线程的后台运行 asyncio 事件循环（或者确实如此？）

我已经研究 asyncio 模块功能几天了因为我想将它用于我的应用程序的 IO 绑定部分并且我认为我现在对它的工作原理有一个合理的理解或者在至少我认为我已经理解了以下内容任一时刻任一线程中只能运行一个异步事件循环一旦一切都设置
最小硬币找零问题——回溯

我正在尝试用最少数量的硬币解决硬币找零问题采用回溯法我实际上已经完成了它但我想添加一些选项按其单位打印硬币数量而不仅仅是总数这是我下面的Python代码 def minimum coins coin list change mi

随机推荐

如何通过 *ngFor 在 Angular 2 TypeScript 前端显示 json 数组

下面是 angular2 简单的前端页面 table class table tr th title th th description th tr tr td notes title td td notes body td tr tabl
MySQL：使用附加哈希字段的唯一文本字段

在我的 MySQL 数据库中我有一个表定义如下 CREATE TABLE mytablex cs id mediumint 8 unsigned NOT NULL AUTO INCREMENT tag varchar 6 COLLATE
MySQL JOIN 行（如果存在）否则填充 NULL

我有两张人名和财产表有些还没有条目我想创建所有人及其属性如果可用的完整列表否则将他们与属性 NULL 一起列出这是我的简化示例 names id name 1 Jon 2 Peter 3 Sam 4 Bruce 特性 names
在多选模式下启用/禁用列表视图中的项目选择

我在多选模式下为上下文菜单注册了一个列表视图 private void initListViewForContextMenu log d FilesFragment initListViewForContextMenu ListView l
自定义 jqGrid 中的添加/编辑对话框

抱歉我不能发布图片我太新了在 jqGrid 添加编辑对话框中我想根据之前所做的选择加载可选项目的列表在上图中应根据条件选择中选择的值加载值选择我相信要走的路线是使用 editoptions 对象中的 dataurl 但我在这
找不到 javafx.controls JavaFX 11 / JDK 11.0.1 [重复]

这个问题在这里已经有答案了我正在使用 IntelliJ 我已经尝试过所有其他似乎对其他人都有效的解决方案我收到一个错误 Caused by java lang IllegalAccessError class com sun javaf
使用泛型参数关闭

我在将以下函数编写为闭包时遇到问题 func myfunc
删除 VSCode PHP 调试中的字符限制

在 PHP 中进行调试并使用左侧的变量窗格时将鼠标悬停在该变量对象上时可以看到的字符数是有限的无论如何是否可以查看该变量的完整有效负载或除了必须使用之外的任何解决方法file put contents每次我想看到一个大的变量值将变
jQuery data() 返回未定义，attr() 返回整数

我有以下代码 alert embellishment data embellishmentId alert embellishment attr data embellishmentId 第一个警报返回undefined 而第二个警报返回一
如何在 Perl 中异步运行系统命令？

我目前有一个 Perl 脚本它在系统上运行外部命令收集输出并根据返回的内容执行一些操作现在这是我运行它的方式其中 cmd 是带有命令设置的字符串 output cmd 我想更改此设置以便如果命令挂起并且在很长时间后没有返回值
Lucene 模糊搜索客户名称和部分地址

我浏览了所有现有的问题帖子但找不到相关的内容我有数百万条记录包括个人名字姓氏地址 1 地址 2 国家地区代码出生日期我想每天使用上述文件检查我的客户列表我的客户列表也会每天更新并且文件也每天更新对于名字和姓氏我想要模
点击 iPhone 上的文本输入字段会弹出键盘，但打字不会输入任何文本

我正在努力使页面更具响应性为此我试图确保网页在移动设备上的外观和功能符合预期在桌面上它按预期工作在 iPhone 上它看起来与预期一致但无法按预期工作如果您选择输入字段它将聚焦并调出键盘但是它不会让您输入任何内容如果您
NSFetchRequest 和 predicateWithBlock

我正在使用一个使用 Core Data 和 NSManagedObjects 来填充 UITableView 的应用程序我的应用程序中只有一个类称为Event 我创建了以下自定义实例方法Event BOOL isExpired retu
如何从控制台应用程序中的 config.json 读取值

我刚刚安装了 ASP NET 5 并在 Visual Studio 中创建了一个控制台应用程序我已将文件 config json 添加到项目的根文件夹中它看起来像这样 Data TargetFolderLocations TestFol
在Python中检索所有Cookie

如何在不知道名称的情况下用 Python 读回所有 cookie 不确定这是否是您正在寻找的内容但这是一个简单的示例您将 cookie 放入 cookiejar 中并读回它们 from urllib2 import Request bu
无法解析主机：bitbucket.org；提供节点名或服务名，或未知

每次我尝试使用终端从 Bitbucket 克隆任何存储库时都会出现此错误 git clone https email protected cdn cgi l email protection me myrepo git Cloning i
姜戈。如何保存用 Pillow 编辑的内容文件

我正在尝试保存下载的图像requests然后编辑Pillow to ImageField在一个模型中但物体是在没有图像的情况下被创建的这就是我所拥有的设置 py MEDIA ROOT BASE DIR media MEDIA URL
NameError（未初始化常量 Unzipper::Zip），但仅限于 Heroku 部署 (Rails)

我有课unzipper rb使用 Rubyzip 解压缩文件在我的本地环境中我可以成功解压缩文件而无需使用显式包含依赖项require zip 不过在 Heroku 上我得到了NameError uninitialized cons
无形状：从副产品映射到不同的副产品

在下面我尝试创建一个多态函数来转换RawFeatureValue into a RefinedFeatureValue import shapeless object test type RawFeatureValue Int Doubl
使用 Series 更新 DataFrame 中的列

我有一个DataFrame对象在pandas具有多个行和列出于说明目的假设我有两个这样的列名为Address and Age 我也有一个Series将多个地址映射到年龄的对象现在我想使用该系列更新数据框这是我目前的做法 for

使用 Series 更新 DataFrame 中的列

使用 Series 更新 DataFrame 中的列 的相关文章

随机推荐

热门标签

使用 Series 更新 DataFrame 中的列的相关文章