Python Pandas：如何在数据帧的列中拆分排序字典

2023-12-21

我有一个像这样的数据框：

id  asn      orgs
0   3320    {'Deutsche Telekom AG': 2288}
1   47886   {'Joyent': 16, 'Equinix (Netherlands) B.V.': 7}
2   47601   {'fusion services': 1024, 'GCE Global Maritime':16859}  
3   33438   {'Highwinds Network Group': 893}

我想对“orgs”列进行排序，它实际上是一个字典，然后提取两个不同列中具有最高值的对（k，v）。像这样：

id  asn      org                      value
0   3320    'Deutsche Telekom AG'     2288
1   47886   'Joyent'                  16
2   47601   'GCE Global Maritime'     16859 
3   33438   'Highwinds Network Group' 893

目前我正在运行此代码，但它无法正确排序，然后我不确定如何提取具有最高值的对。

df.orgs.apply(lambda x : sorted(x.items(),key=operator.itemgetter(1),reverse=True))

这给了我一个这样的列表：

id  asn      orgs
0   3320    [('Deutsche Telekom AG', 2288)]
1   47886   [('Joyent', 16),( 'Equinix (Netherlands) B.V.', 7)]
2   47601   [('GCE Global Maritime',16859),('fusion services', 1024)]   
3   33438   [('Highwinds Network Group', 893)]

现在我怎样才能将键和最高的值放入两个单独的列中？有人可以帮忙吗？

另一种方法定义一个只调用的函数min在字典上并返回一个系列，以便您可以分配给多个列（函数体取自@亚历克斯·马泰利的回答 https://stackoverflow.com/questions/3282823/get-key-with-the-least-value-from-a-dictionary):

In [17]:

def func(x):
    k = min(x, key=x.get)
    return pd.Series([k, x[k]])
df[['orgs', 'value']] = df['orgs'].apply(func)
df

Out[17]:
     asn  id                        orgs  value
0   3320   0         Deutsche Telekom AG   2288
1  47886   1  Equinix (Netherlands) B.V.      7
2  47601   2             fusion services   1024
3  33438   3     Highwinds Network Group    893

EDIT

如果你的数据有空的dicss，那么你可以只测试len:

In [34]:

df = pd.DataFrame({'id':[0,1,2,3,4],
                   'asn':[3320,47886,47601,33438,56],
                   'orgs':[{'Deutsche Telekom AG': 2288},
                           {'Joyent': 16, 'Equinix (Netherlands) B.V.': 7},
                           {'fusion services': 1024, 'GCE Global Maritime':16859},
                           {'Highwinds Network Group': 893},{}]})
df
Out[34]:
     asn  id                                               orgs
0   3320   0                      {'Deutsche Telekom AG': 2288}
1  47886   1    {'Equinix (Netherlands) B.V.': 7, 'Joyent': 16}
2  47601   2  {'GCE Global Maritime': 16859, 'fusion service...
3  33438   3                   {'Highwinds Network Group': 893}
4     56   4                                                 {}
In [36]:

def func(x):
    if len(x) > 0:
        k = min(x, key=x.get)
        return pd.Series([k, x[k]])
    return pd.Series([np.NaN, np.NaN])

df[['orgs', 'value']] = df['orgs'].apply(func)
df

Out[36]:
     asn  id                        orgs  value
0   3320   0         Deutsche Telekom AG   2288
1  47886   1  Equinix (Netherlands) B.V.      7
2  47601   2             fusion services   1024
3  33438   3     Highwinds Network Group    893
4     56   4                         NaN    NaN

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Sorting

Dictionary

pandas

DataFrame

Python Pandas：如何在数据帧的列中拆分排序字典的相关文章

为什么 dataclasses.astuple 返回类属性的深层副本？

在下面的代码中astuple函数正在执行数据类的类属性的深层复制为什么它不能产生与函数相同的结果my tuple import copy import dataclasses dataclasses dataclass class Dem
matplotlib 图中点的标签

所以这是一个关于已发布的解决方案的问题我试图在我拥有的 matplotlib 散点图中的点上放置一些数据标签我试图在这里模仿解决方案是否有与 MATLAB 的 datacursormode 等效的 matplotlib https s
Django Rest Framework 是否有第三方应用程序来自动生成 swagger.yaml 文件？

我有大量的 API 端点编写在django rest framework并且不断增加和更新如何创建和维护最新的 API 文档我当前的版本是 Create swagger yaml文件并以某种方式在每次端点更改时自动生成然后使用此文件作
如何从Python中的函数返回多个值？ [复制]

这个问题在这里已经有答案了如何从Python中的函数返回多个变量您可以用逗号分隔要返回的值 def get name you code return first name last name 逗号表示它是一个元组因此您可以用括号将值括
更好地相当于这个疯狂的嵌套 python for 循环

for a in map for b in map a for c in map b for d in map c for e in map d print a b c d e 上面的代码用于创建图中一定长度的所有路径 map a 表示从
在 DataFrame.withColumn 中，如何检查列的值是否为 null 作为第二个参数的条件？

如果我有一个名为 df 的 DataFrame 如下所示 a1 a2 foo bar N A baz null etc 我可以有选择地替换值如下所示 val df2 df withColumn a1 when a1 N A a2 这样 d
Python 3：将字符串转换为变量[重复]

这个问题在这里已经有答案了我正在从 txt 文件读取文本并且需要使用我读取的数据之一作为类实例的变量 class Sports def init self players 0 location name self players pla
使用 Python Oauthlib 通过服务帐户验证 Google API

我不想使用适用于 Python 的 Google API 客户端库但仍想使用 Python 访问 Google APIOauthlib https github com idan oauthlib 创建服务帐户后谷歌开发者控制台 http
导入错误：没有名为flask.ext.login的模块

我的flask login 模块有问题我已经成功安装了flask login模块另外从命令提示符我可以轻松运行此脚本不会出现错误 Python 2 7 r27 82525 Jul 4 2010 07 43 08 MSC v 1500
尽管我已在 python ctypes 中设置了信号处理程序，但并未调用它

我尝试过使用 sigaction 和 ctypes 设置信号处理程序我知道它可以与python中的信号模块一起使用但我想尝试学习当我向该进程发送 SIGTERM 时但它没有调用我设置的处理程序只打印终止为什么它不调用处理程序
Django REST Framework - CurrentUserDefault 使用

我正在尝试使用CurrentUserDefault一个序列化器的类 user serializers HiddenField default serializers CurrentUserDefault 文档说为了使用它请求必须作为
如何使用 Python 3 检查目录是否包含文件

我到处寻找这个答案但找不到我正在尝试编写一个脚本来搜索特定的子文件夹然后检查它是否包含任何文件如果包含则写出该文件夹的路径我已经弄清楚了子文件夹搜索部分但检查文件却难倒了我我发现了有关如何检查文件夹是否为空的多个建议并且我尝
Spider 必须返回 Request、BaseItem、dict 或 None，已“设置”

我正在尝试从以下位置下载所有产品的图像我的蜘蛛看起来像 from shopclues items import ImgData import scrapy class multipleImages scrapy Spider name m
带有 LSTM 的 GridSearchCV/RandomizedSearchCV

我一直在尝试通过 RandomizedSearchCV 调整 LSTM 的超参数我的代码如下 X train X train reshape X train shape 0 1 X train shape 1 X test X test
Python：Goslate 翻译请求返回“503：服务不可用”[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我们不允许提出寻求书籍工具软件库等推荐的问题您可以编辑问题以便用事实和引文来回答这个问题似乎不是关于主要由程序员使用的特定编程问
Firebase Firestore：获取文档的生成 ID (Python)

我可以创建一个新文档带有自动生成的 ID 并存储对其的引用如下所示 my data key value doc ref db collection u campaigns add my data 我可以像这样访问数据本身 print d
如何从pandas中的多列计算多列

我正在尝试使用函数从 pandas 数据框中的多个列计算多个列该函数采用三个参数 a b 和 c 并返回三个计算值 sum prod 和 quot 在我的 pandas 数据框中我有三个列 a b 和 c 我想从中计算列 sum pro
等待子进程使用 os.system

我用了很多os system在 for 循环内调用创建后台进程如何等待所有后台进程结束 os wait告诉我没有子进程 ps 我使用的是Solaris 这是我的代码 usr bin python import subprocess imp
将索引与值交换的最快方法

考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并
JSON：TypeError：Decimal（'34.3'）不是JSON可序列化的[重复]

这个问题在这里已经有答案了我正在运行一个 SQL 查询它返回一个小数列表当我尝试将其转换为 JSON 时出现类型错误查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS

随机推荐

iPhone - SKProductsRequest 和“消息发送到已解除分配的实例”

我在实施 InAppPurchase 时遇到了麻烦我的购买实现是在模态视图控制器 AppUpgradeViewController 中实现的我从另一个模态视图中呈现它我这样做 AppUpgradeViewController appU
Android 禁用列表视图项目

所以基本上我需要一些帮助或一些关于我遇到的问题的建议我正在从数据库填充列表视图并且需要在创建列表视图时检查该项目的 id 是否已打开position与我数据库中另一个表的 id 相同如果是您可以单击该项目如果不是我希望它禁用它
当鼠标在 JFrame 内移动时，Swing Timer 停止调用 actionPerformed()

如果我将鼠标移入javax swing JFrame the javax swing Timer停止呼叫actionPerformed 方法直到鼠标停止移动仅当我使用 Rocket Kone XTD 鼠标移动光标时才会出现这种情况当我
重启CF服务器会导致所有人退出吗？

如果CF服务器重新启动所有现有的Session和Client变量是否都会丢失客户端变量通常存在于数据库或注册表中因此它们在服务器重新启动后仍然存在请参阅here http help adobe com en US ColdFusio
所有单元测试都用 Moq 抛出 BadImageFormatException 吗？

我目前正在增加我们软件产品的代码覆盖率但遇到了一个问题我的所有单元测试当使用任何 CPU 编译时都因抛出 BadImageFormatException 而失败可以通过使用 x86 而不是任何 CPU 构建解决方案来规避此异常
Xcode - 使用#pragma 标记

我很确定这不是重复的你使用 pragma 标记吗我看了很多方法哪个是正确的 pragma mark pragma mark Actions pragma mark pragma mark pragma mark Actions pra
: 在 vim 中用全颜色方案硬拷贝一个文件

我想使用全彩打印我在 MacVIM 中编辑的一些文件包括深色背景当然我不会将其发送到打印机我只想将其保存为PDF hardcopy 删除背景并应用丑陋的方案是否可以而是使用 TOhtml 这是一个通常包含在默认 Vim 运行时中的
boost::bind 的返回类型是什么？

我想将函数的绑定器保存到变量中以便通过利用其运算符重载功能在以下代码中重复使用它这是实际执行我想要的操作的代码 include
statsmodels“LinAlgError：奇异矩阵”中的逻辑回归

不知道为什么但在拟合逻辑回归模型时出现 numpy linalg linalg LinAlgError 奇异矩阵错误 from sklearn datasets import load breast cancer from sklear
具有流源的查询必须使用 writeStream.start();; 执行

我正在尝试使用 Spark 结构化流从 Kafka 读取数据并预测传入数据我正在使用使用 Spark ML 训练过的模型 val spark SparkSession builder appName Spark SQL basic exa
从内核态写入文件

我想从内核空间写入日志文件我可以创建打开和关闭文件 var log my kern module log 但如果我尝试写入某些内容我的模块就会崩溃所以我知道从内核空间读写文件是不好的但我必须这样做它在这个模块中您有什么建议可以
用于验证地址的 JavaScript 正则表达式

我想使用正则表达式验证 JavaScript 中的居住地址但我对正则表达式了解不多我尝试过构建自己的正则表达式 a zA Z s d 但它似乎无法正常工作我想要实现的是允许字母空格和至少一个数字这是必需的并且还应该可以插入斜杠
ASP.Net MVC 框架是否有与 Monorail 视图组件等效的组件？

我大量使用查看组件 http ayende com Blog archive 2007 04 08 Building View Components For MonoRail aspx在我用 Monorail 构建的一些大型应用程序中 AS
如何让 Selenium 在 Linux 上与 PHP/Firefox3 一起工作

我想得到硒RC http selenium rc openqa org tutorial html使用 PHP Apache 在 Linux 上使用 Firefox 3 但遇到问题这是我所做的我已经安装了 Firefox Seleniu
我应该限制或减少数据库查询吗？

我正在创建一个 PHP 脚本将文本文件中的一些数据导入 MySQL 数据库这些文本文件非常大平均一个文件有 10 000 行每一行对应于我想要在数据库中添加的一个新项目我不会经常导入文件我担心从文件中读取一行然后连续执行 10
C++ 中使用不同对象类型作为操作数的运算符重载

class myClass public int myVal myClass int val myVal val myClass operator myClass obj myVal myVal obj myVal return this
两个并排浮动的div，高度相同（后续）

我之前的问题在这里得到了回答两个并排的浮动 div 高度相同 https stackoverflow com questions 12556856 two floating divs side by side same height 12
更新列表中的属性字段

我有一个List
对 Elixir 中的重复字母进行分组或计数

我正在尝试计算 Elixir 中字符串上的重复字母我确实尝试过一些尝试但到目前为止还没有成功我们以这个字符串为例 AAABBAAC 期望的输出是 3A2B2A1C 将此字符串转换为List 我能够数出每个字母结果是 5A2B1C 但
Python Pandas：如何在数据帧的列中拆分排序字典

我有一个像这样的数据框 id asn orgs 0 3320 Deutsche Telekom AG 2288 1 47886 Joyent 16 Equinix Netherlands B V 7 2 47601 fusion servi

Python Pandas：如何在数据帧的列中拆分排序字典

Python Pandas：如何在数据帧的列中拆分排序字典 的相关文章

随机推荐

热门标签

Python Pandas：如何在数据帧的列中拆分排序字典的相关文章