如何过滤一组 (int, str) 元组，以仅返回第一个元素中具有最小值的元组？

2023-12-06

假设我有一组表示带有“分数”的 URL 的元组：

{(0.75, 'http://www.foo.com'), (0.33, 'http://www.bar.com'), (0.5, 'http://www.foo.com'), (0.66, 'http://www.bar.com')}.

有什么简洁的方法可以过滤掉重复的 URL，只返回分数最低的 URL？也就是说，从上面的示例集中，我想得到以下集合，其中每个 URL 只出现一次，并且原始集合中对应的分数最低：

{(0.5, 'http://www.foo.com'),(0.33, 'http://www.bar.com')}

我想出了以下解决方案：

from collections import defaultdict

seen = defaultdict(lambda:1)
for score, url in s:
    if score < seen[url]:
        seen[url] = score

filtered = {(v,k) for k,v in seen.items()}

...但我觉得可能有一些更简单、更有效的方法来做到这一点，而不使用中间字典来跟踪最大元素，然后从中重新生成集合。通过第一个元素的最小值/最大值过滤一组元组的最佳方法是什么？

您已经实现了我能想到的最简单的方法。我要做的唯一改变是循环——一个稍微更简洁的版本是使用min.

seen = defaultdict(lambda: 1)  # `lambda: float('inf')` if scores can be > 1
for score, url in s:
    seen[url] = min(seen[url], score)

{(v,k) for k,v in seen.items()}
# {(0.33, 'http://www.bar.com'), (0.5, 'http://www.foo.com')}

如果你真的想要一个更短的解决方案，就像我说的那样，这不是最简单的方法，但它是一个简单的方法。大多数挑战是交换 URL 和分数，以便您可以在删除重复项时使用 URL 作为键。不言而喻，排序是这里的先决条件（这就是为什么我不像上面的解决方案那样喜欢这个解决方案）。

{(v, k) for k, v in dict(sorted(((v, k) for k, v in s), reverse=True)).items()}
# {(0.33, 'http://www.bar.com'), (0.5, 'http://www.foo.com')}

这个解决方案会变得更短，如果s看起来像这样：

s2 = {(v,k) for k, v in s}
s2 
# {('http://www.bar.com', 0.33), ('http://www.bar.com', 0.66), ...}

你只需要这样做

list(dict(sorted(s2, reverse=True)).items())
# [('http://www.foo.com', 0.5), ('http://www.bar.com', 0.33)]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

filter

set

tuples

min

如何过滤一组 (int, str) 元组，以仅返回第一个元素中具有最小值的元组？的相关文章

如何传递架构以从现有数据帧创建新数据帧？

要将 schema 传递到 json 文件我们这样做 from pyspark sql types import StructField StringType StructType IntegerType data schema Stru
matplotlib 图中点的标签

所以这是一个关于已发布的解决方案的问题我试图在我拥有的 matplotlib 散点图中的点上放置一些数据标签我试图在这里模仿解决方案是否有与 MATLAB 的 datacursormode 等效的 matplotlib https s
NLTK 2.0分类器批量分类器方法

当我运行此代码时它会抛出一个错误我认为这是由于 NLTK 3 0 中不存在batch classify 方法我很好奇如何解决旧版本中的某些内容在新版本中消失的此类问题 def accuracy classifier gold resu
嵌套列表的重叠会产生不必要的间隙

我有一个包含三个列表的嵌套这些列表由 for 循环填充并且填充由 if 条件控制第一次迭代后它可能类似于以下示例 a 1 2 0 0 0 0 0 0 4 5 0 0 0 0 0 0 6 7 根据条件它们不重叠在第二次迭代之后新
如何从Python中的函数返回多个值？ [复制]

这个问题在这里已经有答案了如何从Python中的函数返回多个变量您可以用逗号分隔要返回的值 def get name you code return first name last name 逗号表示它是一个元组因此您可以用括号将值括
从Django中具有外键关系的两个表中检索数据？ [复制]

这个问题在这里已经有答案了 This is my models py file from django db import models class Author models Model first name models CharFie
为什么 web2py 在启动时崩溃？

我正在尝试让 web2py 在 Ubuntu 机器上运行所有文档似乎都表明要在 nix 系统上运行它您需要下载源代码并执行以下操作蟒蛇 web2py py 我抓住了source http www web2py com examples
更好地相当于这个疯狂的嵌套 python for 循环

for a in map for b in map a for c in map b for d in map c for e in map d print a b c d e 上面的代码用于创建图中一定长度的所有路径 map a 表示从
Java 和 Python 可以在同一个应用程序中共存吗？

我需要一个 Java 实例直接从 Python 实例数据存储中获取数据我不知道这是否可能数据存储是否透明唯一或者每个实例如果它们确实可以共存都有其单独的数据存储总结一下 Java 应用程序如何从 Python 应用程序的数据存
使用 python/numpy 重塑数组

我想重塑以下数组 gt gt gt test array 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 为了得到 gt gt gt test2 array 11 12 21 22 13 14
导入错误：没有名为flask.ext.login的模块

我的flask login 模块有问题我已经成功安装了flask login模块另外从命令提示符我可以轻松运行此脚本不会出现错误 Python 2 7 r27 82525 Jul 4 2010 07 43 08 MSC v 1500
通过Python连接到Bigquery：ProjectId和DatasetId必须非空

我编写了以下脚本来通过 SDK 将 Big Query 连接到 Python 如下所示 from google cloud import bigquery client bigquery Client project My First Pr
Django 视图中的“请求”是什么

在 Django 第一个应用程序的 Django 教程中我们有 from django http import HttpResponse def index request return HttpResponse Hello world
如何将 ascii 值列表转换为 python 中的字符串？

我在 Python 程序中有一个列表其中包含一系列数字这些数字本身就是 ASCII 值如何将其转换为可以在屏幕上回显的常规字符串您可能正在寻找 chr gt gt gt L 104 101 108 108 111 44 32 1
Pandas 组合不同索引的数据帧

我有两个数据框df 1 and df 2具有不同的索引和列但是有一些索引和列重叠我创建了一个数据框df索引和列的并集因此不存在重复的索引或列我想填写数据框df通过以下方式 for x in df index for y in df
如何使用 Python 3 检查目录是否包含文件

我到处寻找这个答案但找不到我正在尝试编写一个脚本来搜索特定的子文件夹然后检查它是否包含任何文件如果包含则写出该文件夹的路径我已经弄清楚了子文件夹搜索部分但检查文件却难倒了我我发现了有关如何检查文件夹是否为空的多个建议并且我尝
为什么 csv.DictReader 给我一个无属性错误？

我的 CSV 文件是 200 Service 我放入解释器的代码是 snav csv DictReader open screennavigation csv delimiter print snav fieldnames 200 for
Python：Goslate 翻译请求返回“503：服务不可用”[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我们不允许提出寻求书籍工具软件库等推荐的问题您可以编辑问题以便用事实和引文来回答这个问题似乎不是关于主要由程序员使用的特定编程问
根据 Pandas 中的列表选择数据框行的子集

我有一个数据框df1并列出x In 22 import pandas as pd In 23 df1 pd DataFrame C range 5 B range 10 20 2 A list abcde In 24 df1 Out 24
将索引与值交换的最快方法

考虑pd Series s s pd Series list abcdefghij list ABCDEFGHIJ s A a B b C c D d E e F f G g H h I i J j dtype object 交换索引和值并

随机推荐

UNIX shell 脚本中的“#!/bin/sh”行是什么意思？

我正在浏览一些 shell 脚本教程并找到以下示例程序 bin sh clear echo HELLO WORLD 谁能告诉我这个评论的意义是什么 bin sh一开始是它被称为一个shebang 并告诉父 shell应该使用哪种解释器执行
有效检测Python中的符号变化

我想做这个人所做的事情 Python 计算符号变化但是我需要优化它以使其运行速度超快简而言之我想获取一个时间序列并告诉它每次穿过零改变符号我想记录过零之间的时间由于这是真实数据 32 位浮点数我怀疑每个数字都会为零所以这并不
我是否应该使用互斥锁来保护基元类型上的操作，以便在 C++ 中实现线程安全？

对于相当简单的操作实现线程安全的最佳方法是什么考虑一对函数 void setVal int val this gt val val int getVal return this gt val 由于即使基本类型的赋值也不能保证是原子的我是
将 IUnknowns 的 SAFEARRAY 转换/转换为接口指针的可迭代数组

我在 C 中有以下接口并有一个同名的类没有 I 实现它 ComVisible true Guid B2B134CC 70A6 43CD 9E1E B3A3D9992C3E public interface IOrder long Get
在代码中获取 java.lang.NumberFormatException

Code I have TriangleSummer具有类变量的类 static BufferedReader reader new BufferedReader new InputStreamReader System in 我的主要功能
获取 QuotaExceededException - Azure 通知中心的操作配额限制是什么？

我正在做一些延迟性能测试通过在 foreach 循环中连续发送许多通知使用 Azure 通知中心发送推送通知对于 100 个 SendNotification 请求它工作得很好尽管它相对较慢 14 秒但我得到了一个QuotaE
Android：在 Activity 生命周期中何时调用 onCreateOptionsMenu？

我在其中放置了几个断点onCreate 一个在方法的开头一个在方法的结尾我还在方法的开头放了一个onCreateOptionsMenu The onCreate方法首先被调用并且在它完成之前onCreateOptionsMenu叫做
程序类型已存在：com.squareup.okhttp.Address

我正在尝试配置我的 Android 应用程序以使用 Firebase Cloud Firestore 我也依赖 OKHttp3 Gradle 可以正常同步但我无法编译应用程序并运行它我收到以下错误程序类型已存在 com squareu
替换 Apache Derby 中的字符串

Apache Derby 是否有办法用另一个字符串替换一个字符串我正在寻找类似的东西 select replace bruce bogtrotter bruce john from SYSIBM SYSDUMMY1 Apache Derb
如何将文件指针 ( FILE* fp ) 转换为文件描述符 (int fd)？

我有一个FILE 通过调用返回fopen 我需要从中获取文件描述符以进行类似的调用fsync fd 在上面从文件指针获取文件描述符的函数是什么正确的函数是int fileno FILE stream 它可以在以下位置找到
C# 相当于 AES 的 Java SecretKeySpec

我有以下用java编写的代码我需要 C 等效项 Key key new SecretKeySpec keyValue AES Cipher c Cipher getInstance AES c init 1 key byte encVal
全局赋值、并行和 foreach

我刚刚完成对多组数据的长时间运行分析 24 小时以上因为我很懒不想处理多个R会话并将结果汇总在一起我使用并行运行它们foreach 分析返回一个充满结果和中间对象的环境因此我尝试将结果分配给全局环境却发现这不起作用下面是一
使用 Hive JDBC 执行程序时出错

我为 Hive JDBC 编写了这个小程序最初它执行得很好但是当我现在尝试运行时突然出现错误 Program import java io FileWriter import java io InputStream import jav
我可以对自定义查询进行分页而不覆盖默认分页吗？

在我的 CakePHP 1 2 应用程序中我有两个都使用分页的操作索引和搜索在上一个问题中我了解到为了将阈值分数应用于搜索结果我需要使用HAVINGMySQL 关键字由于 CakePHP 本身不支持此功能因此我需要下拉到自定
如何将 Javascript 变量传递给和 JSTL？

如何将 Javascript 变量传递给 JSTL 您需要将其作为请求参数发送其中一种方法是填充隐藏的输入字段
连接mysql并运行命令的批处理文件

我想从 Windows 运行一个批处理文件它连接到不同计算机上的 mysql 服务器并从数据库运行一个过程或运行位于我本地计算机中的 sql 文件有办法做到吗我知道我的批处理文件中需要以下脚本来运行 sql 命令但我相信它只有在
BigQuery 无法从 CSV 文件中解析 M/D/YYYY 格式的日期

Problem 我正在尝试从 Google Cloud Storage 中的 CSV 文件创建 BigQuery 表我明确定义了加载作业的架构如下并设置要跳过的标题行 1 Data cat date formatting test c
如何更改 knit 中 kable 输出表中单元格的颜色

如果单元格的值大于 80 我需要为单元格着色例如给定这个名为 df 的数据框 dput df structure list Server structure 1 2 Label c Server1 Server2 class facto
将输出写入 Graphchi 中的文件

我在 Graphchi 中编写了一个最短路径代码我想在文件中打印该代码的输出我试图使用示例中显示的模板但如果我使用与其他示例中相同的写入文件的方式则会出现错误我被困在这里了作为输出我只想打印顶点 ID 距源的最小距离我怎样
如何过滤一组 (int, str) 元组，以仅返回第一个元素中具有最小值的元组？

假设我有一组表示带有分数的 URL 的元组 0 75 http www foo com 0 33 http www bar com 0 5 http www foo com 0 66 http www bar com 有什么简洁的方法可

如何过滤一组 (int, str) 元组，以仅返回第一个元素中具有最小值的元组？

如何过滤一组 (int, str) 元组，以仅返回第一个元素中具有最小值的元组？ 的相关文章

随机推荐

热门标签

如何过滤一组 (int, str) 元组，以仅返回第一个元素中具有最小值的元组？的相关文章