使用从两列计算出的键对 CSV 进行排序，获取前 n 个最大值

2024-05-20

这里是 Python 业余爱好者...假设这里我有一个示例 csv 文件的片段：

Country, Year, GDP, Population
Country1,2002,44545,24352
Country2,2004,14325,75677
Country3,2005,23132412,1345234
Country4,,2312421,12412

我需要按某一年（例如 2002 年）的人均 GDP（GDP/人口）降序对文件进行排序，然后获取人均 GDP 值最大的前 10 行。

到目前为止，在我将 csv 导入到“data”变量后，我使用以下命令获取了所有 2002 年的数据，而没有丢失字段：

data_2 = []
for row in data:
if row[1] == '2002' and row[2]!= ' ' and row[3] != ' ':
    data_2.append(row)

我需要找到某种方法来排序data_2 by row[2]/row[3]降序，最好不使用类，然后抓取与每个最大 10 个值相关的每一整行，然后写入另一个 csv。如果有人能指出我正确的方向，我将永远感激不已，因为我已经尝试了无数的谷歌......

这种方法使您能够对文件进行一次扫描，以获得每个国家/地区的前 10 名...

无需pandas通过利用heapq模块，以下内容未经测试，但应该作为您参考适当文档并根据您的目的进行调整的基础：

import csv
import heapq
from itertools import islice

freqs = {}
with open('yourfile') as fin:
    csvin = csv.reader(fin)
    rows_with_gdp = ([float(row[2]) / float(row[3])] + row for row in islice(csvin, 1, None) if row[2] and row[3])
    for row in rows_with_gdp:
        cnt = freqs.setdefault(row[2], [[]] * 10) # 2 = year, 10 = num to keep
        heapq.heappushpop(cnt, row)

for year, vals in freqs.iteritems():
    print year, [row[1:] for row in sorted(filter(None, vals), reverse=True)]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Sorting

csv

使用从两列计算出的键对 CSV 进行排序，获取前 n 个最大值的相关文章

Django REST序列化器：创建对象而不保存

我已经开始使用 Django REST 框架我想做的是使用一些 JSON 发布请求从中创建一个 Django 模型对象然后使用该对象而不保存它我的 Django 模型称为 SearchRequest 我所拥有的是 api view
如何在android上的python kivy中关闭应用程序后使服务继续工作

我希望我的服务在关闭应用程序后继续工作但我做不到我听说我应该使用startForeground 但如何在Python中做到这一点呢应用程序代码 from kivy app import App from kivy uix floatl
如何在 Sublime Text 2 的 OSX 终端中显示构建结果

我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它让我困扰的一件事是默认的构建结果显示在 ST2 的底部我的程序产生一些很长的结果显示它的理想方式如在 TM2 中是并排查看它们如何在 Mac 操作系统
从列表中的数据框列中搜索部分字符串匹配 - Pandas - Python

我有一个清单 things A1 B2 C3 我有一个 pandas 数据框其中有一列包含用分号分隔的值某些行将包含与上面列表中的一项的匹配它不会是完美的匹配因为它在其中包含字符串的其他部分该列例如该列中的一行可能有哇这里
使用 Pycharm 在 Windows 下启动应用程序时出现 UnicodeDecodeError

问题是当我尝试启动应用程序 app py 时我收到以下错误 UnicodeDecodeError utf 8 编解码器无法解码位置 5 中的字节 0xb3 起始字节无效整个文件app py coding utf 8 from flask
python pandas 中的双端队列

我正在使用Python的deque 实现一个简单的循环缓冲区 from collections import deque import numpy as np test sequence np array range 100 2 resha
Abaqus 将曲面转化为集合

我一直试图在模型中找到两个表面的中心参见照片但未能成功它们是元素表面面查询中没有选项可以查找元素表面的中心只能查找元素集的中心找到节点集的中心也很好但是我的节点集没有出现在工具 gt 查询 gt 质量属性选项中而且我找不到
表达式中的 Python 'in' 关键字与 for 循环中的比较 [重复]

这个问题在这里已经有答案了我明白什么是in运算符在此代码中执行的操作 some list 1 2 3 4 5 print 2 in some list 我也明白i将采用此代码中列表的每个值 for i in 1 2 3 4 5 print
如何将 numpy.matrix 提高到非整数幂？

The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
ExpectedFailure 被计为错误而不是通过

我在用着expectedFailure因为有一个我想记录的错误我现在无法修复但想将来再回来解决我的理解expectedFailure是它会将测试计为通过但在摘要中表示预期失败的数量为 x 类似于它如何处理跳过的 tets 但是当我
Python：尝试检查有效的电话号码

我正在尝试编写一个接受以下格式的电话号码的程序XXX XXX XXXX并将条目中的任何字母翻译为其相应的数字现在我有了这个如果启动不正确它将允许您重新输入正确的数字然后它会翻译输入的原始数字我该如何解决 def main phon
Python - 按月对日期进行分组

这是一个简单的问题起初我认为很简单而忽略了它一个小时过去了我不太确定所以我有一个Python列表datetime对象我想用图表来表示它们 x 值是年份和月份 y 值是此列表中本月发生的日期对象的数量也许一个例子可以更好地证明这
Python - 在窗口最小化或隐藏时使用 pywinauto 控制窗口

我正在尝试做的事情我正在尝试使用 pywinauto 在 python 中创建一个脚本以在后台自动安装 notepad 隐藏或最小化 notepad 只是一个示例因为我将编辑它以与其他软件一起使用 Problem 问题是我想在安装程序
Numpy 优化

我有一个根据条件分配值的函数我的数据集大小通常在 30 50k 范围内我不确定这是否是使用 numpy 的正确方法但是当数字超过 5k 时它会变得非常慢有没有更好的方法让它更快 import numpy as np N 5000
从 pygame 获取 numpy 数组

我想通过 python 访问我的网络摄像头不幸的是由于网络摄像头的原因 openCV 无法工作 Pygame camera 使用以下代码就像魅力一样 from pygame import camera display camera in
Python：计算字典的重复值

我有一本字典如下 dictA unit1 test1 alpha unit1 test2 beta unit2 test1 alpha unit2 test2 gamma unit3 test1 delta unit3 test2 gamm
在 Pandas DataFrame Python 中添加新列[重复]

这个问题在这里已经有答案了例如我在 Pandas 中有数据框 Col1 Col2 A 1 B 2 C 3 现在如果我想再添加一个名为 Col3 的列并且该值基于 Col2 式中如果Col2 gt 1 则Col3为0 否则为1 所以
在python中，如何仅搜索所选子字符串之前的一个单词

给定文本文件中的长行列表我只想返回紧邻其前面的子字符串例如单词狗描述狗的单词例如假设有这些行包含狗 hotdog big dog is dogged dog spy with my dog brown dogs 在这种情况下期望
Python - 字典和列表相交

给定以下数据结构找出这两种数据结构共有的交集键的最有效方法是什么 dict1 2A 3A 4B list1 2A 4B Expected output 2A 4B 如果这也能产生更快的输出我可以将列表不是 dict1 组织到任何其他数
Python 分析：“‘select.poll’对象的‘poll’方法”是什么？

我已经使用 python 分析了我的 python 代码cProfile模块并得到以下结果 ncalls tottime percall cumtime percall filename lineno function 13937860 9

随机推荐

使用 lineinfile 和 blockinfile 编辑文件还是仅使用模板复制整个文件？

我开始使用 Ansible 编写一个剧本为我们的应用程序部署临时环境我试图了解对文件应用更改的最佳实践是否是在控制计算机上本地更改它们然后将它们传播到远程服务器或者是否应该在剧本内操作文件通过剧本操作文件在可读性和文档方面似乎更好
使用 CSS 自定义字体？

我见过一些在其网站上使用自定义字体的新网站除了常规的 Arial Tahoma 等他们支持大量的浏览器如何做到这一点同时如果可能的话还会阻止人们免费下载该字体一般来说您可以使用自定义字体 font face在你的 CSS 中
C# 发行版仍然有 .pdb 文件

我想部署用 C 完成的应用程序的发行版本当我使用Release配置我仍然可以看到 pdb文件已生成这意味着我的应用程序仍然可以调试这也意味着我的代码中存在一些调试信息从而稍微减慢了速度如果这是真的我如何才能完全抑制二进制文件中
计算 R 行中的非零条目数

我有以下类型的数据 mode1 mode2 mode3 1 8 1 0 2 0 0 0 3 6 5 4 4 1 2 3 5 1 1 1 数据使用dput structure list mode1 c 8L 0L 6L 1L 1L mode2
CSS设置默认滚动位置

有没有办法将滚动位置设置为默认值我知道如何在 javascript 中做到这一点例如使用 jquery div divWithScroll attr scrollTop 200 但我只想用CSS来做我不知道是否可行不 CSS 中没有
为“PIL.Image.frombytes”指定什么大小

我想从原始数据创建 PIL 图像我相信我应该使用PIL Image frombytes 但它有一个size争论我不知道图像的大小这不是应该作为图像的一部分吗我事先不知道图像的大小我该如何调用没有大小的函数既然您澄清了您不想读取
如何在 Python 中使用 PIL\Numpy 获取灰度图像的平均像素值？

我有很少的灰度图像我想计算整个图像的平均像素值这样我就可以使用单个值来表示每个单独的图像如果你想做这样的事情你应该考虑使用scikit image而不是原始的 PIL 或枕头 SciKit Image 使用 numpy 数组来存储图
如何从 XAML 设置 WPF 用户控件属性？

我试图从 XAML 设置同一用户控件的多个实例的 fill 属性以便区分它们我在控件的 C 代码隐藏中使用依赖属性并在实例化控件时在 XAML 中引用该属性这是我尝试过的简化示例首先是用户控件的 XAML
Swift 中带圆角的 NSWindow

我想要一个圆角的窗户但我在每个角落都有一个白点 Code let effect NSVisualEffectView frame NSRect x 0 y 0 width 0 height 0 effect blendingMode be
检测 Widevine DRM HDCP 保护级别

我目前正在切换到使用 Dash Widevine DRM 的 ExoPlayer 通过测试我发现很大比例的设备没有启用 HDCP 保护由于合同协议这是一个问题我必须在允许播放之前检测到并记录它 I took inspiration
Android 4.4.2 - java.lang.RuntimeException：执行未恢复的活动停止

我在 4 4 2 设备上遇到此异常在 Android 4 3 或更低版本的设备上无法重现设置是我有一个家庭活动支持的子类ActionBarActivity 家庭活动检查布尔标志如果为真则启动启动画面活动是的理想情况下启动画面出
如果 mVC 中不存在该 url，则重定向到页面未找到页面

如果 url 不存在我需要将用户重定向到未找到页面如果用户复制网址并将其粘贴到浏览器上页面将显示找不到页面的方法在这我需要将用户重定向到页面未找到页面看看这个如何在 ASP NET MVC 中正确处理 404 https sta
如何修复应用程序在重新排序到前面和后面后转到后台

我目前设法允许用户在两个不同的活动组之间切换假设 4 个活动类别 A B 组和 X Y 组并按FLAG ACTIVITY REORDER TO FRONT标志但我注意到有一些奇怪的行为 A gt start activity X X
如何在使用 Robot Framework 时修剪或去除字符串中的空格

如何在使用 Robot Framework 时修剪或去除字符串中的空格如果我有一个字符串 Hello How are you 如何将其转换为 HelloHowareyou 去除所有空格 str strip 也有效它使用扩展变量语法 ht
单击弹出菜单时为什么导航栏出现在全屏应用程序中

我有一个全屏应用程序 MainActivity java public class MainActivity extends AppCompatActivity TargetApi Build VERSION CODES KITKAT pr
python numpy：更改 numpy 矩阵的列类型

我有一个 numpy 矩阵 X 我尝试使用以下代码更改第 1 列的数据类型 X 1 astype str print type X 0 1 但我得到了以下结果
向 OpenID 提供商请求电子邮件地址

我正在实施 OpenID 我想检索用户的电子邮件地址和有关用户的其他信息我正在这样做 var fetch new FetchRequest fetch AddAttribute new AttributeRequest WellKnown
如何像在facet_grid中一样在facet_wrap中定位条带标签

我想在使用时删除多余的条带标签facet wrap 并用两个变量进行分面并且都是自由尺度的例如这个facet wrap下图的版本 library ggplot2 dt lt txhousing txhousing year in 20
访问 XAML 中的静态字段

如何在 xaml 中引用类的静态属性换句话说我想做这样的事情 Class BaseThingy public static readonly Style BaseStyle
使用从两列计算出的键对 CSV 进行排序，获取前 n 个最大值

这里是 Python 业余爱好者假设这里我有一个示例 csv 文件的片段 Country Year GDP Population Country1 2002 44545 24352 Country2 2004 14325 75677 Co

使用从两列计算出的键对 CSV 进行排序，获取前 n 个最大值

使用从两列计算出的键对 CSV 进行排序，获取前 n 个最大值 的相关文章

随机推荐

热门标签

使用从两列计算出的键对 CSV 进行排序，获取前 n 个最大值的相关文章