collections.Counter:most_common 包括相等计数

2023-11-22

In collections.Counter, 方法most_common(n)仅返回列表中 n 个最频繁出现的项目。我正是需要这个,但我也需要包括相等的计数。

from collections import Counter
test = Counter(["A","A","A","B","B","C","C","D","D","E","F","G","H"])
-->Counter({'A': 3, 'C': 2, 'B': 2, 'D': 2, 'E': 1, 'G': 1, 'F': 1, 'H': 1})
test.most_common(2)
-->[('A', 3), ('C', 2)

我会需要[('A', 3), ('B', 2), ('C', 2), ('D', 2)]因为在这种情况下它们的计数与 n=2 相同。我的真实数据是 DNA 代码,可能非常大。我需要它有点效率。


你可以这样做:

from itertools import takewhile

def get_items_upto_count(dct, n):
  data = dct.most_common()
  val = data[n-1][1] #get the value of n-1th item
  #Now collect all items whose value is greater than or equal to `val`.
  return list(takewhile(lambda x: x[1] >= val, data))

test = Counter(["A","A","A","B","B","C","C","D","D","E","F","G","H"])

print get_items_upto_count(test, 2)
#[('A', 3), ('C', 2), ('B', 2), ('D', 2)]
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

collections.Counter:most_common 包括相等计数 的相关文章

  • 如何在刻度标签和轴之间添加空间

    我已成功增加刻度标签的字体 但现在它们距离轴太近了 我想在刻度标签和轴之间添加一点呼吸空间 如果您不想全局更改间距 通过编辑 rcParams 并且想要更简洁的方法 请尝试以下操作 ax tick params axis both whic
  • Pycharm Python 控制台不打印输出

    我有一个从 Pycharm python 控制台调用的函数 但没有显示输出 In 2 def problem1 6 for i in range 1 101 2 print i end In 3 problem1 6 In 4 另一方面 像
  • Java:迭代 Collection 的最佳方法(此处为 ArrayList)

    今天 当我看到一段我已经使用了数百次的代码时 我很高兴地开始编码 迭代集合 此处为 ArrayList 出于某种原因 我实际上查看了 Eclipse 的自动完成选项 这让我想知道 在什么情况下以下循环比其他循环更好使用 经典的数组索引循环
  • 如何在 Sublime Text 2 的 OSX 终端中显示构建结果

    我刚刚从 TextMate 切换到 Sublime Text 2 我非常喜欢它 让我困扰的一件事是默认的构建结果显示在 ST2 的底部 我的程序产生一些很长的结果 显示它的理想方式 如在 TM2 中 是并排查看它们 如何在 Mac 操作系统
  • 如何使用包含代码的“asyncio.sleep()”进行单元测试?

    我在编写 asyncio sleep 包含的单元测试时遇到问题 我要等待实际的睡眠时间吗 I used freezegun到嘲笑时间 当我尝试使用普通可调用对象运行测试时 这个库非常有用 但我找不到运行包含 asyncio sleep 的测
  • 如何等到 Excel 计算公式后再继续 win32com

    我有一个 win32com Python 脚本 它将多个 Excel 文件合并到电子表格中并将其另存为 PDF 现在的工作原理是输出几乎都是 NAME 因为文件是在计算 Excel 文件内容之前输出的 这可能需要一分钟 如何强制工作簿计算值
  • Python tcl 未正确安装

    我刚刚为 python 安装了graphics py 但是当我尝试运行以下代码时 from graphics import def main win GraphWin My Circle 100 100 c Circle Point 50
  • 从 scikit-learn 导入 make_blobs [重复]

    这个问题在这里已经有答案了 我收到下一个警告 D Programming Python ML venv lib site packages sklearn utils deprecation py 77 DeprecationWarning
  • 在 NumPy 中获取 ndarray 的索引和值

    我有一个 ndarrayA任意维数N 我想创建一个数组B元组 数组或列表 其中第一个N每个元组中的元素是索引 最后一个元素是该索引的值A 例如 A array 1 2 3 4 5 6 Then B 0 0 1 0 1 2 0 2 3 1 0
  • python pandas 中的双端队列

    我正在使用Python的deque 实现一个简单的循环缓冲区 from collections import deque import numpy as np test sequence np array range 100 2 resha
  • Geopandas 设置几何图形:MultiPolygon“等于 len 键和值”的 ValueError

    我有 2 个带有几何列的地理数据框 我将一些几何图形从 1 个复制到另一个 这对于多边形效果很好 但对于任何 有效 多多边形都会返回 ValueError 请指教如何解决这个问题 我不知道是否 如何 为什么应该更改 MultiPolygon
  • 使用 OpenPyXL 迭代工作表和单元格,并使用包含的字符串更新单元格[重复]

    这个问题在这里已经有答案了 我想使用 OpenPyXL 来搜索工作簿 但我遇到了一些问题 希望有人可以帮助解决 以下是一些障碍 待办事项 我的工作表和单元格数量未知 我想搜索工作簿并将工作表名称放入数组中 我想循环遍历每个数组项并搜索包含特
  • 如何将 numpy.matrix 提高到非整数幂?

    The 运算符为numpy matrix不支持非整数幂 gt gt gt m matrix 1 0 0 5 0 5 gt gt gt m 2 5 TypeError exponent must be an integer 我想要的是 oct
  • 循环中断打破tqdm

    下面的简单代码使用tqdm https github com tqdm tqdm在循环迭代时显示进度条 import tqdm for f in tqdm tqdm range 100000000 if f gt 100000000 4 b
  • Numpy 优化

    我有一个根据条件分配值的函数 我的数据集大小通常在 30 50k 范围内 我不确定这是否是使用 numpy 的正确方法 但是当数字超过 5k 时 它会变得非常慢 有没有更好的方法让它更快 import numpy as np N 5000
  • Nuitka 未使用 nuitka --recurse-all hello.py [错误] 编译 exe

    我正在尝试通过 nuitka 创建一个简单的 exe 这样我就可以在我的笔记本电脑上运行它 而无需安装 Python 我在 Windows 10 上并使用 Anaconda Python 3 我输入 nuitka recurse all h
  • 如何在 Django 中使用并发进程记录到单个文件而不使用独占锁

    给定一个在多个服务器上同时执行的 Django 应用程序 该应用程序如何记录到单个共享日志文件 在网络共享中 而不保持该文件以独占模式永久打开 当您想要利用日志流时 这种情况适用于 Windows Azure 网站上托管的 Django 应
  • 设置 torch.gather(...) 调用的结果

    我有一个形状为 n x m 的 2D pytorch 张量 我想使用索引列表来索引第二个维度 可以使用 torch gather 完成 然后然后还设置新值到索引的结果 Example data torch tensor 0 1 2 3 4
  • 如何从没有结尾的管道中读取 python 中的 stdin

    当管道来自 打开 时 不知道正确的名称 我无法从 python 中的标准输入或管道读取数据 文件 我有作为例子管道测试 py import sys import time k 0 try for line in sys stdin k k
  • Python:元类属性有时会覆盖类属性?

    下面代码的结果让我感到困惑 class MyClass type property def a self return 1 class MyObject object metaclass MyClass a 2 print MyObject

随机推荐

  • Javascript:var functionName = function() {} 与 function functionName() {} 的性能[重复]

    这个问题在这里已经有答案了 可能的重复 使用匿名函数会影响性能吗 在 Javascript 中使用函数表达式与声明时 对解析和运行时的性能有何影响 如果有 例如以下两种方式的性能特点和区别是什么 var functionOne functi
  • 如何强制 Eclipse m2e 插件为项目使用 jdk

    我将 Maven 与 Eclipse Kepler JavaEE 一起使用 我在 maven compiler plugin 中有类似的东西
  • Typescript - 扩展自身的通用类型

    我最近遇到了一个看起来像这样的东西 interface Test
  • 合并 Pandas 中两行的内容

    我有一个数据框 我想在同一单元格中合并两行的内容 并用下划线分隔 如果这是原始 DF 0 eye right eye right hand 1 location location position 2 12 27 7 2 3 14 27 6
  • Web 平台安装程序是否支持自动化?

    我想知道是否可以使用命令行选项或配置文件自动执行 WPI 操作 以在无人值守模式下设置开发盒 看起来 WPI 采用 URL 作为命令行参数 但我不知道响应应该采用什么格式 以及它通常允许什么格式 编辑 感谢人们为提出自动化设置方法付出的巨大
  • 有没有办法查看 64 位浮点 IEEE754 表示形式的数字

    Javascript 根据以下规则将所有数字存储为双精度 64 位格式 IEEE 754 值 spec The Number type has exactly 18437736874454810627 that is 264 253 3 v
  • 从 std::map 值获取键的有效方法

    我有一张地图如下 std map lt std string int gt mapobj mapobj one 1 mapobj two 2 mapobj three 3 当输入是值时如何获取键 EX 输入 1 输出 一 注意 在我的例子中
  • 如何存储执行函数的结果并在以后重复使用?

    例如 我有 def readDb Fetch a lot of data from db spends a lot time return aList def calculation x readdb Process x return y
  • C#:对象的内存使用情况

    有没有办法找到特定对象使用了多少内存 例如一个列表 考虑到一切 比如字符串驻留以及编译器 运行时环境 其他所做的任何事情 ANTS 内存分析器分析 NET 代码的内存消耗 我过去用它取得了很好的成果
  • 我们可以在JQuery中执行SQL查询吗

    我们可以在 jQuery 回调函数和杂项中执行 mySQL 查询吗 功能 就像简单的查询 UPDATE EMPLOYEE SET PAY PAY 500 WHERE E ID 32 虽然您可以使用服务器端脚本的回调来执行对 MySQL 的查
  • 如何创建内存中文件对象

    我想制作一个内存文件以在 pygame 混合器中使用 我的意思是像http www pygame org docs ref music html pygame mixer music load这表示 load 方法支持文件对象 import
  • fullcalendar动态添加事件

    我正在尝试在我的完整日历中动态创建事件 I have calendar fullCalendar viewRender function view var h if view name month h NaN else h 2500 hig
  • 将数组映射变量替换为实际变量名称/字符串?

    我正在尝试编辑 Greasemonkey jQuery 脚本 我无法在这里发布链接 代码经过 minify 混淆和压缩 它是这样开始的 var 0x21e9 x67 x65 x74 x4D x6F x6E x74 x68 x67 x65 x
  • Python中使用random时是否需要调用seed()? [复制]

    这个问题在这里已经有答案了 我正在查看以下代码 from random import choice for val in range 10 a join str choice range 20 for idx in range 4 prin
  • Three.js补间camera.lookat

    我尝试使用 Tween js 在 Three js 中补间camera lookAt 但收效甚微 这有效 selectedHotspot object var tween new TWEEN Tween camera lookAt obje
  • 在C++中如何检查字符串是否可以转换为double?

    我有一个字符串 它可以是数字 甚至是浮点数或双精度类型 而不仅仅是整数 它也可以是非数字的单词 我想检查这个字符串是否可以转换为双精度 如果可以 那么我想进行转换 对于非数字字符串 我想要不同的行为 我已经尝试过这个 double tmp
  • 将文本文件读入数组

    我对编程真的很陌生 在为夏季项目认真思考了一周之后 我真的很感谢一些帮助 我正在尝试读取一个长文本文件 它只是一个长字符串 注意 不是实际的编程字符串 字母 然后将每个字母放入网格中的位置 该程序的目的最终是为了解决单词搜索 到目前为止 我
  • 使用 JavaScript 编写 xml 的库

    我正在使用 JavaScript node js 进行一些服务器端编码 并且我想编写有效的 xml 我找到了两个库 但我确信还有更多 更好 http goessner net download prj jsonxml LGPL 尚未公布 h
  • 如何从基本控制器获取操作名称?

    我想在我的一个控制器上实现一个基本控制器 在该基本控制器中 我希望能够获取当前执行的 ActionResult 名称 我该怎么做呢 public class HomeController ControllerBase public Acti
  • collections.Counter:most_common 包括相等计数

    In collections Counter 方法most common n 仅返回列表中 n 个最频繁出现的项目 我正是需要这个 但我也需要包括相等的计数 from collections import Counter test Coun