Python groupby 无法按预期工作[重复]

2024-05-27

我正在尝试读取一个 Excel 电子表格,其中包含以下格式的一些列:

column1__
column1__AccountName
column1__SomeOtherFeature
column2__blabla
column2_SecondFeat

我已经将一行的值保存为元组列表,其中元组是变量中的 (column_name, column_value)x.

现在我想将其分组如下:

result = { 
    'column__1': [list of (k,v) tuples, which keys start with 'column__1'],
    'column__2': [list of (k,v) tuples, which keys start with 'column__2']
}

但它没有给出预期的结果:

>>> from itertools import groupby

>>> x
[(u'My field one__AccountName', u'Lorem ipsum bla bla bla'),
 (u'My field one__AccountNumber', u'1111111222255555'),
 (u'My field two__Num', u'Num: 612312345'),
 (u'My field two', u'asdasdafassda'),
 (u'My field three__Beneficiary International Bank Account Number IBAN',
  u'IE111111111111111111111'),
 (u'My field one__BIC', u'BLEAHBLA1'),
 (u'My field three__company name', u'Company XYZ'),
 (u'My field two__BIC', u'ASDF333')]

>>> groups = groupby(x ,lambda (field, val): field.split('__')[0])

>>> grouped_fields = {key: list(val) for key, val in groups}

>>> grouped_fields

{u'My field one': [(u'My field one__BIC', u'BLEAHBLA1')],
 u'My field three': [(u'My field three__company name', u'Company XYZ')],
 u'My field two': [(u'My field two__BIC', u'ASDF333')]}

 >>> x[0]
(u'My field one__AccountName', u'Lorem ipsum bla bla bla')

>>> x[1]
(u'My field one__AccountNumber', u'1111111222255555')

>>> x[0][0].split('__')[0] == x[1][0].split('__')[0]
True

然而,它似乎适用于初始列表的另一个实例:

>>> y = [(u'x a b__2', 3), (u'x a b__', 1), (u'x a b__1', 2), (u'y a__1', 1), (u'y a__2', 2)]

>>> y
[(u'x__2', 3), (u'x__', 1), (u'x__1', 2), (u'y__1', 1), (u'y__2', 2)]

>>> groupes_y = groupby(y, lambda (k,v): k.split('__')[0])

>>> grouped_y = {key:list(val) for key, val in groupes_y}

>>> grouped_y

{u'x': [(u'x__2', 3), (u'x__', 1), (u'x__1', 2)],
 u'y': [(u'y__1', 1), (u'y__2', 2)]}

不知道我做错了什么。


As 文档说 https://docs.python.org/library/itertools.html#itertools.groupby,你应该申请groupby到已经使用相同排序的列表key as groupby itself:

key = lambda fv: fv[0].split('__')[0]
groups = groupby(sorted(x, key=key), key=key)

Then grouped_fields is:

{u'My field one': [(u'My field one__AccountName', u'Lorem ipsum bla bla bla'),
  (u'My field one__AccountNumber', u'1111111222255555'),
  (u'My field one__BIC', u'BLEAHBLA1')],
 u'My field three': [(u'My field three__Beneficiary International Bank Account Number IBAN',
   u'IE111111111111111111111'),
  (u'My field three__company name', u'Company XYZ')],
 u'My field two': [(u'My field two__Num', u'Num: 612312345'),
  (u'My field two', u'asdasdafassda'),
  (u'My field two__BIC', u'ASDF333')]}

在你的第二个例子中,碰巧的是y已经排序:

>>> y == sorted(y, key=key)
True
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python groupby 无法按预期工作[重复] 的相关文章

随机推荐

  • 我的 s3 存储桶如何使用 nginx 在不同文件夹中托管多个网站?

    我在 Amazon 上有一个 s3 Cloudfront 解决方案 我想在存储桶内的不同文件夹中托管不同的网站 并通过以下两种方式之一访问它们 子域 gt mywebsite1 mydomain com 或者 路径 gt www mydom
  • 在android中使用短信管理器发送批量短信

    我正在使用以下方式向近 90 100 个号码发送短信SmsManager 我正在从文件中读取数字并将数字传递给 sendtextmessage 函数 如下所示 String nos this array contains mobile no
  • BigDecimal 中 Divide 方法的 Scale()

    new BigDecimal 37146555 53880000 divide new BigDecimal 1000000 scale 这返回10 但根据API divide method 返回一个 BigDecimal 其值为 这个 除
  • AES BadPaddingException

    如果我使用错误的密钥或错误的盐进行解密 则会引发 BadPaddingException 我希望返回一个不正确的字符串 doFinal 导致解密方法出现异常 信息 This is just an example Unfug S F V s
  • 为什么我不能在 Javascript 中滚动循环?

    我正在开发一个使用 dojo 的网页 并且上面有许多 在我的测试用例中为 6 但通常是可变的 项目小部件 我正在调用 dojo addOnLoad init 并且在 init 函数中我有以下几行 dojo connect dijit byI
  • 如何将IDL导入到Delphi中?

    我如何导入接口定义语言 idl 文件存入Delphi 将类型和接口转换为 pascal 文件 我试过了 File Open 它只显示 idl 文本文件的文本 Project 添加到项目 它只是 就像 添加了一个 idl文本文件到项目 成分
  • 与 font-weight:bold 和 与 font-style:italic

    使用之间有什么真正的区别吗 strong and em 而不是 CSS 属性 font weight bold font style italic 另外 这两种选择都存在的真正原因是什么 我可能是错的 但我没有 strong and em
  • 如何在 iPhone 窗口应用程序中显示另一个窗口

    首先 我是 Objective C 和 iPhone 编程的新手 有事我无法去上班 我有一个 iPhone 窗口应用程序 在主窗口中有一个按钮 我想在单击按钮时显示另一个窗口 我已将事件与我的控制器绑定 我只是不知道如何在事件中显示我的另一
  • 无法安装 RMagick 0.0.0。找不到 Magick 配置

    我正在运行 debian 服务器并在一段时间后升级了所有软件包 apt get update apt get upgrade apt get distro upgrade 然后 rmagick 不再工作了 因为 imagemagick 被更
  • 在 cherokee 和 uwsgi 上部署 Flask [关闭]

    Closed 这个问题是无关 help closed questions 目前不接受答案 我正在尝试部署一个使用 cherokee 和 uwsgi 开发的 Flask Web 应用程序 我安装了 cherokee 和 uwsgi 并正在工作
  • Pycharm错误:配置不正确

    在我的 DEV 计算机意外关闭后 当返回 Pycharm 项目时 我注意到我正在编辑的 Django 视图文件 有 700 多行 发生这种情况时 它完全是空的 我设法从备份中恢复它 那里没有损失 尝试调试时出现问题 它返回此错误 不正确配置
  • 寻找一种简单的方法来重新初始化结构

    我有一个名为 CoolStruct 的结构 struct CoolStruct int id uint32 type uint32 subtype String name 我也有这些结构的向量 std vector
  • R 控制台是我的母语,如何将 R 设置为英语?

    我在 Windows 7 上使用 R 显然 R 不知何故发现了我说英语以外的语言的证据 并且顽固地坚持在控制台中以我自己的语言提供输出 由于多种原因 这是不可取的 我希望 R 是英语 什么有效 我能够使用LANGUAGE en作为 R 控制
  • 重命名带有“完整工作表”图表的工作表会导致电子表格重新加载

    Google 表格允许将图表移动到自己的表格中 不过 谷歌脚本似乎无法重命名这些工作表 而不会使电子表格崩溃并强制其重新加载 要明白我的意思 请尝试以下操作 1 创建新的电子表格并在其中放入一些数据 2 使用数据创建任何类型的图表 3 编辑
  • AF网络3问题

    In AFNetworking3 表示我使用的 SSL 证书无效验证证书链 false 但现在看来该字段已被删除 我无法向我的服务器发出请求 这是请求类 import UIKit import AFNetworking class Clie
  • Android OpenGL ES 支持无处不在?

    我需要了解如果我选择在 OpenGL 而不是 android graphics 中的 android 原生 2D 图形 API 进行绘图 我会损失多少潜在安装量 android 文档似乎暗示 OpenGL ES API 基本上在所有手机上都
  • 如何从字符串调用并执行运算符?

    例如 var s 3 3 s replace d g function all n1 operator n2 r new Number n1 new Number n2 return r 注意 不使用eval 变量运算符可以吗 https
  • 如何通过其偏移量访问私有数据私有成员?

    我正在尝试按偏移量访问和修改类的私有数据成员 AFAIK 首先是计算偏移量 然后通过偏移量访问成员 这是我的代码 class Test public int a int b private int c Test test cout lt l
  • 如何在 Azure Functions 3.x PowerShell 7 中调用 Azure PowerShell 模块命令?

    我需要运行 Azure PowerShell 模块命令 https learn microsoft com en us powershell azure install az ps view azps 5 2 0 https learn m
  • Python groupby 无法按预期工作[重复]

    这个问题在这里已经有答案了 我正在尝试读取一个 Excel 电子表格 其中包含以下格式的一些列 column1 column1 AccountName column1 SomeOtherFeature column2 blabla colu
Powered by Hwhale