检查嵌套字典内的成员资格

2023-12-01

这是此问题的后续问题：

Python DictReader - 跳过缺少列的行？

事实证明我很愚蠢，并且使用了错误的 ID 字段。

顺便说一句，我在这里使用的是 Python 3.x。

我有一个员工字典，由字符串“directory_id”索引。每个值都是一个包含员工属性（电话号码、姓氏等）的嵌套字典。其中一个值是辅助 ID，称为“internal_id”，另一个值是其经理，称为“manager_internal_id”。 “internal_id”字段是非强制字段，并非每个员工都有一个字段。

{'6443410501': {'manager_internal_id': '989634', 'givenName': 'Mary', 'phoneNumber': '+65 3434 3434', 'sn': 'Jones', 'internal_id': '434214'}
'8117062158': {'manager_internal_id': '180682', 'givenName': 'John', 'phoneNumber': '+65 3434 3434', 'sn': 'Ashmore', 'internal_id': ''}
'9227629067': {'manager_internal_id': '347394', 'givenName': 'Wright', 'phoneNumber': '+65 3434 3434', 'sn': 'Earl', 'internal_id': '257839'}
'1724696976': {'manager_internal_id': '907239', 'givenName': 'Jane', 'phoneNumber': '+65 3434 3434', 'sn': 'Bronte', 'internal_id': '629067'}

}

（我对这些字段进行了一些简化，既是为了使其更易于阅读，也是出于隐私/合规性原因）。

这里的问题是，我们通过每个员工的 Directory_id 为他们建立索引（键），但是当我们查找他们的经理时，我们需要通过他们的“internal_id”来查找经理。

之前，当我们的字典使用internal_id作为键时，employee.keys()是一个internal_id列表，我对此使用了成员资格检查。现在，我的 if 语句的最后一部分将不起作用，因为internal_ids 是字典值的一部分，而不是键本身。

def lookup_supervisor(manager_internal_id, employees):
    if manager_internal_id is not None and manager_internal_id != "" and manager_internal_id in employees.keys():
        return (employees[manager_internal_id]['mail'], employees[manager_internal_id]['givenName'], employees[manager_internal_id]['sn'])
    else:
        return ('Supervisor Not Found', 'Supervisor Not Found', 'Supervisor Not Found')

所以第一个问题是，如何修复 if 语句来检查 manager_internal_id 是否存在于字典的internal_ids 列表中？

我尝试用employee.values() 替换employee.keys()，但没有成功。另外，我希望有一些更有效的方法，不确定是否有办法获取值的子集，特别是员工[directory_id]['internal_id']的所有条目。

希望有一些 Python 风格的方法可以做到这一点，而无需使用大量嵌套的 for/if 循环。

我的第二个问题是，如何干净地返回所需的员工属性（邮件、名字、姓氏等）。我的 for 循环遍历每个员工，并调用lookup_supervisor。我在这里感觉有点愚蠢/难住了。

def tidy_data(employees):
    for directory_id, data in employees.items():
        # We really shouldnt' be passing employees back and forth like this - hmm, classes?
        data['SupervisorEmail'], data['SupervisorFirstName'], data['SupervisorSurname'] = lookup_supervisor(data['manager_internal_id'], employees)

我应该重新设计我的数据结构吗？或者还有别的办法吗？

EDIT:我稍微调整了代码，如下所示：

class Employees:

    def import_gd_dump(self, input_file="test.csv"):
        gd_extract = csv.DictReader(open(input_file), dialect='excel')
        self.employees = {row['directory_id']:row for row in gd_extract}

    def write_gd_formatted(self, output_file="gd_formatted.csv"):
        gd_output_fieldnames = ('internal_id', 'mail', 'givenName', 'sn', 'dbcostcenter', 'directory_id', 'manager_internal_id', 'PHFull', 'PHFull_message', 'SupervisorEmail', 'SupervisorFirstName', 'SupervisorSurname')
        try:
            gd_formatted = csv.DictWriter(open(output_file, 'w', newline=''), fieldnames=gd_output_fieldnames, extrasaction='ignore', dialect='excel')
        except IOError:
            print('Unable to open file, IO error (Is it locked?)')
            sys.exit(1)

        headers = {n:n for n in gd_output_fieldnames}
        gd_formatted.writerow(headers)
        for internal_id, data in self.employees.items():
            gd_formatted.writerow(data)

    def tidy_data(self):
        for directory_id, data in self.employees.items():
            data['PHFull'], data['PHFull_message'] = self.clean_phone_number(data['telephoneNumber'])
            data['SupervisorEmail'], data['SupervisorFirstName'], data['SupervisorSurname'] = self.lookup_supervisor(data['manager_internal_id'])

    def clean_phone_number(self, original_telephone_number):
        standard_format = re.compile(r'^\+(?P<intl_prefix>\d{2})\((?P<area_code>\d)\)(?P<local_first_half>\d{4})-(?P<local_second_half>\d{4})')
        extra_zero = re.compile(r'^\+(?P<intl_prefix>\d{2})\(0(?P<area_code>\d)\)(?P<local_first_half>\d{4})-(?P<local_second_half>\d{4})')
        missing_hyphen = re.compile(r'^\+(?P<intl_prefix>\d{2})\(0(?P<area_code>\d)\)(?P<local_first_half>\d{4})(?P<local_second_half>\d{4})')
        if standard_format.search(original_telephone_number):
            result = standard_format.search(original_telephone_number)
            return '0' + result.group('area_code') + result.group('local_first_half') + result.group('local_second_half'), ''
        elif extra_zero.search(original_telephone_number):
            result = extra_zero.search(original_telephone_number)
            return '0' + result.group('area_code') + result.group('local_first_half') + result.group('local_second_half'), 'Extra zero in area code - ask user to remediate. '
        elif missing_hyphen.search(original_telephone_number):
            result = missing_hyphen.search(original_telephone_number)
            return '0' + result.group('area_code') + result.group('local_first_half') + result.group('local_second_half'), 'Missing hyphen in local component - ask user to remediate. '
        else:
            return '', "Number didn't match format. Original text is: " + original_telephone_number    

    def lookup_supervisor(self, manager_internal_id):
        if manager_internal_id is not None and manager_internal_id != "":# and manager_internal_id in self.employees.values():
            return (employees[manager_internal_id]['mail'], employees[manager_internal_id]['givenName'], employees[manager_internal_id]['sn'])
        else:
            return ('Supervisor Not Found', 'Supervisor Not Found', 'Supervisor Not Found')

if __name__ == '__main__':
    our_employees = Employees()
    our_employees.import_gd_dump('test.csv')
    our_employees.tidy_data()
    our_employees.write_gd_formatted()

我猜（1）。我正在寻找一种更好的方法来构造/存储 Employee/Employees，并且（2）我特别遇到了lookup_supervisor() 的问题。\

我应该创建一个 Employee 类，并将其嵌套在Employees 中吗？

我是否应该用 tidy_data() 做我正在做的事情，并在 dict 项目的 for 循环上调用 clean_phone_number() 和 Lookup_supervisor() ？呃。confused.

您可能需要进行一些迭代才能获取数据。我假设您不想要一个可能会过时的额外字典，因此尝试存储内部 id 上键入的所有内容是不值得的。

试穿一下尺码：

def lookup_supervisor(manager_internal_id, employees):
    if manager_internal_id is not None and manager_internal_id != "":
        manager_dir_ids = [dir_id for dir_id in employees if employees[dir_id].get('internal_id') == manager_internal_id]
        assert(len(manager_dir_ids) <= 1)
        if len(manager_dir_ids) == 1:
            return manager_dir_ids[0]
    return None

def tidy_data(employees):
    for emp_data in employees.values():
        manager_dir_id = lookup_supervisor(emp_data.get('manager_internal_id'), employees)
        for (field, sup_key) in [('Email', 'mail'), ('FirstName', 'givenName'), ('Surname', 'sn')]:
            emp_data['Supervisor'+field] = (employees[manager_dir_id][sup_key] if manager_dir_id is not None else 'Supervisor Not Found')

你说得对，一堂课就是通过考试的答案employees大约。事实上，我建议不要将“主管”键存储在员工字典中，并建议在需要时随时更新主管字典，也许可以使用get_supervisor_data method.

除了我已经提到的更改和一些调整之外，您的新 OO 版本看起来都很合理clean_phone_number.

def clean_phone_number(self, original_telephone_number):
    phone_re = re.compile(r'^\+(?P<intl_prefix>\d{2})\((?P<extra_zero>0?)(?P<area_code>\d)\)(?P<local_first_half>\d{4})(?P<hyph>-?)(?P<local_second_half>\d{4})')
    result = phone_re.search(original_telephone_number)
    if result is None:
        return '', "Number didn't match format. Original text is: " + original_telephone_number
    msg = ''
    if result.group('extra_zero'):
        msg += 'Extra zero in area code - ask user to remediate. '
    if result.group('hyph'):    # Note: can have both errors at once
        msg += 'Missing hyphen in local component - ask user to remediate. '
    return '0' + result.group('area_code') + result.group('local_first_half') + result.group('local_second_half'), msg

您绝对可以为每个员工制作一个单独的对象，但是看看您如何使用数据以及从中需要什么，我猜它不会有那么多回报。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Dictionary

检查嵌套字典内的成员资格的相关文章

Django 管理员在模型编辑时间歇性返回 404

我们使用 Django Admin 来维护导出到我们的一些站点的一些数据有时当单击标准更改列表视图来获取模型编辑表单而不是路由到正确的页面时我们会得到 Django 404 页面模板它是偶尔发生的我们可以通过重新加载三次来重现它
使 django 服务器可以在 LAN 中访问

我已经安装了Django服务器可以如下访问 http localhost 8000 get sms http 127 0 0 1 8000 get sms 假设我的IP是x x x x 当我这样做时从同一网络下的另一台电脑 my ip
如何在flask中使用g.user全局

据我了解 Flask 中的 g 变量它应该为我提供一个全局位置来存储数据例如登录后保存当前用户它是否正确我希望我的导航在登录后在整个网站上显示我的用户名我的观点包含 from Flask import g among other
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
如何使用 Ansible playbook 中的 service_facts 模块检查服务是否存在且未安装在服务器中？

我用过service facts检查服务是否正在运行并启用在某些服务器中未安装特定的软件包现在我如何知道这个特定的软件包没有安装在该特定的服务器上service facts module 在 Ansible 剧本中它显示以下错误
如何替换 pandas 数据框列中的重音符号

我有一个数据框dataSwiss其中包含瑞士城市的信息我想用普通字母替换带有重音符号的字母这就是我正在做的 dataSwiss Municipality dataSwiss Municipality str encode utf 8 d
python 相当于 R 中的 get() （= 使用字符串检索符号的值）

在 R 中 get s 函数检索名称存储在字符变量向量中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数尽管花了一些时间翻
根据列值突出显示数据框中的行？

假设我有这样的数据框 col1 col2 col3 col4 0 A A 1 pass 2 1 A A 2 pass 4 2 A A 1 fail 4 3 A A 1 fail 5 4 A A 1 pass 3 5 A A 2 fail 2
基于代理的模拟：性能问题：Python vs NetLogo & Repast

我正在 Python 3 中复制一小段 Sugarscape 代理模拟模型我发现我的代码的性能比 NetLogo 慢约 3 倍这可能是我的代码的问题还是Python的固有限制显然这只是代码的一个片段但 Python 却花费了三分
绘制方程

我正在尝试创建一个函数它将绘制我告诉它的任何公式 import numpy as np import matplotlib pyplot as plt def graph formula x range x np array x rang
Flask如何获取请求的HTTP_ORIGIN

我想用我自己设置的 Access Control Allow Origin 标头做出响应而弄清楚请求中的 HTTP ORIGIN 参数在哪里似乎很混乱我在用着烧瓶 0 10 1 以及HTTP ORIGIN似乎是这个的特点之一object
Python 的“zip”内置函数的 Ruby 等价物是什么？

Ruby 是否有与 Python 内置函数等效的东西zip功能如果不是做同样事情的简洁方法是什么一些背景信息当我试图找到一种干净的方法来进行涉及两个数组的检查时出现了这个问题如果我有zip 我可以写这样的东西 zip a b a
如何在Python中对类别进行加权随机抽样

给定一个元组列表其中每个元组都包含一个概率和一个项目我想根据其概率对项目进行采样例如给出列表 3 a 4 b 3 c 我想在 40 的时间内对 b 进行采样在 python 中执行此操作的规范方法是什么我查看了 random 模
如何在seaborn displot中使用hist_kws

我想在同一图中用不同的颜色绘制直方图和 kde 线我想为直方图设置绿色为 kde 线设置蓝色我设法弄清楚使用 line kws 来更改 kde 线条颜色但 hist kws 不适用于显示我尝试过使用 histplot 但我无法为
有没有办法检测正在运行的代码是否正在上下文管理器内执行？

正如标题所述有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
Scrapy：如何使用元在方法之间传递项目

我是 scrapy 和 python 的新手我试图将 parse quotes 中的项目 item author 传递给下一个解析方法 parse bio 我尝试了 request meta 和 response meta 方法如 sc
Rocket UniData/UniVerse：ODBC 无法分配足够的内存

每当我尝试使用pyodbc连接到 Rocket UniData UniVerse 数据时我不断遇到错误 pyodbc Error 00000 00000 Rocket U2 U2ODBC 0302810 Unable to allocate
从列表指向字典变量

假设你有一个清单 a 3 4 1 我想用这些信息来指向字典 b 3 4 1 现在我需要的是一个常规看到该值后在 b 的位置内读写一个值我不喜欢复制变量我想直接改变变量b的内容假设b是一个嵌套字典你可以这样做 reduce di
Python 类继承 - 诡异的动作

我观察到类继承有一个奇怪的效果对于我正在处理的项目我正在创建一个类来充当另一个模块的类的包装器我正在使用第 3 方 aeidon 模块用于操作字幕文件但问题可能不太具体以下是您通常如何使用该模块 project aeidon P
NotImplementedError：无法将符号张量 (lstm_2/strided_slice:0) 转换为 numpy 数组。时间

张量流版本 2 3 1 numpy 版本 1 20 在代码下面 define model model Sequential model add LSTM 50 activation relu input shape n steps n fe

随机推荐

如何从 Prolog 中保留函数的第一个结果？

我需要编写一个自定义函数该函数将被其他固定函数多次调用在此函数中在第一次调用时它将返回文件的总行数该函数的第二次调用时间 forward 将返回该文件的小部分中的行数我的问题是如何保留第一个返回的结果文件的总行数并将其用于函
UpdatePanel异步回发后的Javascript事件订阅

我在 asp net 页面上异步回发后遇到 jquery 事件处理程序问题我读这个话题这是一个很好的解决方案但我需要一个单独的函数所以我正在使用jquery 屏蔽插件我现在的js代码是
检查表的时间重叠？

我有一个包含以下字段的 MySQL 表 name 开始时间 endtime starttime and endtime是 MySQLTIME字段不DATETIME 我需要一种方法来定期扫描表以查看表内的时间范围是否有重叠如果有一个事
pip install mysqlclient 在 Ubuntu 上使用 docker 上的 python 2.7 失败

当我运行下面的 docker 文件代码时 RUN apt get update apt get install y no install recommends ca certificates vim git python python pi
在 pandas/matplotlib 中格式化时间序列 x 轴

我想显示每个月份的缩写以及年份的缩写我很接近我目前遇到的问题是年份不正确我发现这是 numpy datetime64 日期时间索引采用这种格式和使用 1970 纪元的 python datetime 之间的问题图表上显示的两年应
显示随机字符串

我试图在每次按下 strings xml 中定义的一组字符串中的按钮时显示一个随机字符串这是字符串 ID 的示例
linkedHashSet 中的有序插入，有什么高性能的方法吗？

所以我有一个 LinkedHashSet 其值为 a1 a2 b c1 c2 我想用 x 替换 b 使得 x 的顺序应与 b 的顺序相同一种明显的方法是 private LinkedHashSet
JavaScript Google Maps API 如何将位置纬度/经度存储到全局变量

我是 JavaScript 新手希望实现 Google 提供的代码以便在您的位置放置标记但是我想获取位置数据并在 getCurrentPosition 块之外使用它我的第一遍是实例化一个对象其中纬度和经度作为块外部的属性并将其
在 Canvas 中使用 arc() 方法添加多余的线条
是否可以将处理（java 3d）中的窗口附加到像面板一样的摆动单元中？

我想将另一个窗口附加到现有的窗口中JFrame or JComponent或者什么有什么办法可以做到吗编辑不当我的意思是正如标题所说攻击a加工显示窗口处理基本上是在 java 中使用 3d 进行操作并可视化 3d 窗口每当运
如何使用 JavaScript 获取整个文档的高度？

有些文档我无法获取文档的高度将某些内容绝对放置在最底部此外填充底部似乎在这些页面上没有任何作用但在高度将返回的页面上起作用相关案例 http fandango com http paperbackswap com 方丹戈jQuer
C# 使用 SMO 以编程方式创建数据库

我正在尝试创建数据库但创建后无法连接到它服务器是Microsoft SQL Server 2008并使用 Net 4 5 我们使用 SMO 创建数据库但我们通常使用Dapper连接并查询数据库这是我到目前为止的代码它有效 Syst
WebAPI OAuth 注销 - 如何删除令牌 Cookie？

我有一个带有 OAuth 登录配置的 WebAPI 如下所示 app UseOpenIdConnectAuthentication new OpenIdConnectAuthenticationOptions ClientId client
如何找到与正方形周长相交的 Voronoi 图的悬垂线的交点？

我试图通过查找与定义的正方形周长相交的悬垂多边形线的交点来更新 Voronoi 的交点数组我希望能够重新创建一个新的 Voronoi 交点数组该数组应该用相交点替换那些悬垂点下面是我为实验创建的一些代码 function grainn
使用 iTextSharp 将图像转换为 PDF 并保留剪切路径

我们希望以编程方式将图像批量转换为 PDF 到目前为止我们似乎将使用 iTextSharp 但我们在使用剪切路径的 JPG 图像时遇到问题我们在测试中使用以下代码 using FileStream fs new FileStream o
删除 Postgresql 中连续的重复行

我有一个包含 3 列 id 金额时间的表该表根据id升序排列我想删除除第一个之外在金额列中具有相同值的所有连续行 eg id 12 15 16 17 19 22 amount 555 546 546 53 53 500 time A
通用Web表单的数据库设计

我想构建一个通用网络表单的后端其中包含用户可以回答的问题问题有多种类型普通文本问题通过简单的文本字段回答问题 Example 一般个人信息例如姓名文本区域问题相同但有更多空间来写答案 Example 您要添加的更多信息框
通过 Odoo 中的代码发送电子邮件时出错

我创建了一个通过单击模块 linh warehoues 中的按钮发送电子邮件来发送电子邮件的函数但出现以下错误关系 mail thread 不存在我实在不明白这是什么意思我还检查了 mail thread py 中存在 mail
if 语句中的 getline

从我读到的来看 getline 在布尔上下文中使用会返回隐式转换为void 我在网络上没有找到任何真正引用此声明的地方它到处都说隐式转换不存在并且在布尔上下文中指针应该是相同类型的并且如果ptr 0 than 0转换为指针类型ptr
检查嵌套字典内的成员资格

这是此问题的后续问题 Python DictReader 跳过缺少列的行事实证明我很愚蠢并且使用了错误的 ID 字段顺便说一句我在这里使用的是 Python 3 x 我有一个员工字典由字符串 directory id 索引每个值

检查嵌套字典内的成员资格

检查嵌套字典内的成员资格 的相关文章

随机推荐

热门标签

检查嵌套字典内的成员资格的相关文章