Python 类型:类型化字典或 defaultdict 扩展类

2023-12-30

我有一段旧的 python 代码,可以解析格式严格的文本文件(存储用于本地化的字符串)。由于结构是分层的,并且某些元素可能存在也可能不存在,因此程序使用嵌套defaultdicts 来表示它。就像是:

terms = defaultdict(lambda: defaultdict(str)) # dict<key, dict<lang, translation>>

因为这些字典没有类型(因为它们的成员可以是任何类型)并且因为它们是嵌套的,并且因为我需要向该层次结构添加另一个级别,所以我决定向该程序添加类型:

from typing import Tuple, Dict, Set, List, NewType

Key = NewType('Key', str)
Lang = NewType('Lang', str)
Translation = NewType('Translation', str)
PLIndex = NewType('PLIndex', int)

然而,我一生都无法弄清楚如何重写terms =上面的行使它们嵌套defaultdict键入。

我最终所做的只是基本上包装dict进入我的类型,看起来不太好:

class Forms:
    def __init__(self):
        self.dct: Dict[PLIndex, Translation] = {}

    def __getitem__(self, item: PLIndex) -> Translation:
        return self.dct[item]

    def __setitem__(self, key: PLIndex, value: Translation) -> None:
        self.dct[key] = value


class Translations:
    def __init__(self):
        self.dct: Dict[Lang, Forms] = {}

    def __getitem__(self, item: Lang) -> Forms:
        if item not in self.dct:
            self.dct[item] = Forms()
        return self.dct[item]

    def __setitem__(self, key: Lang, value: Forms) -> None:
        self.dct[key] = value

    def items(self):
        return self.dct.items()


class Terms:
    def __init__(self):
        self.dct: Dict[Key, Translations] = {}

    def __getitem__(self, item: Key) -> Translations:
        if item not in self.dct:
            self.dct[item] = Translations()
        return self.dct[item]

    def __setitem__(self, key: Key, value: Translations) -> None:
        self.dct[key] = value

    def __len__(self):
        return len(self.dct)

    def items(self):
        return self.dct.items()

...

terms = Terms()

有什么办法可以声明我的Forms, Translations和其他类型一样NewTypes for dict/defaultdict并能够重写terms =以某种方式强制嵌套字典的正确类型?或者我可以延长dict/defaultdict(而不是包装它们)并能够强制执行正确的类型?或者有更好的方法吗?


在我看来,包装字典似乎是毫无意义的代码(因为它没有添加任何新功能,但你仍然必须维护它),如果可能的话,我会避免它。

现在,以下内容对我有用:

from collections import defaultdict
from typing import Tuple, Dict, DefaultDict, Set, List, NewType

Key = NewType('Key', str)
Lang = NewType('Lang', str)
Translation = NewType('Translation', str)
PLIndex = NewType('PLIndex', int)

FormsDict = DefaultDict[PLIndex, Translation]
TranslationsDict = DefaultDict[Lang, FormsDict]
TermsDict = DefaultDict[Key, TranslationsDict]

terms: TermsDict = defaultdict(         # TermsDict
    lambda: defaultdict(                # TranslationsDict
        lambda: defaultdict(            # FormsDict
            lambda: Translation("")     # Default value "" (as Translation)
        )
    )
)

我已经测试过这个mypy --strict并且它通过了验证。与此一起使用defaultdict并且仍然通过验证,看来你需要cast

from typing import cast

terms[Key("key1")].update(
    cast(TranslationsDict, {
        Lang("en_GB.UTF-8"): cast(FormsDict, {
            PLIndex(100): Translation("key1")
        })
    })
)

print(terms)

Output:

defaultdict(<function <lambda> at 0x107d31cb0>, {
    'key1': defaultdict(<function <lambda>.<locals>.<lambda> at 0x107d31d40>, {
        'en_GB.UTF-8': {100: 'key1'}})})
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python 类型:类型化字典或 defaultdict 扩展类 的相关文章

随机推荐