我有一段旧的 python 代码,可以解析格式严格的文本文件(存储用于本地化的字符串)。由于结构是分层的,并且某些元素可能存在也可能不存在,因此程序使用嵌套defaultdict
s 来表示它。就像是:
terms = defaultdict(lambda: defaultdict(str)) # dict<key, dict<lang, translation>>
因为这些字典没有类型(因为它们的成员可以是任何类型)并且因为它们是嵌套的,并且因为我需要向该层次结构添加另一个级别,所以我决定向该程序添加类型:
from typing import Tuple, Dict, Set, List, NewType
Key = NewType('Key', str)
Lang = NewType('Lang', str)
Translation = NewType('Translation', str)
PLIndex = NewType('PLIndex', int)
然而,我一生都无法弄清楚如何重写terms =
上面的行使它们嵌套defaultdict
键入。
我最终所做的只是基本上包装dict
进入我的类型,看起来不太好:
class Forms:
def __init__(self):
self.dct: Dict[PLIndex, Translation] = {}
def __getitem__(self, item: PLIndex) -> Translation:
return self.dct[item]
def __setitem__(self, key: PLIndex, value: Translation) -> None:
self.dct[key] = value
class Translations:
def __init__(self):
self.dct: Dict[Lang, Forms] = {}
def __getitem__(self, item: Lang) -> Forms:
if item not in self.dct:
self.dct[item] = Forms()
return self.dct[item]
def __setitem__(self, key: Lang, value: Forms) -> None:
self.dct[key] = value
def items(self):
return self.dct.items()
class Terms:
def __init__(self):
self.dct: Dict[Key, Translations] = {}
def __getitem__(self, item: Key) -> Translations:
if item not in self.dct:
self.dct[item] = Translations()
return self.dct[item]
def __setitem__(self, key: Key, value: Translations) -> None:
self.dct[key] = value
def __len__(self):
return len(self.dct)
def items(self):
return self.dct.items()
...
terms = Terms()
有什么办法可以声明我的Forms
, Translations
和其他类型一样NewType
s for dict
/defaultdict
并能够重写terms =
以某种方式强制嵌套字典的正确类型?或者我可以延长dict
/defaultdict
(而不是包装它们)并能够强制执行正确的类型?或者有更好的方法吗?