我正在创建一个嵌套的引用字典来记录数据字典可能具有的所有可能的键以及相应的值,这些值是在平面字典中使用的所有键。
数据字典的键将始终是参考字典的键的子集。平面字典的键将始终是参考字典的值集的子集。
换句话说,给定一个带有这样的赋值的引用字典:
reference['agent']['address'] = 'agentaddress'
reference['agent']['zone']['id'] = 'agentzoneid'
reference['eventid'] = 'eventid'
reference['file']['hash'] = 'filehash'
reference['file']['name'] = 'filename'
和一个像这样的赋值的数据字典:
nested['agent']['address'] = '172.16.16.16'
nested['eventid'] = '1234566778'
nested['file']['name'] = 'reallybadfile.exe'
代码应该生成一个可以像这样分配的字典:
flat['agentaddress'] = '172.16.16.16'
flat['eventid'] = '1234566778'
flat['filename'] = 'reallybadfile.exe'
我永远不会知道嵌套字典中的哪些字段将被填充,哪些字段不会填充,但我可以知道参考字典中的映射。
我希望我需要使用递归来将字典遍历到子字典中,并且可能需要某种间接来分别从引用字典值和嵌套字典键创建扁平字典键和值。
但是,我还没有能够生成任何有意义的代码。
也许从很高的层面看,它可能看起来像这样:
def this(ref, nest, flat, *args):
for (k,v) in reference:
if type(v) is dict:
this(?, ?, ?, ?)
elif nested[path][to][k]:
flat[reference[path][to][k]] = nested[path][to][k]
其中[path][to][k]
代表了一些做间接的方法,而*args
是我传递给递归函数的东西,所以我有办法让上下文足以通过字典的嵌套来获取我需要的键和值的引用。
使用generator,这是相当直接的:
def make_flat_tuples(data, ref):
for k, v in data.items():
if isinstance(v, dict):
for x in make_flat_tuples(v, ref[k]):
yield x
else:
yield ref[k], v
flat = dict(make_flat_tuples(nested, reference))
from collections import defaultdict
reference = defaultdict(dict)
reference['agent'] = defaultdict(dict)
reference['agent']['address'] = 'agentaddress'
reference['agent']['zone']['id'] = 'agentzoneid'
reference['eventid'] = 'eventid'
reference['file']['hash'] = 'filehash'
reference['file']['name'] = 'filename'
nested = defaultdict(dict)
nested['agent']['address'] = '172.16.16.16'
nested['eventid'] = '1234566778'
nested['file']['name'] = 'reallybadfile.exe'
print(dict(make_flat_tuples(nested, reference)))
{
'agentaddress': '172.16.16.16',
'eventid': '1234566778',
'filename': 'reallybadfile.exe'
}
@StephenRauch答案很好,如果你不想使用生成器,只需重新格式化如下:
# r=reference, n=nested, f=final
def buildDict(r, n, f):
for key in n.keys():
if isinstance(n[key], dict):
buildDict(r.get(key), n[key], f)
else:
if r.get(key):
f[r.get(key)] = n[key]