首先让我先说这个问题有两个部分,第二部分最后提到。
我想获取具有特定名称的所有关联字符串的值。让我尝试用一些JSON示例来解释。
{
"data": {
"list": {
"123": {
"location": 123,
"x": 0.1,
"y": 0.2,
"ids": [
{
"id_a": 123
"id_b": 442
},
{
"id_a": 123
"id_b": 443
},
{
"id_a": 123
"id_b": 444
}
]
}
"555": {
"location": 555,
"x": 0.6,
"y": 0.4,
"ids": [
{
"id_a": 555
"id_b": 449
},
{
"id_a": 555
"id_b": 450
}
]
}
}
}
}
我想返回所有“id_b”值的数组。这是我想要的输出:
array = [442, 443, 444, 449, 450]
我最接近的是使用以下内容:
import json
import urllib.request as ur
file = ur.urlopen(url)
data = json.loads(file.read())
r = []
r = data['data']['list']['123']['ids'][0]['id_b']
print(r)
我将得到442.删除[0]给我留下'TypeError:列表索引必须是整数或切片,而不是str'。我可以尝试包含一个循环,其中[0]变为[i]而i是'ids'的数量,但这个数字对于所有位置都不一致。
我还没有找到任何与这样的JSON结构一起使用的Python的例子。如果有人知道任何可以帮助的资源,我会乐意从这些资源开始。
此外,有问题的网址每天都会更改,我有代码根据日期改变网址。但是,当改变日期时,“列表”下的对象名称也会改变,即“123”可能变为“326”。与'location'和'id_a'相同。这些都是一样的。 “123”=“location”value =“id_a”值。
有没有办法简单地将所有带字符串“id_b”的值放入数组?这最终是我正在寻找的。
假设没有比示例中显示的更多嵌套,您可以使用单个列表解析:
>>> d = json.load(open("tmp.json"))
>>> [i['id_b'] for v in d['data']['list'].values()
... for i in v['ids']]
[442, 443, 444, 449, 450]
如果顺序很重要(尽管它不应该,因为JSON对象中的键顺序是未定义的),你必须依赖Python 3.7保证的dicts
迭代顺序。
您可以尝试递归方法:
def find_by_key(obj, key):
if isinstance(obj, dict):
for k, v in obj.items():
if k == key:
yield v
else:
yield from find_by_key(v, key)
elif isinstance(obj, list):
for sub in obj:
yield from find_by_key(sub, key)
else:
return
print(list(find_by_key(data, 'id_b')))
输出:
[442, 443, 444, 449, 450]
你需要递归函数
递归函数:
递归是一种编程或编码问题的方法,其中函数在其体内调用自身一次或多次。通常,它返回此函数调用的返回值。
终止条件:递归函数必须终止才能在程序中使用。递归函数终止,如果每次递归调用,问题的解决方案都会缩小并移向基本情况。基本情况是一种情况,可以在没有进一步递归的情况下解决问题。
def id_generator(dict_var, key):
for k, v in dict_var.items():
if isinstance(v, dict):
for id_val in id_generator(v,key):
yield id_val
elif isinstance(v, list):
for item in v:
yield item[key]
key = 'id_b'
print(list(id_generator(data, key)))
输出:
[442, 443, 444, 449, 450]