在Python中返回嵌套JSON对象中的值

问题描述 投票:1回答:3

首先让我先说这个问题有两个部分,第二部分最后提到。

我想获取具有特定名称的所有关联字符串的值。让我尝试用一​​些JSON示例来解释。

{
  "data": {
    "list": {
      "123": {
        "location": 123,
        "x": 0.1,
        "y": 0.2,
        "ids": [
          {
            "id_a": 123
            "id_b": 442
          },
          {
            "id_a": 123
            "id_b": 443
          },
          {
            "id_a": 123
            "id_b": 444
          }
        ]
      }
      "555": {
        "location": 555,
        "x": 0.6,
        "y": 0.4,
        "ids": [
          {
            "id_a": 555
            "id_b": 449
          },
          {
            "id_a": 555
            "id_b": 450
          }
        ]
      }
    }
  }
}

我想返回所有“id_b”值的数组。这是我想要的输出:

array = [442, 443, 444, 449, 450]

我最接近的是使用以下内容:

import json
import urllib.request as ur

file = ur.urlopen(url)
data = json.loads(file.read())

r = []
r = data['data']['list']['123']['ids'][0]['id_b']
print(r)

我将得到442.删除[0]给我留下'TypeError:列表索引必须是整数或切片,而不是str'。我可以尝试包含一个循环,其中[0]变为[i]而i是'ids'的数量,但这个数字对于所有位置都不一致。

我还没有找到任何与这样的JSON结构一起使用的Python的例子。如果有人知道任何可以帮助的资源,我会乐意从这些资源开始。

此外,有问题的网址每天都会更改,我有代码根据日期改变网址。但是,当改变日期时,“列表”下的对象名称也会改变,即“123”可能变为“326”。与'location'和'id_a'相同。这些都是一样的。 “123”=“location”value =“id_a”值。

有没有办法简单地将所有带字符串“id_b”的值放入数组?这最终是我正在寻找的。

python json
3个回答
0
投票

假设没有比示例中显示的更多嵌套,您可以使用单个列表解析:

>>> d = json.load(open("tmp.json"))
>>> [i['id_b'] for v in d['data']['list'].values()
...            for i in v['ids']]
[442, 443, 444, 449, 450]

如果顺序很重要(尽管它不应该,因为JSON对象中的键顺序是未定义的),你必须依赖Python 3.7保证的dicts迭代顺序。


0
投票

您可以尝试递归方法:

def find_by_key(obj, key):
    if isinstance(obj, dict):
        for k, v in obj.items():
            if k == key:
                yield v

            else:
                yield from find_by_key(v, key)

    elif isinstance(obj, list):
        for sub in obj:
            yield from find_by_key(sub, key)

    else:
        return

print(list(find_by_key(data, 'id_b')))

输出:

[442, 443, 444, 449, 450]

0
投票

你需要递归函数

递归函数:

递归是一种编程或编码问题的方法,其中函数在其体内调用自身一次或多次。通常,它返回此函数调用的返回值。

终止条件:递归函数必须终止才能在程序中使用。递归函数终止,如果每次递归调用,问题的解决方案都会缩小并移向基本情况。基本情况是一种情况,可以在没有进一步递归的情况下解决问题。

def id_generator(dict_var, key):
    for k, v in dict_var.items():
        if isinstance(v, dict):
            for id_val in id_generator(v,key):
                yield id_val
        elif isinstance(v, list):
            for item in v:
                yield item[key]

key = 'id_b'
print(list(id_generator(data, key)))

输出:

[442, 443, 444, 449, 450]
© www.soinside.com 2019 - 2024. All rights reserved.