无法使用 load_dataset() 在 Kaggle 内核中加载 Json 文件,但可以在 Google Colab 和本地系统中使用

问题描述 投票:0回答:1

我正在尝试使用 Kaggle 内核中 Huggingface 数据集库中的 load_dataset 方法加载 json 文件。这是代码:

data=load_dataset("json",data_files="/kaggle/input/dataset/gold_summaries_test.json")

仅当我在 Kaggle Kernel 中工作时,才会出现以下错误。 AttributeError: 'list' object has no attribute 'keys'

下面是我尝试加载的 json 文件的预览。

gold_summaries_test.json 在 Google Colab 中或本地系统中的 python 控制台上加载文件时,不会发生此错误。

json kaggle huggingface-datasets
1个回答
0
投票

{ "data" : [{ "a": "one", "b": "two" }, { "a": "three", "b": "four" }] }

并使用 load_dataset 如下:

dataset = load_dataset("json", data_files=file_path, field="data")

© www.soinside.com 2019 - 2024. All rights reserved.