Yelp数据文件类型

问题描述 投票:2回答:2

我试图从Yelp数据集挑战网站(https://www.yelp.com/dataset_challenge)打开该文件。我已经成功完成了,但是,我无法打开文件,因为它没有扩展名。它大约是4 GB。我认为它可能是一个JSON文件,因为当我搜索时,过去它是。但是,我无法弄清楚如何打开它或将其转换为CSV。我想对这些数据使用Python进行一些分析。谁能帮我?谢谢。

python machine-learning yelp
2个回答
3
投票

我遇到了同样的问题。事实证明,tar中的文件(没有扩展名的文件)也是一个tar文件 - 因此下载基本上是tar文件中的tar文件。解压缩原始文件后,将tar扩展名添加到其中,然后解压缩。解压后,您将获得数据集的所有不同json文件。


1
投票

Yelp数据集示例的github项目有一些示例,其中一个是“json_to_csv_converter”,它可以帮助您完成您所要求的工作。

Yelp's Academic Dataset Examples

如果这有帮助,请告诉我!

© www.soinside.com 2019 - 2024. All rights reserved.