我试图使用必需元素的类名,以一种通用的方式从网站上获取信息。一段时间后,我注意到HTML代码的顶部有一个看起来像JSON文件的部分,其中包含所有必需的信息。
[外观如下:https://drive.google.com/open?id=1utP_ldRWCaabLKcOvsWu_6NHP3ClrdQQ
我尝试清除此文件,但仍无法将其读取为JSON。我认为这可能是一个普遍的问题,你们中的某人可以帮助找到一种简单的方法来从HTML的这一部分提取信息。这比从许多地方报废部分零件要快得多,也容易得多。
[如果有人知道该读些什么,我也将不胜感激。任何帮助都是非常有价值的。
我相信您的数据正在使用bs4
解析器,因此您可以使用以下方法在JSON
中加载数据: