使用 Google Sheets 和/或 App Script 从使用 Javascript 的网站上抓取数据

问题描述 投票:0回答:1

我想通过在 WorldCat ( https://search.worldcat.org/ ) 中搜索图书的书名来收集有关图书的数据。例如,如果我的输入是“Remarkable Creatures”,我希望它输出:

作者姓名:特蕾西·谢瓦利埃 类型: 历史小说 出版日期: 2010 封面图片:https://coverart.oclc.org/ImageWebSvc/oclc/+-+784064419_140.jpg?allowDefault=false&client=WorldcatOrgUI

我希望最终结果位于 Google Sheets 中,因此我更愿意使用 Google Sheets 或 App Script 来获取此结果,但我知道 Google Sheets 没有内置的导入功能来自使用 javascript 的页面,所以我会接受我能得到的任何帮助。我研究了一些解决方案,但还没有找到适合我的解决方案;这可能只是因为我在编码方面还很陌生。

我尝试过使用 Google Sheets 功能,例如 ImportHTML 和 ImportXML,但没有成功(由于我已经了解了 javascript 功能)。我也寻找过 AppScript 解决方案,但我无法找到适合我想要做的事情的代码。

javascript google-sheets google-apps-script web-scraping
1个回答
0
投票

您应该使用机器/数据界面而不是他们的网站。他们提供 REST API。因此,您需要进行 REST 调用,而不是网络抓取。

参见:https://developer.api.oclc.org/wcv2

© www.soinside.com 2019 - 2024. All rights reserved.