我正在尝试使用像https://zapier.com或https://ifttt.com这样的新闻网址自动提取数据。
主要目标是将精美版本的新闻网址文本添加到Google电子表格中。尝试使用像“importXML”这样的函数失败,因为我需要分析具有不同结构的URL。
我正在考虑使用像readability.js https://code.google.com/archive/p/arc90labs-readability/downloads之类的东西来将html变成漂亮的文本,因为zapier允许在javascript或python中使用代码片段。
问题是zapier你不能使用这些编程语言(如beautifulsoup)不标准的模块来刮取网址。
有没有机会我可以将url传递给readability.js https://storage.googleapis.com/google-code-archive-downloads/v2/code.google.com/arc90labs-readability/readability.js的代码,或者对https://mercury.postlight.com/web-parser/进行api调用,返回漂亮的文本?