如何检查html是否已更改?

问题描述 投票:4回答:1

很抱歉,如果那是错误的地方,但是不知道在哪里问。

我们正在构建可在选定网站上使用的Firefox插件。现在,由于这些网站有时会偶尔更改,因此我想每天运行一次javascript脚本,该脚本将检查代码的特定部分是否已更改,如果更改了,我们将得到一些返回消息(理想情况下直接返回到我的电子邮件)。

最简单,最简单的方法是什么?我已经读过有关网络爬虫,网络爬虫的信息,但他们似乎做的远远超出我们的需要。我们基本上希望从连接到Internet的PC上运行一个小的脚本,该脚本将进行简单的检查,并在检测到对html正文的特定部分进行更改后立即向我们发送电子邮件(或更具体地说-选定的元素尚未被发现)。

非常感谢您的帮助

javascript html web-scraping firefox-addon web-crawler
1个回答
0
投票

[基本上,您可以将Google Spreadsheet设置为使用xpath通过IMPORTXML function (here with an example)刮取页面的各个部分。然后,您可以在电子表格中设置通知:工具->通知规则“在此处输入图像描述”“ >>

现在,每当抓取功能(IMPORTXML)获得的内容与先前的不同时,电子表格应会触发一封邮件给您。

作为一种现成的替代方案,我也可能建议some tools跟踪页面和/或其部分的更改!,包括通过电子邮件进行通知。

© www.soinside.com 2019 - 2024. All rights reserved.