在KNIME刮刀中设置“等待”

问题描述 投票:0回答:1

我正在为一个项目构建一个新闻报道器,我找到了通过大多数网站的方式,但是一个让我头疼,因为每当我尝试批量提取文章内容时,链接的大部分html都会赢得'加载。我甚至尝试过python,结果相同。我的问题是:如何设置“等到内容加载”?我正在阅读可能需要先加载一些Ajax。

ajax web-scraping scrape knime
1个回答
2
投票

我认为你在寻找的是Selenium Nodes。它们特别适用于从基于Ajax的网站提取数据,其中内容通过JavaScript代码加载。

您可以找到一些示例工作流程,例如这里:

© www.soinside.com 2019 - 2024. All rights reserved.