IBM自然语言理解-返回页面标题

问题描述 投票:0回答:1

我正在使用IBM Cloud NLU从URL列表中分析一系列网页。

API成功返回了实体,我也可以使用]返回分析的内容。

return_analyzed_text => 'true';

我的问题是,除了分析的文本外,我还需要返回网页标题。

到目前为止,我的解决方案是分别对每个页面进行CURL处理,从DOM中提取标题元素,并将分别提取的标题信息与return_analyzed_text字符串相关联。这个额外的步骤为该过程增加了可观的时间,并且似乎没有必要,因为该API显然已经对页面进行了CURL处理。

有什么方法可以让API返回文档标题? (或其他任何H1之类的DOM元素?)

我正在使用IBM Cloud NLU从URL列表中分析一系列网页。该API已成功返回实体,并且我也可以使用...

ibm-cloud ibm-watson
1个回答
1
投票

如果您要求metadata-https://cloud.ibm.com/apidocs/natural-language-understanding#metadata,则可以获取返回标题的服务>

根据文档,除了已经传递来请求元数据的内容之外,您还需要传递这些参数。

{
  "url": "www.ibm.com",
  "features": {
    "metadata": {}
  }
}
© www.soinside.com 2019 - 2024. All rights reserved.