Python报纸库结果不一致?

问题描述 投票:0回答:1

我正在使用安装报纸的Anaconda3。看似简单,但结果不一致。

http://newspaper.readthedocs.io/en/latest/

import newspaper
cnn_paper = newspaper.build('http://www.cnn.com')
for article in cnn_paper.articles:
    print(article.url)
print(cnn_paper.size())

这段简单的代码有时会返回所有结果,有时则不返回任何结果。

有人使用这个图书馆或知道更好的图书馆来抓新闻网站吗?我不想自己编写解析器,但如果归结为它,我应该使用什么?

python python-newspaper
1个回答
1
投票

找到了FIx

https://github.com/codelucas/newspaper/issues/243

cnn_paper = newspaper.build('http://cnn.com', memoize_articles=False)
© www.soinside.com 2019 - 2024. All rights reserved.