我正在尝试收集推文并提取我的项目的文本部分。我尝试了很多方法,其中大多数对我来说都很好。虽然我偶然发现了这个nltk.twitter包和一些代码片段来做同样的工作。代码很干净,我想用它。但即使是最简单的代码也会给我401错误,尽管我在Twitter开发者处拥有自己的帐户并且需要所有四个密钥。
from nltk.twitter import Twitter
tw = Twitter()
tw.tweets(keywords='love, hate', limit=10)
我从http://www.nltk.org/howto/twitter.html#simple那里拿了这个例子并尝试了给出的每一个例子。它们都不起作用。显然我找不到原因。提前谢谢你的帮助。
有一些可能导致这种情况的事情。但是我打赌这是时间问题,因为nltk试图使用流光,而你的计算机/服务器的时间不同步。
还要确保完全安装nltk。尝试
import nltk
dl = nltk.downloader.Downloader("http://nltk.github.com/nltk_data/")
dl.download()
使用nltk.twitter需要TWITTER环境变量中的credentials.txt文件路径,并且必须正确输入文本文件中的数据。
例如: `app_key =你的消费者密钥
app_secret =你的消费者秘密
oauth_token =您的访问权限
oauth_token_secret =你的访问秘密秘密`
'='之后应该没有空格。另外,不要将密钥放在“YOUR CONSUMER KEY”之类的引号中。
这解决了401的问题。