我试图使用rtweet-package来下载某个标签的一些推文。我使用了一个叫OpenCodez的地方的指南,但我遇到了问题。
使用rtweet-package的 "search_tweets "功能,我无法下载超过5条微博,而rtweet的极限应该是18.000条微博。
我没有收到任何错误,但是当运行我的脚本时,"Downloading"-graphic仅仅停止在10%(当尝试下载n=2000)。
我试过使用 "retryonratelimit=TRUE",但不成功。我已经重置了我的脚本,尝试了不同的教程来建立一个连接--所有的工作都很好--直到我真正使用search_tweets-function。
所以这是我连接到API的代码。
api_key <- "xxxx"
api_secret_key <- "xxxx"
access_token <- "xxxx"
access_token_secret <- "xxxx"
## authenticate via web browser
token <- create_token(
app = "xxxx",
consumer_key = api_key,
consumer_secret = api_secret_key,
access_token = access_token,
access_secret = access_token_secret)
这是我的 "刮刮乐"
my_tweets = search_tweets("#vmd19", n=2000, lang='en')
结果的数据框架只有5列,这很奇怪 在标签下至少应该有几百条推文。我尝试了不同的查询方式(标签等),都没有成功。下载就停在了这样的地方。
Downloading [===>-------------------------------------] 10%
我不知道我做错了什么。 I cannot figure out what I'm doing wrong. 希望有人能帮我解决这个问题!
这个问题在这里得到了解决。https:/github.comropenscirtweetissues364
看起来是因为你可以收集推文的窗口(大约在上周)。如果该时间窗口中可用的推文数量小于你的search_tweets函数中的n,那么在达到100%之前就会被切掉。因此,如果你要求收集100条带有某个词的推文,而这个词在上周只被推送了7次,那么它将在7%时停止下载。