我正在使用rtweet的函数get_timeline来下载推文。但是,我感兴趣的一些用户比你允许下载的3200条推文更多(有些约有47'000)。如果您正在下载基于单词或主题标签的推文,则会出现“retryonratelimit”参数,因此我想知道是否有类似方法可以从一个用户那里获得超过3200条推文?
文档 - 请参阅?get_timeline
- 包含指向GET statuses/user_timeline
的Twitter开发人员文档的链接。 R函数只是一个包装器。
如果你按照Working with timelines的链接,你会找到max_id parameter
的解释。
那么基本方法是:
min(as.numeric(zanetti$status_id))
这样的东西获取最早的状态IDget_timeline
设置max_id = ID
,其中ID是步骤2中的ID注意:我刚刚使用自己的时间轴尝试了此操作,步骤3只返回了40条推文。因此您可能还需要等待适当的时间以避免速率限制。请注意,Twitter基本上尽其所能阻止您通过API请求大量数据 - 在一天结束时,您可能无法实现所需。