试图找出一个宠物项目的东西,并被严重卡住:(
该项目围绕Tweet事件的顺序。我收集了2个演员的3个不同主题的推文。我想确定哪个演员关于每个特定主题的推文总体上发生了。一位朋友建议我查看“生存”包,但我看不出它是如何起作用的。任何建议都会受到欢迎!非常感谢!
编辑:其他信息
created_at name
1544469754 chicagotribune
1541550304 chicagotribune
party type topic
M 1 trade
M 1 trade
该变量表示以下信息
- 创建时间:发送推文的时间
-name:Twitter帐户名称
-party:政治倾向的分类变量
-type:二进制指示符(1 =媒体类型A,0 =媒体类型B)
-topic:推文所属的主题(共3个主题)
我不认为这是一个生存分析问题,你只需要在每个主题中找到最早的时间戳。我认为这样的事情应该有效:
# Read in example data
df = readr::read_table("created_at name party type topic
1544469754 chicagotribune M 1 trade
1541550304 chicagotribune M 1 trade")
df %>%
group_by(topic) %>%
summarise(first_tweeter = name[which.min(created_at)])