如何确定推文的发生顺序(生存分析?)?

问题描述 投票:0回答:1

试图找出一个宠物项目的东西,并被严重卡住:(

该项目围绕Tweet事件的顺序。我收集了2个演员的3个不同主题的推文。我想确定哪个演员关于每个特定主题的推文总体上发生了。一位朋友建议我查看“生存”包,但我看不出它是如何起作用的。任何建议都会受到欢迎!非常感谢!

编辑:其他信息

created_at           name
1544469754 chicagotribune
1541550304 chicagotribune 

party     type     topic
M         1        trade
M         1        trade

该变量表示以下信息

- 创建时间:发送推文的时间

-name:Twitter帐户名称

-party:政治倾向的分类变量

-type:二进制指示符(1 =媒体类型A,0 =媒体类型B)

-topic:推文所属的主题(共3个主题)

r twitter time-series survival-analysis
1个回答
2
投票

我不认为这是一个生存分析问题,你只需要在每个主题中找到最早的时间戳。我认为这样的事情应该有效:

# Read in example data
df = readr::read_table("created_at           name    party     type     topic
1544469754 chicagotribune    M         1        trade
1541550304 chicagotribune    M         1        trade")

df %>%
    group_by(topic) %>%
    summarise(first_tweeter = name[which.min(created_at)])
© www.soinside.com 2019 - 2024. All rights reserved.