我正在开展一项 COVID-19 调查。主要目标是提出一个问题,并根据 0-30 范围内的答案给出分数,但是当我执行分析时,包会恢复我的变量,就好像它们是分类变量一样。我想要每个变量的平均分。
这是数据框:
> head(PRA001)
# A tibble: 6 × 6
ID A quelle fréquence v…¹ Distance_2m Eviter_contact_sociaux Porter_masque_facial
<chr> <int> <int> <int> <int>
1 ORC0… 20 20 10 10
2 ORC0… 0 10 0 20
3 ORC0… 0 0 0 0
4 ORC0… 20 20 20 20
5 ORC0… 0 0 0 0
6 ORC0… 0 0 0 0
summary_stats <- PRA001%>%select(-ID)%>%tbl_summary() %>%
add_stat_label(label = everything() ~ "Mean (SD)")
我期望在干预之前和之后(从时间点变量)获得每个变量的平均分数,然后是平均差,但这就是我得到的。
当变量较少时,gtsummary 将其视为分类变量。我不确定具体的阈值是多少。我相信有人会告诉我。
您可以使用 type 参数来确保将事物作为连续变量进行分析。 (您似乎尝试过使用标签参数)。
summary_stats <- PRA001%>%
select(-ID)%>%
tbl_summary(.,
type = type = list(everything() ~ "continuous"))
您还可以对变量标签进行快速调整:
summary_stats[["table_body"]][["label"]]<- summary_stats[["table_body"]][["label"]]%>%gsub("_", " ", .)%>%str_to_title()