我问了一个随机选择的人以下问题“你多久抽一次烟?”。答案类别如下:1.每天2.偶尔或3.从不。我有关于受访者的详细信息,例如年龄和性别。
结果如下:
10%的受访者每天吸烟。偶尔有5%的烟雾。85%禁止吸烟。
我的问题是:
是否可以围绕该分类数据计算置信区间?即10%的受访者每天吸烟,CI降低8%,Ci升高12%。
我正在使用R,SAS和python进行调查。
我已获得此SAS代码:
proc freq data=smoking_data;
tables smoke / binomial(level='1'); /*Daily*/
tables smoke / binomial(level='2'); /*Occasionally*/
tables smoke / binomial(level='3'); /*Never*/
run;
这似乎可行,但是我不确定二项式是否正确用于分类数据。
谢谢您的任何帮助
我将其称为序数变量,但是您正在执行的操作看起来不错。有一个比我在这里写的更好的解释: