从数据集中抽样5个观察值,其中排名变量并不总是具有5个观察值

问题描述 投票:0回答:1

我有一个银行业务部门(分支机构)和帐户(帐号)的数据集。一些分支机构有2个帐户,而其他分支机构可以有50个帐户-有所不同。我需要从每个分支。中随机抽取5个帐户我尝试使用下面的代码,但出现以下错误:

错误:样本大小5大于抽样单位的数量2。

我需要成为LIKE SMAPSIZE <6,即,如果每个分支只有2个obs,则仅带2个。

这是代码:

PROC SQL ;
    CREATE TABLE FINAL_RANDOM as
    SELECT  t1.mis_division_id,
            t1.mis_wing_id,
            t1.region_id,
            t1.account_branch_id,
            t1.branch_name,
            t1.acc,
            t2.Attribute,
    FROM work.ORGANIZATION_STRUC2 t1
    INNER JOIN work.UNION_ALL_RANDOM t2
    ON t1.account_id = t2.account_id
;
QUIT ;

PROC SORT DATA=work.FINAL_RANDOM ;
BY Account_Branch_Id ;
RUN ;

PROC SURVEYSELECT DATA=FINAL_RANDOM OUT=FINAL_RANDOM_1 NOPRINT
     METHOD=srs
     SAMPSIZE = 5 ;
     STRATA Account_Branch_Id ;
RUN; 
random sas sample
1个回答
0
投票

样本大小

SAMPSIZE =

指定样本大小

SELECTALL

[当样本量超过总数时选择所有层单位

© www.soinside.com 2019 - 2024. All rights reserved.