我有信用贷款数据,但是原始df有许多可以位于一个客户之下的贷款ID。因此,我需要按客户端ID分组以建立客户端配置文件。
原始df:
contract_id', 'product_id','client_id','bal','age', 'gender', 'pledge_amount', 'branche_region
RZ13/25 000345 98023432 2300 32 M 4500 'west'
clients = df.groupby(by=['client_id']).median().reset_index()
此行完全删除了重要类别,例如性别,分支区域!它按client_id分组,并计算NUMERIC列的中位数。所有其他类别的列都消失了。
我想知道如何按唯一客户分组,但又保留类别。.>
我有信用贷款数据,但是原始df有许多可以位于一个客户之下的贷款ID。因此,我需要按客户端ID分组以构建客户端配置文件。原始df:contract_id','...
已删除,因为熊猫删除了nuisance columns
。