[当使用sklearn LogisticRegression函数对不平衡训练数据集进行二进制分类时(例如85%pos类与15%neg类),将class_weight参数设置为'balanced'与将其设置为{0:0.15, 1:0.85}?根据文档,在我看来,使用'balanced'参数将提供与提供字典相同的功能。
class_weight
“平衡”模式使用y的值自动调整 权重与输入数据中的类频率成反比 as n_samples /(n_classes * np.bincount(y))。
是的,意思是一样的。使用class_weight='balanced
参数,您无需传递确切的数字,并且可以自动进行平衡。