如何在Python中的回归中添加“大于0且总和为1”的约束？

Question

我正在使用statsmodels（对其他python选项开放）来运行一些线性回归。我的问题是我需要回归没有截距并约束范围（0,1）中的系数，并且总和为1。

我试过这样的事情（总和为1，至少）：

from statsmodels.formula.api import glm
import pandas as pd

df = pd.DataFrame({'revised_guess':[0.6], "self":[0.55], "alter_1":[0.45], "alter_2":[0.2],"alter_3":[0.8]})
mod = glm("revised_guess ~ self + alter_1 + alter_2 + alter_3 - 1", data=df)
res = mod.fit_constrained(["self + alter_1 + alter_2 + alter_3  = 1"],
                          start_params=[0.25,0.25,0.25,0.25])
res.summary()

但仍在努力实施“非负”系数约束。

Answer 1

只需做L1正则化回归：

import statsmodels.api as sm
from statsmodels.regression.linear_model import OLS
model = sm.OLS(Y,X)
model2=model.fit_regularized(method='elastic_net', alpha=0.0, L1_wt=1.0, start_params=None, profile_scale=False, refit=False)
model2.params

...并调整超参数。

Answer 2

你可以在scipy下定义的NNLS（非负最小二乘）。它基于FORTRAN非负最小二乘解算器。你不能添加约束。因此，在输入方程中添加另一个等式，使得x1 + x2 + x3 = 1。

import numpy as np
from scipy.optimize import nnls 
##Define the input vectors
A = np.array([[1., 2., 5.], 
              [5., 6., 4.],
              [1.,  1.,   1. ]])

b = np.array([4., 7., 2.])

##Caluculate nnls
x, resdiual_norm = nnls(A,b)


##Find the difference
print(np.sum(A*x,1)-b)

现在对该矩阵执行NNLS，它将返回x值和残差。

如何在Python中的回归中添加“大于0且总和为1”的约束？

问题描述投票：3回答：2

2个回答

最新问题

如何在Python中的回归中添加“大于0且总和为1”的约束？

问题描述 投票：3回答：2

2个回答

最新问题

问题描述投票：3回答：2