在此 例子 检验一个逻辑回归模型的惩罚和正则化参数。我不明白如何选择这样的参数。比如为什么要关注(11,12)或(0,4)?这与我们的数据有什么关系?
网格搜索的目的是寻找广义最优参数。
For example why focus on (l1,l2) or (0,4)?
惩罚参数和正则化参数会影响分类边界。所以要找到最佳分类是重点。
How does this relate to the data we have?
这些和我们的数据没有直接关系。我们的想法是,例如,我们必须选择'C'(正则化)参数,它给出了训练集和验证集之间最小的差异。因此,模型应该是简单的,以及在未来数据上的泛化。
一般来说,选择参数的范围,并不是一次性的尝试,而是在前一次迭代的基础上,根据模型的性能扩大范围。