选择超参数 - 网格搜索

Question

在此例子检验一个逻辑回归模型的惩罚和正则化参数。我不明白如何选择这样的参数。比如为什么要关注（11,12）或（0,4）？这与我们的数据有什么关系？

Answer 1

网格搜索的目的是寻找广义最优参数。

For example why focus on (l1,l2) or (0,4)?

惩罚参数和正则化参数会影响分类边界。所以要找到最佳分类是重点。

How does this relate to the data we have?

这些和我们的数据没有直接关系。我们的想法是，例如，我们必须选择'C'（正则化）参数，它给出了训练集和验证集之间最小的差异。因此，模型应该是简单的，以及在未来数据上的泛化。

一般来说，选择参数的范围，并不是一次性的尝试，而是在前一次迭代的基础上，根据模型的性能扩大范围。