Logistic回归-Python？

Question

您能否简要描述以下代码行的含义？这是Python中逻辑回归的代码。

什么意思是大小= 0.25且random_state = 0？什么是train_test_split？在这行代码中做了什么？

X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.25,random_state=0)

这些代码行做了什么？

logistic_regression= LogisticRegression()
logistic_regression.fit(X_train,y_train)
y_pred=logistic_regression.predict(X_test)

Answer 1

其他行仅对训练数据集运行逻辑回归。然后，您可以使用测试数据集来检查拟合回归的优劣。

Answer 2

什么表示大小= 0.25且random_state = 0？

[test_size=0.25->训练和测试数据的25％分配。

random_state = 0->为可再现的结果，它可以是任意数字。

此行代码做了什么？

将X和y拆分为X_train, X_test, y_train, y_test

这些代码行做了什么？

通过fit(X_train, y_train)训练逻辑回归模型，然后对测试集X_test进行预测。

稍后您可能会比较y_pred和y_test以查看模型的准确性。

Answer 3

X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.25,random_state=0)

以上行将您的数据随机分为训练和测试数据

Answer 4

此行：

X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.25,random_state=0)

将您的来源分为训练和测试集，0.25表示25％的来源将用于测试，其余部分将用于训练。

对于，random_state = 0，这是brief discussion。链接上方的一部分：

如果您使用random_state = some_number，则可以保证运行1的输出将等于运行2的输出，

logistic_regression= LogisticRegression() #Creates logistic regressor

为您的来源计算一些值。 Recommended read

logistic_regression.fit(X_train,y_train)

链接上方的一部分：

在这里，拟合方法在应用于训练数据集时，将学习模型参数（例如，均值和标准差）

基于对训练集的学习，对测试集进行预测。

y_pred=logistic_regression.predict(X_test)