如何在不拆分数据帧的情况下传递不同的数据集进行训练和测试。（蟒蛇）？

Question

我已经解决了多个问题，这些问题有助于将你的数据框分为训练和测试，使用 scikit，不使用等。

但我的问题是我有 2 个不同的 csv（来自不同年份的 2 个不同的数据框）。我想用一个作为火车，另一个作为测试？

如何对线性回归/任何模型执行此操作？

Answer 1

单独加载数据集。
确保它们的行和列（特征）格式相同。
使用
```
train
```
设置为
```
fit
```
模型。
使用
```
test
```
设置为
```
predict
```
训练后的输出。

# Load the data
train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')

# Split features and value
# when trying to predict column "target" 
X_train, y_train = train.drop("target"), train["target"]
X_test, y_test = test.drop("target"), test["target"]

# Fit (i.e. train) model
reg = LinearRegression()
reg.fit(X_train, y_train)

# Predict
pred = reg.predict(X_test)

# Score
accuracy = reg.score(X_test, y_test)

Answer 2

请问 Skillsmuggler X_train 和 X_Test 如何定义它，因为当我尝试这样做时，它说 NameError: name 'X_train' is not Defined

Answer 3

我无法编辑几乎就在那里的第一个答案。但缺少一些代码...

# Load the data
train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')

y_train = train[:, :1]  #if y is only one column
X_train = train[:, 1:]

# Fit (train) model
reg = LinearRegression()
reg.fit(X_train, y_train)

# Predict
pred = reg.predict(X_test)

# Score
accuracy = reg.socre(X_test, y_test)

如何在不拆分数据帧的情况下传递不同的数据集进行训练和测试。（蟒蛇）？

问题描述投票：0回答：3

3个回答

最新问题

如何在不拆分数据帧的情况下传递不同的数据集进行训练和测试。 （蟒蛇）？

问题描述 投票：0回答：3

3个回答

最新问题

如何在不拆分数据帧的情况下传递不同的数据集进行训练和测试。（蟒蛇）？

问题描述投票：0回答：3