我正在尝试遵循python的回归教程,因为stats模型包似乎对我不起作用。所以我得到了这个,直到我收到属性错误。
输入:
import pandas as pd
data = pd.read_csv("China_FDIGDP.csv")
data1 = data.dropna()
data1.to_csv("data1.csv", index = False)
Data = pd.read_csv("data1.csv")
print(Data)
x = pd.Data["GDP"].values()
y = pd.Data["FDI_net_in"].values()
这是输出:
Traceback (most recent call last): File "FDI.py", line 20, in <module> x = pd.Data["GDP"].values() AttributeError: module 'pandas' has no attribute 'Data'
我究竟做错了什么?
Date FDI_net_in GDP
0 1982 4.300000e+08 2.050897e+11
1 1983 6.360000e+08 2.306867e+11
2 1984 1.258000e+09 2.599465e+11
3 1985 1.659000e+09 3.094880e+11
4 1986 1.875000e+09 3.007581e+11
Index(['Date', 'FDI_net_in', 'GDP '], dtype='object')
试试这个
Data.columns = Data.columns.str.strip(' ') # remove tab spaces in column names
x = Data["GDP"].values
y = Data["FDI_net_in"].values
错误来自这些行
x = pd.Data["GDP"].values()
y = pd.Data["FDI_net_in"].values()
你已经阅读了像Data = pd.read_csv("data1.csv")
这样的数据框,所以为了从中获取GDP
列,你只需要像这样访问它:
x = Data["GDP"].values
y = Data["FDI_net_in"].values
如果您的文件名是pandas.py
或pd.py
,则更改文件名,因为它可能会导致pandas库出现一些错误。