我导入了一个数据集,如下所示。
Peak, Trough
0 1857-06-01, 1858-12-01
1 1860-10-01, 1861-06-01
2 1865-04-01, 1867-12-01
3 1869-06-01, 1870-12-01
4 1873-10-01, 1879-03-01
5 1882-03-01, 1885-05-01
6 1887-03-01, 1888-04-01
它是CSV文件。但是,当我检查.shape
时,它是
(7, 1)
我以为CSV文件可以自动用逗号分隔,但是该文件不起作用。
我想将此列分为两部分,用逗号分隔,还要列出各列的名称。我该怎么办?
在read_csv中使用'sep'标记
就像:
df = read_csv(path, sep = ', ')
与文本文件或csv相同的数据,然后将read_csv
与参数read_csv
和skipinitialspace=True
一起使用,以将值转换为日期时间:
parse_dates
如果数据在一列中处于excel中,则可以在第一列中使用df = pd.read_csv('data.txt', skipinitialspace=True, parse_dates=[0,1])
print (df.head())
Peak Trough
0 1857-06-01 1858-12-01
1 1860-10-01 1861-06-01
2 1865-04-01 1867-12-01
3 1869-06-01 1870-12-01
4 1873-10-01 1879-03-01
print (df.dtypes)
Peak datetime64[ns]
Trough datetime64[ns]
dtype: object
,转换为日期时间并最后设置新的列名称:
Series.str.split