如何用熊猫拆分DataFrame中的列?

问题描述 投票:0回答:2

我导入了一个数据集,如下所示。

Peak, Trough
0   1857-06-01, 1858-12-01
1   1860-10-01, 1861-06-01
2   1865-04-01, 1867-12-01
3   1869-06-01, 1870-12-01
4   1873-10-01, 1879-03-01
5   1882-03-01, 1885-05-01
6   1887-03-01, 1888-04-01

它是CSV文件。但是,当我检查.shape时,它是

(7, 1)

我以为CSV文件可以自动用逗号分隔,但是该文件不起作用。

我想将此列分为两部分,用逗号分隔,还要列出各列的名称。我该怎么办?

python pandas time-series
2个回答
1
投票

在read_csv中使用'sep'标记

就像:

df = read_csv(path, sep = ', ')

0
投票

与文本文件或csv相同的数据,然后将read_csv与参数read_csvskipinitialspace=True一起使用,以将值转换为日期时间:

parse_dates

如果数据在一列中处于excel中,则可以在第一列中使用df = pd.read_csv('data.txt', skipinitialspace=True, parse_dates=[0,1]) print (df.head()) Peak Trough 0 1857-06-01 1858-12-01 1 1860-10-01 1861-06-01 2 1865-04-01 1867-12-01 3 1869-06-01 1870-12-01 4 1873-10-01 1879-03-01 print (df.dtypes) Peak datetime64[ns] Trough datetime64[ns] dtype: object ,转换为日期时间并最后设置新的列名称:

Series.str.split
© www.soinside.com 2019 - 2024. All rights reserved.