我已经将一些混乱的数据加载到Pandas中,它最终成为一个长的一行Dataframe。
我希望能够重塑它,以便每第n列成为一个新行。有没有一种有效的方法呢?
(我认为我遇到的主要问题是我无法解决如何有效地编码行分隔符¬)
更新:
要创建类似数据的内容:
import numpy as np
import pandas as pd
zeroes = np.zeros(60000)
df = pd.DataFrame(zeroes)
df = df.T
df.head()
如果问题只是非标准行分隔符,请尝试:
pd.read_csv(..., lineterminator='¬')
否则,查看@IanS建议的数据样本会很有帮助
正如其他人所提到的,您可以通过正确解析数据(使用read_csv)轻松解决此问题。但是,下面的代码也应该有效(这与您在问题中寻找的内容一致)。如果df是您的数据框加载为一行。
n = 3
adf= pd.DataFrame(df.values.reshape(-1,n))
当然df.shape[1]%n == 0
,即单行df中的值的数量应该可以被n整除,以便重塑有效。