我正在尝试查询数据帧的平均值,并将镶木地板文件转换为pandas来执行此操作。我收到错误TypeError('无法将%s转换为数字'%str(x)),这似乎引用了列中的“年龄”一词。
数据框如下所示:
_c0 _c1 _c2
0 RecId Class Age
1 1 1st 29
2 2 1st 2
3 3 1st 30
我的代码是:
import pyarrow
import pandas
import pyarrow.parquet as pq
df = pq.read_table("file.parquet").to_pandas()
average_age = df["_c2"].mean()
我试过用
df = df(skiprows=1)
但是这会给出错误“TypeError:'DataFrame'对象不可调用”
如何跳过包含“Age”的行或删除它,这是否与从镶木地板文件中读取有关或者这是一个直接的Pandas问题?
您可以使用pandas索引删除第一行:
df = df.iloc[1:,:]