将镶木地板文件转换为pandas然后查询会出错

问题描述 投票:0回答:1

我正在尝试查询数据帧的平均值,并将镶木地板文件转换为pandas来执行此操作。我收到错误TypeError('无法将%s转换为数字'%str(x)),这似乎引用了列中的“年龄”一词。

数据框如下所示:

         _c0     _c1  _c2    
    0  RecId   Class  Age   
    1      1    1st    29   
    2      2    1st     2   
    3      3    1st    30 

我的代码是:

    import pyarrow 
    import pandas
    import pyarrow.parquet as pq

    df = pq.read_table("file.parquet").to_pandas()
    average_age = df["_c2"].mean()

我试过用

    df = df(skiprows=1)

但是这会给出错误“TypeError:'DataFrame'对象不可调用”

如何跳过包含“Age”的行或删除它,这是否与从镶木地板文件中读取有关或者这是一个直接的Pandas问题?

python pandas parquet
1个回答
1
投票

您可以使用pandas索引删除第一行:

df = df.iloc[1:,:]
© www.soinside.com 2019 - 2024. All rights reserved.