Pandas dataframe .at ValueError:无法将字符串转换为float

问题描述 投票:0回答:1

我正在尝试为数据框中已包含某些信息的特定单元格填充值。当我用小数据测试它时,它可以工作,但是在我的项目中,它抛出“ ValueError:无法将字符串转换为浮点数”

# df : a dataframe with data to be extracted and added to another dataframe data

some_list = df.iloc[:, 0].values
values = df.iloc[:, 1].values

indexList = data.index.values.tolist()

index = 0
for x in some_list:
    s = values[index]
    if x in indexList:
        # this line raised ValueError : cannot convert __(values in s)__ from string to float
        data.at[x, 'Some Column'] = s
    index += 1

some_list中的元素,值是字符串。这里现有的数据帧是数据,其中一列是'Some Column',索引标签是some_list中的某些元素(因此,如果some_list中的当前元素x是索引标签之一,则在单元格上设置值(行:索引标签x,列:“某些列”)的值[找到此x的同一行]

在“ Some Column”下的单元格中填写之前,应为NaN

一个小示例,我尝试使用(没有引发valueError)测试.at函数:

column=['Year', 'first', 'second', 'third']
s = 'label1'
data = pd.DataFrame(columns=column)
row = pd.Series({'Year' : 2019, 'first' : 'asa', 'second' : 'awdqw'}, name=s)
data = data.append(row)


# Creates a pandas DataFrame. 
data_snip = {'name':['A', 'B', 'C', 'D'], 'y':[1, 2, 3, 4]} 
df = pd.DataFrame(data_snip, index =['one', 'two', 'three', 'four'])
df_array = df.iloc[:, 0].values
s = df_array[3] # should be 'D'

s = 'label3'
row = pd.Series({'Year' : 2030, 'first' : 'ubeubf', 'second' : 'qov.z'}, name=s)
data = data.append(row)
data.at['label3', 'third'] = s

这就是数据的样子:

        Year   first second third
label1  2019     asa  awdqw   NaN
label3  2030  ubeubf  qov.z     D

任何帮助将不胜感激!

python pandas dataframe
1个回答
2
投票

检查df.dtypes-您的错误是由于您试图将string对象打包到具有dtype浮点数的列而引起的。 .at[]不自动转换列类型。

string分配给单元格之前,请确保其为object dtype:

import pandas as pd

import numpy as np

df=pd.DataFrame(data={"x": list("abc"), "y": [1,2,3], "z": [np.nan for i in range(3)]}, index=["p", "q", "r"])

print(df)
#this works fine:
df.at["r", "z"]=4.5

print(df)
#without the line below it will fail:
df["z"]=df["z"].astype(str)
df.at["q", "z"]="z"
© www.soinside.com 2019 - 2024. All rights reserved.