如何从存储在.csv中的熊猫数据框中读取np矩阵?

问题描述 投票:0回答:1

我试图从.csv中的另一个熊猫数据帧存储中读取一个np.matrix和一个熊猫数据帧

我已经尝试使用文字评估,但它不起作用。

Etapa=pd.read_csv(f"data/etapas.csv",encoding="latin_1")
from ast import literal_eval
Etapa.loc[:,"Etapa"]=Etapa.Etapa.map(literal_eval)
Etapa.loc[:,"MatrizTiempos"]=Etapa.MatrizTiempos.apply(literal_eval)
Etapa.loc[:,"DataFrameEscuelas"]=Etapa.DataFrameEscuelas.map(literal_eval)

出现的错误是这样的:

文件“”,第1行[[0。 0. 0. 0.]^SyntaxError:语法无效

python pandas dataframe matrix np
1个回答
0
投票

现在,您具有语法不正确的list的字符串表示形式:

from ast import literal_eval

x = '[[0. 0. 0.], [1. 1. 1.]]'
literal_eval(x)
  File "<unknown>", line 1
    [0. 0. 0.]
         ^
SyntaxError: invalid syntax

我假设存在小数,因为可能会有浮点数:

from ast import literal_eval

x = '[[0. 0. 0.], [1. 1. 1.], [1.3 4.4 5.5]]'

literal_eval(''.join( # join back string fragments
    ', '.join(
        a.split(' ') # split on whitespace and join on commas
    ) for a in x.split(',')
))

[[0, 0, 0], [1, 1, 1], [1.3, 4.4, 5.5]]

将其转换为您的数据框实现:

import pandas as pd


def to_list(x):
    return literal_eval(''.join(', '.join(a.split(' ')) for a in x.split(',')))

mystr = '[[0. 0. 0.], [1. 1. 1.], [1.3 4.4 5.5]]'

df = pd.DataFrame([{0: x} for i in range(5)])

df[0]
0    [[0. 0. 0.], [1. 1. 1.], [1.3 4.4 5.5]]
1    [[0. 0. 0.], [1. 1. 1.], [1.3 4.4 5.5]]
2    [[0. 0. 0.], [1. 1. 1.], [1.3 4.4 5.5]]
3    [[0. 0. 0.], [1. 1. 1.], [1.3 4.4 5.5]]
4    [[0. 0. 0.], [1. 1. 1.], [1.3 4.4 5.5]]
Name: 0, dtype: object

# these are all string types
df[0][0]
'[[0. 0. 0.], [1. 1. 1.], [1.3 4.4 5.5]]'


df[1] = df[0].map(to_list)

# this is now a list type
df[1][0]
[[0.0, 0.0, 0.0], [1.0, 1.0, 1.0], [1.3, 4.4, 5.5]]
© www.soinside.com 2019 - 2024. All rights reserved.