Python: 字表到数据框架

问题描述 投票:0回答:1

我试图使用下面的代码将一个Word表放入DataFrame中......。

def writejsontable(theDataFrame):
    print(theDataFrame)
    print('-----------')

for block in iter_block_items(doc):
    tablestringarray = []
    if isinstance(block, Table):
        df = [['' for i in range(len(block.columns))] for j in range(len(block.rows))]
        for i, row in enumerate(block.rows):
            for j, cell in enumerate(row.cells):
                df[i][j] = block.cell(i,j).text
        writejsontable(df)

代码运行了,但当我去打印输出时,它是... ...

[['PERFORMANCE MEASURES', 'GO', 'NO-GO', 'N/A'], ['1. Put on Body Substance Isolation.', '', '', ''], ['2. Opened the airway used a manual maneuver.', '', '', '']]

数据框通常是这样打印的吗?我见过其他的例子,当你调用了一个 print 在他们身上。我不知道为什么我在调用时,没有得到那种漂亮而整洁的表格式结构。print. 任何和所有的帮助是非常感激!

EDIT.我想用下面的代码把一个Word表放到DataFrame中..:

def iter_block_items(parent):
    # Get parrent element
    if isinstance(parent, Document):
        parent_elm = parent.element.body
    elif isinstance(parent, _Cell):
        parent_elm = parent._tc
    else:
        raise ValueError("something's not right")
    # Get children in parent element
    for child in parent_elm.iterchildren():
        if isinstance(child, CT_P):
            yield Paragraph(child, parent)
        elif isinstance(child, CT_Tbl):
            yield Table(child, parent)
python pandas dataframe docx
1个回答
1
投票

你的变量 df 目前是一个列表,而不是一个 pandas.DataFrame 你可以将数组转换成 df 纳入框架,使用 pandas.DataFrame(df)

# df = [['' for i in range(len(block.columns))] for j in range(len(block.rows))]
df= [['PERFORMANCE MEASURES', 'GO', 'NO-GO', 'N/A'],
     ['1. Put on Body Substance Isolation.', '', '', ''],
     ['2. Opened the airway used a manual maneuver.', '', '', '']]

writejsontable(pd.DataFrame(df))
© www.soinside.com 2019 - 2024. All rights reserved.