我试图使用下面的代码将一个Word表放入DataFrame中......。
def writejsontable(theDataFrame):
print(theDataFrame)
print('-----------')
for block in iter_block_items(doc):
tablestringarray = []
if isinstance(block, Table):
df = [['' for i in range(len(block.columns))] for j in range(len(block.rows))]
for i, row in enumerate(block.rows):
for j, cell in enumerate(row.cells):
df[i][j] = block.cell(i,j).text
writejsontable(df)
代码运行了,但当我去打印输出时,它是... ...
[['PERFORMANCE MEASURES', 'GO', 'NO-GO', 'N/A'], ['1. Put on Body Substance Isolation.', '', '', ''], ['2. Opened the airway used a manual maneuver.', '', '', '']]
数据框通常是这样打印的吗?我见过其他的例子,当你调用了一个 print
在他们身上。我不知道为什么我在调用时,没有得到那种漂亮而整洁的表格式结构。print
. 任何和所有的帮助是非常感激!
EDIT.我想用下面的代码把一个Word表放到DataFrame中..:
def iter_block_items(parent):
# Get parrent element
if isinstance(parent, Document):
parent_elm = parent.element.body
elif isinstance(parent, _Cell):
parent_elm = parent._tc
else:
raise ValueError("something's not right")
# Get children in parent element
for child in parent_elm.iterchildren():
if isinstance(child, CT_P):
yield Paragraph(child, parent)
elif isinstance(child, CT_Tbl):
yield Table(child, parent)
你的变量 df
目前是一个列表,而不是一个 pandas.DataFrame
你可以将数组转换成 df
纳入框架,使用 pandas.DataFrame(df)
# df = [['' for i in range(len(block.columns))] for j in range(len(block.rows))]
df= [['PERFORMANCE MEASURES', 'GO', 'NO-GO', 'N/A'],
['1. Put on Body Substance Isolation.', '', '', ''],
['2. Opened the airway used a manual maneuver.', '', '', '']]
writejsontable(pd.DataFrame(df))