如何从丑陋的数据行创建整洁的表?

问题描述 投票:0回答:2

例如,我从excel导入的数据集看起来像这样,只有一列多行,并包含诸如姓名,电话和标题之类的重复信息:

表---------0名11个电话12标题13名称24个电话25标题26个名字37个电话38 title3

而且我想用3列名称,电话,标题建立一个表格并将该信息提取到此新表中。如:

名称电话标题名称1电话1标题1name2 phone2 title2

等等...我应该如何解决这个问题?我在Jupyter Notebook中使用Python。

python data-manipulation
2个回答
0
投票

您可以使用熊猫来创建基本表。定义每个变量,在这种情况下,使用字符串数组。然后使用pd.DataFrame为每列添加标题,然后分配值。

import pandas as pd

names = ('name1', 'name2')
phones = ('phone1', 'phone2')
titles = ('title1', 'title2')

example = pd.DataFrame({
    "Names": names,
    "Phones": phones,
    "Titles": titles,
})
example

输出:

    Names   Phones  Titles
0   name1   phone1  title1
1   name2   phone2  title2

0
投票

这里是不使用熊猫的解决方案:

data = ['name1', 'phone1', 'title1', 'name2', 'phone2', 'title2']

print("Name Phone Title")
for name, phone, title in zip(*[iter(data)]*3):
  print(name, phone, title)

结果

Name Phone Title
name1 phone1 title1
name2 phone2 title2
© www.soinside.com 2019 - 2024. All rights reserved.