例如,我从excel导入的数据集看起来像这样,只有一列多行,并包含诸如姓名,电话和标题之类的重复信息:
表---------0名11个电话12标题13名称24个电话25标题26个名字37个电话38 title3
而且我想用3列名称,电话,标题建立一个表格并将该信息提取到此新表中。如:
名称电话标题名称1电话1标题1name2 phone2 title2
等等...我应该如何解决这个问题?我在Jupyter Notebook中使用Python。
您可以使用熊猫来创建基本表。定义每个变量,在这种情况下,使用字符串数组。然后使用pd.DataFrame为每列添加标题,然后分配值。
import pandas as pd
names = ('name1', 'name2')
phones = ('phone1', 'phone2')
titles = ('title1', 'title2')
example = pd.DataFrame({
"Names": names,
"Phones": phones,
"Titles": titles,
})
example
输出:
Names Phones Titles
0 name1 phone1 title1
1 name2 phone2 title2
这里是不使用熊猫的解决方案:
data = ['name1', 'phone1', 'title1', 'name2', 'phone2', 'title2']
print("Name Phone Title")
for name, phone, title in zip(*[iter(data)]*3):
print(name, phone, title)
结果
Name Phone Title
name1 phone1 title1
name2 phone2 title2