我有两个不同的数据帧df和df2,我想循环遍历df的每一行以搜索df2中特定行内的某些匹配,并为每个匹配返回一个txt文件。
DF =
name Tec Location
jhon js sr nz
mark python ssr us
alan java jr mx
DF2 =
company job Country Index
company a js jr uk 1
company b python ssr us 2
company c java jr mx 3
到目前为止,我一直在做以下事情:
for index, row in df.iterrows():
for indexb, rowb in df2.iterrows():
if str(row.Tec) in str(rowb.job) and str(row.Location) in rowb.Country:
print ('Match with ' + str(rowb.company))
sys.stdout= open(r'path\to\file\%s.txt'%(row['name']+ str(rowb.Index),), 'w')
else:
pass
我不断收到错误匹配的文本文件,或者在所有输出txt文件中重复df2的第一行。我想比较Tec与工作和位置对国家。例如,此案例的输出为:mark 2.txt,其中文件包含文本“与公司b匹配”
任何的想法 ?
迭代行不是使用Pandas DataFrames的首选方式。
您可能想尝试加入df和df2。然后应用过滤器将要保存的行保存到csv中。
df = pd.DataFrame([['jhon', 'js sr', 'nz'], ['mark', 'python ssr', 'us'], ['alan', 'java jr', 'mx']], columns=['name', 'Tec', 'Location'])
df2 = pd.DataFrame([['company a', 'js jr', 'uk'], ['company b', 'python ssr', 'us'], ['company c', 'java jr', 'mx']], columns=['company', 'job', 'Country'])
# Merge the two dataframes
df3 = df.merge(df2, how='right', left_on=['Tec', 'Location'], right_on=['job', 'Country'])
df3 = df3[df3['name'].notnull()]
df3['name'].to_csv('output.csv')