将某些列转换为一个列，每个循环中没有标准列数

Question

我有一本字典：

#file1 mentions 2 columns while file2 mentions 3
dict2 = ({'file1' : ['colA', 'colB'],'file2' : ['colY','colS','colX'], etc..})

我想在每个文件的新列中对所提到的列进行串联。这应该是自动化的。

for k, v in dict1.items():
    df = pd.DataFrame.from_records(data=arcpy.da.SearchCursor(k, v)) #reads to a df
    df['new'] = df['first_col'].astype(str) + df['second_col'] etc.. #concatenation

如何每次都能完成这项工作，与每个字典中的列数无关？

只需连接所有提到的列。

例：

a = {'colA' : [123,124,112,165],'colB' :['alpha','beta','gamma','delta']}
file1 = pd.DataFrame(data = a)
file1

colA   colB
123    alpha
124    beta
112    gamma
165    delta

b = {'colY' : [123,124,112,165],'colS' :['alpha','beta','gamma','delta'], 'colX' :[323,326,378,399] }
file2 = pd.DataFrame(data = b)
file2

colY  colS      colX
123   alpha     323
124   beta      326
112   gamma     378
165   delta     399

结果：

填写1

col_all
123 alpha
124 beta
112 gamma
165 delta

文件2

call_all
123 alpha 323
124 beta  326
112 gamma 378
165 delta 399

Answer 1

我相信你需要改变：

df['new'] = df['first_col'].astype(str) + df['second_col']

将所有列转换为字符串，然后使用join和apply将它们axis=1进行处理：

df['new'] = df.astype(str).apply(' '.join, axis=1)

将某些列转换为一个列，每个循环中没有标准列数

问题描述投票：1回答：1

1个回答

最新问题

将某些列转换为一个列，每个循环中没有标准列数

问题描述 投票：1回答：1

1个回答

最新问题

问题描述投票：1回答：1