如何在保留空格的同时删除包含字符串的系列中的非字母数字(英文)字符?

问题描述 投票:-1回答:1

目前,我有:

[re.sub(r'\W', '', i) for i in training_data.loc[:, 'Text']]

然而,有了这个,印地语字符仍然存在,所有空格都被删除。有任何想法吗?

python pandas nlp
1个回答
0
投票

否定可能会有所帮助

import re
import string    

re.sub(f'[^{string.printable}]', '', 'asdf #$שדגכ')
© www.soinside.com 2019 - 2024. All rights reserved.