下面的代码用NUMB代码替换数字:
raw_corpus.loc[:,'constructed_recipe']=raw_corpus['constructed_recipe'].str.replace('\d+','NUMB')
如果数字前面有空格而后面有空格,它可以正常工作,但如果数字包含在另一个字符串中则会产生问题。
如果数字被两边的空格包围,我如何修改代码以便它只用NUMB替换数字?例如不要修改此字符串:“来自url 500px”,但请修改此字符串:“洗碗机10个pods”到“洗碗机NUMB pods”。
我不确定如何修改'\ d +'来实现这一点。有任何想法吗?
只需修复你的空间正则表达式:
\s\d+\s
或任何单词边界:
\b\d+\b
我也试过' \d+ '
,这有效!可能不是“pythonic”虽然......