将数字与字母分开

Question

我有一个包含临时 SNP ID 和等位基因的长文件，如下所示：

14_611646T,C
14_881226CT,C
14_861416.1GGC,GGCGCGCGCG

我想将每行的最后一个数字与字母分开（将 SNP ID 与等位基因分开）。所以看起来像这样：

14_611646 T,C
14_881226 CT,C
14_861416.1 GGC,GGCGCGCGCG

我尝试了 awk 和 sed，但是，下划线仍然出现问题。例如：

sed 's/^[0-9][0-9]*/& / File1 > File2

给了我

14 _611646T,C
14 _881226CT,C
14 _861416.1GGC,GGCGCGCGCGC

有人可以帮助我吗？

Answer 1

看：

$ sed -E 's/[0-9_.]+/& /' file
14_611646 T,C
14_881226 CT,C
14_861416.1 GGC,GGCGCGCGCG