我有一个包含临时 SNP ID 和等位基因的长文件,如下所示:
14_611646T,C
14_881226CT,C
14_861416.1GGC,GGCGCGCGCG
我想将每行的最后一个数字与字母分开(将 SNP ID 与等位基因分开)。所以看起来像这样:
14_611646 T,C
14_881226 CT,C
14_861416.1 GGC,GGCGCGCGCG
我尝试了 awk 和 sed,但是,下划线仍然出现问题。例如:
sed 's/^[0-9][0-9]*/& / File1 > File2
给了我
14 _611646T,C
14 _881226CT,C
14 _861416.1GGC,GGCGCGCGCGC
有人可以帮助我吗?
看:
$ sed -E 's/[0-9_.]+/& /' file
14_611646 T,C
14_881226 CT,C
14_861416.1 GGC,GGCGCGCGCG