我需要重命名文件中的所有序列头。
标题以这种格式开始:
\>D915_04184 transcript=D915_04184 gene=D915_04184
之后,它们应只包含以下格式的序列ID:
D915_04184
而且我需要对文件中的每个序列执行此操作。
我一直在尝试使用sed之类的方法>]
sed 's/'>D915' 'transcript=' 'gene='/D915/g' file_Name >new_file_name
但是那没有用。我也曾尝试做
grep -o
,但似乎根本没有做任何事情。
[很多时候,我总是从一开始就把>
排除在外,但似乎无法摆脱其他任何东西。 04184
需要保留,并且每一行上的数字都不相同。 >D915
是一致的。
我需要重命名文件中的所有序列头。标头以以下格式开始:\> D915_04184 transcript = D915_04184 gene = D915_04184之后,它们应只包含序列ID ...
这应该起作用:
请尝试以下方法: