如何删除每行可变数字之前和之后的所有内容?

问题描述 投票:0回答:2

我需要重命名文件中的所有序列头。

标题以这种格式开始:

\>D915_04184 transcript=D915_04184 gene=D915_04184

之后,它们应只包含以下格式的序列ID:

D915_04184

而且我需要对文件中的每个序列执行此操作。

我一直在尝试使用sed之类的方法>]

sed 's/'>D915' 'transcript=' 'gene='/D915/g' file_Name >new_file_name

但是那没有用。我也曾尝试做grep -o,但似乎根本没有做任何事情。

[很多时候,我总是从一开始就把>排除在外,但似乎无法摆脱其他任何东西。 04184需要保留,并且每一行上的数字都不相同。 >D915是一致的。

我需要重命名文件中的所有序列头。标头以以下格式开始:\> D915_04184 transcript = D915_04184 gene = D915_04184之后,它们应只包含序列ID ...

sed replace bioinformatics
2个回答
0
投票

这应该起作用:


0
投票

请尝试以下方法:

© www.soinside.com 2019 - 2024. All rights reserved.