搜索特定模式并删除Python中一行中的模式[复制]

问题描述 投票:0回答:2

这个问题在这里已有答案:

我在每行的开头都有特定的模式。我想删除该特定模式而不是python中的完整行。从实际文件中检索后,我的数据看起来像

>homo_seg-Val-abc-1-1
>homo_seg-Beg-cdf-2-1
>homo_seg-Try-gfh-3-2
>homo_seg-Fuss-cdh-3-1

在这里,我想从数据集中删除“> homo_seg-”并仅保留以下内容

Val-abc-1-1
Beg-cdf-2-1
Try-gfh-3-2
Fuss-cdh-3-1

我可以在perl中做到这一点

$new =~s/homo_seg-//g;

我的代码是:

import sys
inFile = sys.argv[1]
with open(inFile) as fasta:
    for line in fasta:
        if line.startswith('>'):
            header = line.split()
            t = header[0]

        import re  # from below answer

        regex = r">homo_seg-"

        subst = ""

        result = re.sub(regex, subst, t, 0, re.MULTILINE)
        print(result)

这段代码只给出了最后一行的输出。我知道它有一些小错误但无法接收它。

python pattern-matching str-replace
2个回答
0
投票

试试这个:

new_line = old_line[9:]

或者如果你想要更加安全:

if old_line.startswith('homo_seg-') :
    new_line = old_line[9:]

0
投票

你可以查看https://regex101.com/r/hvFquS/1

 import re

 regex = r"homo_seg-"

 test_str = ("homo_seg-Val-abc-1-1\n"
    "homo_seg-Beg-cdf-2-1\n"
    "homo_seg-Try-gfh-3-2\n"
    "homo_seg-Fuss-cdh-3-1")

 subst = ""

 result = re.sub(regex, subst, test_str, 0, re.MULTILINE)

 if result:
     print (result)
© www.soinside.com 2019 - 2024. All rights reserved.