从matchPattern中提取值

问题描述 投票:0回答:1

我正在使用matchPattern程序包中的Biostrings功能在基因组中查找特定序列。一旦找到,我想显示和匹配实例之间的间隔的频率分布。

示例:运行以下代码

Match1 <- matchPattern(ResEnz, genome$chr1)
Match1

将返回此:

Views on a 248956422-letter DNAString subject
subject: NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN...NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
views:
            start       end width
    [1]     27974     27979     6 [GAATTC]
    [2]     29889     29894     6 [GAATTC]
    [3]     32212     32217     6 [GAATTC]
    [4]     36941     36946     6 [GAATTC]
    [5]     49920     49925     6 [GAATTC]
    ...       ...       ...   ... ...
[67137] 248927762 248927767     6 [GAATTC]
[67138] 248928956 248928961     6 [GAATTC]
[67139] 248929077 248929082     6 [GAATTC]
[67140] 248932486 248932491     6 [GAATTC]
[67141] 248941974 248941979     6 [GAATTC]

现在,我想使用此数据形成一个向量,该向量将在一个条目的端点和下一个条目的起点之间具有差异。 (忽略第一个起点和最后一个终点)

即,用于Match1

1910, 2318, 4724, 12974 .... 9483 

生成的Match1对象属于XStringViews类,names函数返回NA,而我目前对此感到困惑。请帮助。

r bioconductor genetics
1个回答
0
投票

[通过进一步研究,我发现函数start(Match1)end(Match1)将产生包含感兴趣值的向量。如果有人遇到相同问题,我将在此保留。

© www.soinside.com 2019 - 2024. All rights reserved.