如何在R的输出中添加基因标题?

问题描述 投票:0回答:1

我有9个长度字符串和带有标题的较长字符串列表

示例数据:

String <- "ABCDEFGHI", "ACBDGHIEF"

文本文件中的数据包含“带有标题的较长字符串”,例如

>name
ABCDEFGHIJKLMNOPQRSTUVWXYX
>name1
TUVWXYACBDGHIEFXGHIJKLMIJK
>name2
ABFNOCDEPQRXYXGSTUVWHIMJKL

我使用library(stringr)定位每个字符串的位置。

R中的代码

loc <- str_locate(textfile,pattern = strings)
write.csv(loc, "locate.csv")

预期输出

字符串|找到较长字符串的来源

1 | 1-9 | name1

2 | 7-15 | name2

3 | NA | NA

问题

我想添加较长字符串的名称] >>“字符串”所在的位置?如何在R中执行此操作?我想要最后一列(在“预期结果”中以粗体显示)。

谢谢您的帮助

Venkata

我有9个长度字符串和带有标题的较长字符串列表示例数据:字符串名称...

r stringr
1个回答
0
投票

[这里是tidyverse的选项。使用readLines读取数据后,基于“标题”与“值”的出现,它是交替出现的,因此一种选择是将其与具有循环逻辑矢量(i1)的列或矢量分开,应用str_locate仅检查'value'('col2'),通过检查'locate'中是否存在row_number元素来创建NA列和'source_longer_string'

© www.soinside.com 2019 - 2024. All rights reserved.