使用条件语句将 Fasta 名称更改为标识符值;由于长度不等导致的错误

问题描述 投票:0回答:1

我对 R 比较陌生,想将它用于群体遗传学课程。我已经成功编写了一个脚本,通过登录号从 GenBank 中提取 Fasta 文件,但是,DNA 序列的名称是登录号(对进一步分析没有用),我想将它们更改为标识符列中的值。我知道这可能是一个不寻常的请求,感谢您的帮助。看来这应该是一个微不足道的问题。

我尝试了很多解决方案,认为最合理的是一个条件语句,其中如果在原始数据中找到任何fastas的名称(目前无法描述的登录号),则将标识符列粘贴为新名称。我尝试在这里对代码进行表示:enter image description here。这会引发错误,因为所比较的值具有不同的长度。我真正想做的是:找到当前名称与原始值匹配,然后粘贴相应的 ID 列值作为 Fastas 的新名称。

非常感谢任何帮助!

paste fasta names
1个回答
0
投票

此问题已解决。这可能不是最简单的方法,但我只用 ID 和登录号列为每个基因重新制作了数据框,读入 fasta,然后覆盖 fasta 的名称,并用更新的名称覆盖原始 fasta。您可能需要 agenet 和 ape 软件包来完成其中一些转换。我将在这里发布我的原始代码的屏幕截图作为其他人的示例:enter image description here

© www.soinside.com 2019 - 2024. All rights reserved.