fasta 相关问题

FASTA是用于蛋白质和核酸的序列比对的软件包。 FASTA也是这些程序用来表示肽或核苷酸序列的文件格式的名称。该格式是生物信息学中事实上的标准。

如何从FASTA格式确定模式生物

所以我有这种fasta格式:例如> sp | A9X7L0 | ANMT_RUTGR邻氨基苯甲酸酯N-甲基转移酶OS =毛果芸香牛OX = 37565 PE = 1 SV = 1 MGSLSESHTQYKHGVEVEEDEEESYSRAMQLSMAIVLPMATQSAIQLGVFEIIAKAPGGR ...

回答 1 投票 0

通过对bash中的id行进行部分匹配来过滤多条目.fasta文件

我有一个.fasta文件,例如:> LTR22_Mio ERV2 Microtus ochrogaster tgtcacgccacctcctgcggagtctgcgtgatctctcacgtaggctgtggcacaagcttcaaggaagagt ...

回答 1 投票 0

将JSON解析为具有特定约束的fasta格式

我有一个类似如下的JSON {“条码”:{“ 0004F--0004R”:{“条形码UID”:“ 4”,“样品ID”:“ 10887581”,“对于条形码名称”:“ 0004F “,...

回答 1 投票 0

从文本文件中提取UNIQUE fasta序列

我有一个TXT文件:HISEQ1:105:C0A57ACXX:2:1101:10000:105587/1 HISEQ1:105:C0A57ACXX:2:1101:10000:105587/2 HISEQ1:105:C0A57ACXX:2:1101:10000: 121322/1 HISEQ1:105:C0A57ACXX:2:1101:10000:121322/2 ...

回答 1 投票 0

遍历以R为基础的.txt文件中的多个子字符串

我的任务是使用base R(无软件包)计算FASTA文件的GC内容。我的问题是我不知道如何在存储...

回答 1 投票 1

在不更改FASTA中的标题的情况下将'u'转换为't'

我试图弄清楚如何在不破坏标头的情况下将混合的DNA / RNA multifasta变成仅DNA的格式。我的知识以sed's / u / t / g'结尾,但这显然会影响标头。...

回答 1 投票 0

我需要改进一种功能,可以解析多个fasta文件,并通过try execpt处理检查压缩情况

[伙计们,我正在使用巨大的gz压缩fasta文件,并且我有一个不错的fasta解析器,但我想使它更通用,以检查压缩的方式来解析gz或非gz ...

回答 1 投票 0

Perl搜索并替换,直到对多行进行正向查找-不能按预期工作?

这里的总体目标是删除以特定字符串开头并以正向超前结尾的文本块。根据我所做的测试,似乎换行符引起了问题,...

回答 2 投票 1

下载Fasta文件并将其写入文本文件

我正在使用此代码从pdb网站下载fasta序列文件。 pdb id是字符串protid。导入java.io. *;导入java.net.URL;导入java.util.Scanner;公共类...

回答 3 投票 0

查找在同一行上出现多次模式的文件

我有一个fasta格式的文件,如下例所示。我要从以下序列中的文件中提取条目:“ CGTACG”出现多次。 > seq1 AAATTCCGTACGGGCCTCT> seq2 ...

回答 1 投票 0

在Fasta文件中的标题中添加序列长度

我有一个multifasta文件,想通过保留序列将序列长度添加到标题中。 > Seq1 MADKLTRIAIVNHDKCKPKKCRQECKKSCPVVRMGKLCIEVTPQSKIAWISETLCIGCGI ...

回答 1 投票 2

从文件中提取特定范围的Fasta序列

我正在尝试从特定范围提取序列。我使用的命令只能在afast序列awk中提取前n行“ / ^> / {n ++} n> 2000 {exit} {print}” Name.faa> ...

回答 1 投票 0

如何使用fasta文件而不是biopython中的蛋白质序列字符串创建多个序列比对

我希望能够使用与脚本相同的目录中下载的文件编写多个序列比对。但是,在《 Biopython Cookbook》中,显示此内容的唯一方法是通过编写...

回答 1 投票 0

优化python字典创建以计算子字符串出现次数

该函数接收包含数千行和K值的文件名。该函数必须将文件的每一行划分为K个序列,并创建一个字典,其中的序列为...

回答 1 投票 2

尝试读取FASTA格式的文件,然后再写入Genbank格式的另一个文件

[尝试使用BioPython中的Seq和SeqIO对象读取包含基因组序列的文件。无法使用open命令。程序应接受包含...

回答 1 投票 0

将重复的序列删除到fasta文件(大文件)中

您好,我有一个巨大的Fasta文件,例如:> sequence1_CP [seq病毒] MQCKSGTNNVFTAIKYTTNNNIIYKSENNDNIIFTKNIFNVVTTKDAFIFSKNRGIMNL DITKKFDYHEHRPKLCVFKIINTQYVNSPEKMIDAWPTMDIVALITE> ...

回答 1 投票 0

使用python查找fasta文件中包含“ ELVIS”的基因数量;还输出所有具有ELVIS基序的基因的HSA ID号

我需要在一个包含100多个蛋白质序列的fasta文件中搜索主题“ ELVIS”。我需要计算多少蛋白质具有“ ELVIS”并输出特定的HSA ID号,......>

回答 1 投票 0

删除重复的fasta序列(biopython方法的重击)

您好,我有一个Fasta文件,例如:> sequence1_CP [seq病毒] MQCKSGTNNVFTAIKYTTNNNIIYKSENNDNIIFTKNIFNVVTTKDAFIFSKNRGIMNL DITKKFDYHEHRPKLCVFKIINTQYVNSPEKMIDAWPTMDIVALITE> sequence2 [[病毒]

回答 3 投票 0

如何在特定行的末尾剪切20个字符,同时在bash中保持输出中的所有其他行不变[关闭]

所以我有一个看起来像这样的FASTA文件,我将其分成2行\> H.Sapiens.1M.Illumina.low.000000000 / 1 CTCCTTGCCTCATCCTCCCAAATAGCATGCACCACCACGCGCAGAGTATAT \> H.Sapiens.1M ....

回答 2 投票 1

读取用户输入的.fasta文件并使用Biopython进行解析?

我正在尝试创建一个python脚本,用户可以在其中键入自己的FASTA文件,然后将使用Biopython对该文件进行解析。我正在努力使它起作用。到目前为止,我的脚本是...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.