FASTA是用于蛋白质和核酸的序列比对的软件包。 FASTA也是这些程序用来表示肽或核苷酸序列的文件格式的名称。该格式是生物信息学中事实上的标准。
我在Bash脚本中还很陌生,我有一个要解决的问题。我有一个看起来像这样的文件:> atac ATTGGCAATTAAATTCTTTT> lipa ATTACCAAGTAAATTCTTTT。 。 。每个偶数行都有...
我需要帮助。我有一个Fasta文件,例如:> YP_00698.1假定蛋白sp [物种1] MDMQFGYFTRNPSTKYPATLYPREVSCALYEDDNENTSLIPKSRHYHYTIQPPINYKKLTNVDRYKNFRL> YP_0098.1假定...
我如何编写脚本来汇总来自多个Fasta文件的信息,而不使用biopython?
我有一个生物信息学课程的作业,该课程要求python脚本对其中包含多个蛋白质序列的FASTA文件执行以下操作:-打开用户指定的.fasta文件...
im试图将.fasta文件作为字典读取,并分别提取标题和序列。文件中有多个标题和序列。下面的例子。标头= CMP12序列= ...
将JSON处理为Fasta,将Python代码转换为Groovy
我有一个配置文件,看起来像这样:{“ codes”:{“ 0004F--0004R”:{“ Forward code Name”:“ 0004F”,“ Forward code Info”:“ xxxyyy4”,“ Rev code Name “:...
因此,我一般来说对C ++和程序设计还是相当陌生的,我试图弄清楚如何在自己的程序中使用该github程序中的代码。如何编写调用程序的函数...
我写一个脚本,可以取代所有的氨基酸残基的实例在FASTA对准文件的列。使用AlignIO,我只是可以读取校准文件,并提取信息...
我有以下代码读出与10个基因序列的FASTA文件,并返回每个序列的矩阵。然而,代码似乎缺少在最后序列,我不知道为什么?文件= ...
我在文件中有以下序列文本,每个标题以“>”开头,内容行数是随机的> XM_024446048.1预测:智人甘露糖苷酶α类2A成员1(MAN2A1),...
如何使用bash脚本从一个FASTA文件中计算不同蛋白质的氨基酸频率?
我如何编写一个脚本,可以计算不同蛋白质的氨基酸频率,这些文件在一个文件中?例如:Fasta文件是> Protein1 info ATCGGGCTGC> Protein2 info ...
直接在for循环中调用SeqIO.parse(),但事先单独使用它不行吗?为什么?
在python这个代码,我直接调用函数SeqIO.parse(),运行正常:从Bio import SeqIO a = SeqIO.parse(“a.fasta”,“fasta”)记录= list(a)for seqIO中的asq .parse(“a.fasta”,“...
我有一个“source.fasta”文件,其中包含以下格式的信息:> TRINITY_DN80_c0_g1_i1 len = 723 path = [700:0-350 1417:351-368 1045:369-722] [-1,700,1417,1045 ,-2] ......
grep:使用while循环时重复次数无效[duplicate]
所以我使用MacOS命令行并有两个文件文件A.txt ABF文件B.txt> A abcde> B efghi> C jklmn> D opqrs> E tuvwx> F yz123我希望它通过一个while循环.. 。
我有一个fasta文件input.fa,如下所示:> KJH325_Org_name_strain ANNTTHWQLPMCVREEDFSC> IJA254.1_Org_name HITYYPQLKSSCMART> ASDL658_Org_name_str TTILPQWYERSAASMNCFGHDKLCC等等....
我有一个有几百条记录的fasta文件,但我正在尝试返回一个只包含前20条记录的表(记录描述,AA长度和名称)。我的代码没有用,我会...
我有这个DNA字符串集,但我想创建一个包含此信息的新file.fa。什么是保存这些的有效方法?我试过使用write.fasta但它崩溃了。 genes_seq
我有成千上万的文件,这是一个序列名列表,后面是序列,每行一个,如下所示:L.abdalai.LJAMM.14363.SanMartindeLosAndes ...
我需要最简单的解决方案来转换包含多个核苷酸序列的fasta.txt,例如> seq1 TAGATTCTGAGTTATCTCTTGCATTAGCAGGTCATCCTGGTCAAACCGCTACTGTTCCGG ...