fasta 相关问题

FASTA是用于蛋白质和核酸的序列比对的软件包。 FASTA也是这些程序用来表示肽或核苷酸序列的文件格式的名称。该格式是生物信息学中事实上的标准。

我该如何计算字母的频率

我有这样的数据> sp | Q96A73 | P33MX_HUMAN推定的单加氧酶p33MONOX OS = Homo sapiens OX = 9606 GN = KIAA1191 PE = 1 SV = 1 ...

回答 4 投票 1

使用python的子串multifasta文件

我试图从位置2到8的multifasta文件中提取序列(microRNA的种子)。为此,我编写了一个小的python脚本。该脚本有效,但我无法编写输出文件....

回答 2 投票 0

Multifasta标题修剪

我有一个multifasta文件,我需要删除每个fasta文件的标题的一些部分。例如:> Viridibacillus_arenosi_FSL_R5_0213-BK137_RS04360-22-CBS_domain-containing_protein

回答 2 投票 -2

在Python中连接两个fasta文件

我有两个数据文件(FASTA),每个文件代表一个基因,序列由物种和本地识别。我想将这些文件连接成一个例子:psbki.fas:> ...

回答 1 投票 0

如何使用python获取fasta文件中重复序列的计数

我有一个这样的固定文件:test_fasta.fasta> XXKHH_1 AAAAATTTCTGGGCCCC> YYYXXKHH_1 TTAAAAATTTCTGGGCCCCGGGAAAAAA> TTDTT_11 TTTGGGAATTAAACCCT> ID_2SS TTTGGGAATTAAACCCT ...

回答 1 投票 1

有没有办法替换所有出现的某些字符,但仅限于每第n行?

我试图用fasta文件的序列部分中的N替换所有不是C,T,A或G的字符 - 即每隔一行我认为awk和tr的某些组合是我需要的...... ...

回答 3 投票 2

从FASTA文件中,仅提取具有指定分类的条目

我想提取来自人类分类法的fasta文件的所有条目,并将这些条目转换为新的较小的fasta文件。我正在尝试使用R,但我不知道该怎么做。两个......

回答 1 投票 0

如何使用嵌套循环,循环遍历数组元素?

来自R background,我想在python中尝试嵌套for循环。我在下面的代码中循环遍历每个类型的迭代时遇到问题。我的代码适用于类型[0],但不适用于连续...

回答 2 投票 0

使用条件匹配一行中的多个模式

我有一个这样的fasta文件:myfasta.fasta> 1_CDS AAAAATTTCTGGGCCCCGGGGG AAATTATTA> 2_CDS TTAAAAATTTCTGGGCCCCGGGAAAAAA> 3_CDS TTTGGGAATTAAACCCT> 4_CDS TTTGGGAATTAAACCCT> 5_rRNA ...

回答 3 投票 4

使用python对fasta序列的顺序进行排序

我有一个fasta文件(由>标题和序列行组成)如下:myfasta> S.sclerotiorum_Ch16_153_209 AACCCTAACCCTAACCCTTGATTGATTGATTGATTGATTGAT TGATTGATGAAATTATAGTCTCCGTAAAGCAAATAAAGCATT ...

回答 1 投票 1

将FASTA转换为GenBank

有没有办法使用BioPython将FASTA文件转换为Genbank格式?关于如何从Genbank转换为FASTA的答案有很多,但不是相反。

回答 1 投票 3

从文件名,重叠群标识符和序列长度创建数据帧

我试图从fasta文件创建一个数据框,其中包含一个标题(重叠群的名称)和一个DNA序列。在我的数据框的第一列中,我想要文件的名称,...

回答 1 投票 2

提取多个列并在其间添加空字符

我有一个格式如下的文件:TRINITY_DN119001_c0_g1_i1 4 * 0 0 * * 0 0 GAGCCTCCCTCATGAATGTACCAGCATTTACCTCATAAAGAGCT * XO:Z:NM TRINITY_DN119037_c0_g1_i1 4 * ...

回答 2 投票 1

根据.csv重命名fasta-header的部分

我想用一个包含.tsv部分的列表来更改我的fasta标题的部分内容。我不是一名生物信息学家,只是一名具有bash和python初学技能的微生物学家。谢谢你的帮助。示例:...

回答 4 投票 0

如何使用python获取具有条件的序列计数(在fasta中)?

我有一个fasta文件(fasta是一个文件,其中标题行以>开头,后跟与该标题对应的序列行)。我想获得与TRINITY和总数相匹配的序列数...

回答 1 投票 0

运行此代码时我做错了什么?

首先,我绝不是一个编程专家,并且我不熟悉python,所以请原谅我,如果这是一个愚蠢的问题。我正在尝试运行下面的代码来将fasta文件过滤到仅...

回答 2 投票 -1

为什么我的正则表达式不能删除一个fasta标题的一部分

我想删除标题中的“>”和“Un_”之间的所有内容,例如> NW_017859640.1 Esox lucius分离CL-BC-CA-002未放置的基因组支架,Eluc_V3 Un_scaffold1210我尝试了多个...

回答 1 投票 0

有没有办法使用Java 8中的数据流将特定字符描述的许多多行字符串收集到Arraylist中?

我有一个fasta文件,我想解析成一个ArrayList,每个位置都有一个完整的序列。序列是多行字符串,我不想在...中包含标识行

回答 1 投票 3

编写一个脚本,该脚本使用agrep逐个循环文档中的行与另一个文档中的行并获得结果

我正在尝试编写一个脚本,该脚本使用agrep循环遍历一个文档中的文件,并将它们与另一个文档进行匹配。我相信这可能会使用嵌套循环,但我并不完全确定。 ...

回答 1 投票 1

避免在函数中重复加载文件

我正在尝试编写一个带有函数的文件来获取fasta文件,并且(i)给出文件的概述,(ii)绘制序列长度分布的直方图。我成功写了以下内容......

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.