fasta 相关问题

FASTA是用于蛋白质和核酸的序列比对的软件包。 FASTA也是这些程序用来表示肽或核苷酸序列的文件格式的名称。该格式是生物信息学中事实上的标准。

使用条件语句将 Fasta 名称更改为标识符值;由于长度不等导致的错误

我对 R 比较陌生,想将它用于群体遗传学课程。我已经成功编写了一个脚本,通过登录号从 GenBank 中提取 Fasta 文件,但是 DNA 的名称

回答 1 投票 0

我正在尝试使用 grep sed 或 awk 来解析文件的单独行的字符之间[重复]

尝试在本示例文本中解析 behen 和 > 的下一个实例: >S_behen_BOx6592|contig_6484&contig_7580 TCCGAACCATAGCAAACATCGAAAGGAGTTTCGAAGGAAGTTTCCTGAGATGTTATAAAAG

回答 1 投票 0

我尝试使用 grep sed 或 awk 来解析文件的单独行的字符之间

尝试在本示例文本中解析 behen 和 > 的下一个实例: >S_behen_BOx6592|contig_6484&contig_7580 TCCGAACCATAGCAAACATCGAAAGGAGTTTCGAAGGAAGTTTCCTGAGATGTTATAAAAG

回答 1 投票 0

如何从 Perl 中的 stdin 和文件进行透明的 gzip 解压缩?

我编写了一些用于处理 FASTA/FASTQ 文件的脚本(例如 fastx-length.pl),但希望使它们更通用并接受压缩和未压缩文件作为命令行

回答 3 投票 0

优化 for 循环以使用字典值格式化新的 fasta 文件

我有一个 for 循环可以满足我的需要,但是,我想知道该循环是否可以进一步优化。 我有一本字典,其中每个键都有一个与其关联的值列表。价值清单...

回答 2 投票 0

在 R 中比较 fasta 文件与 tsv 文件

我有一个像这样的fasta文件: >IGHV6-22_F GTTTGAATGGCCAGGC... >IGHV1-21_F GTGCAGATGGTCAGAC... >IGHV3-20_F GTGTGAAGGGTGAACA... >IGHV3-18_F 还有一个像这样的 tsv 文件: df.allVHitsWith...

回答 1 投票 0

从文件中查找正确的行并使用它们创建新文件

我正在使用 Bash(对我来说非常陌生)。我有2个源文件。 其中之一(名称:clusters.txt)如下所示: 集群 10:WP_1.2 WP_1.1 WP_1.4 ...... 集群 15:WP_2.1 WP_1.4 WP_1.3 ...... 在sh...

回答 1 投票 0

如何使用 bash 替换多行 FASTA 文件中的特定字符串模式?

我有一个大型多行 FASTA 文件,如下所示: >NWQ47741.1 CLTR1 蛋白,部分 [Melospiza_melodia] 脊椎动物 CLSQGTMTALSPNLSCHNPSIDDFRNSVYSTLYSMISIMGFVGNGVVLYVLIRTYRQKTA

回答 1 投票 0

将子串按给定比例与fasta格式的序列交换

我有两个非交错 fasta 格式的序列: >序列1 啊啊啊啊啊 >序列2 TTTTTTTTTT 我想按一定比例交换两个序列的部分。比例为0.5(...

回答 1 投票 0

替换没有键值对文件的fasta头

尝试以下方法使用bioawk替换没有键值对的fasta标头 对于 $(ls *.faa) 中的 infile 做 前缀=$(基本名称$infile .faa) bioawk -c fastx '{ print ">&q...

回答 1 投票 0

如何在不仅仅是 fasta 文件中线性化 fasta 序列?

我正在运行 ipcress 进行计算机 PCR,结果如下所示: Ipcres 结果 实验:底漆1 底漆:B A 目标:QLOD02000001.1:过滤器(未屏蔽),全基因组鸟枪序列 比赛...

回答 1 投票 0

如何查找fasta文件中的序列长度?

我目前正在使用一个 fasta 文件(文本文件),其中包含 DNA 提取序列(重叠群)列表,每个序列都有一个标头,后面跟着几行核苷酸,这是...的核苷酸长度

回答 4 投票 0

如何计算由另一种行分隔的一组行中的字符?

我目前正在使用一个 fasta 文件(文本文件),其中包含 DNA 提取序列(重叠群)列表,每个序列都有一个标头,后面跟着几行核苷酸,这是...的核苷酸长度

回答 4 投票 0

我应该如何在 fasta 文件中实现条件字符串替换?

我有一个很大的fasta文件,每个序列标题中都有各种细菌物种名称,看起来像这样 文件.fasta >细菌;放线菌;放线菌;链霉菌;

回答 1 投票 0

使用 R 根据 FASTA 文件中名称的初始段使它们唯一

我的目标是根据 FASTA 文件中名称初始部分的唯一性来排除序列。但是,当我创建并使用下面的代码时遇到了错误。 通常是 FASTA 文件

回答 1 投票 0

根据序列长度对FASTA文件进行排序

我正在处理鸟类的基因组序列,并且我已经通过 RepeatMasker 运行了该基因组。我想找到每类重复中最长的序列。如何根据

回答 1 投票 0

使用映射txt文件重命名fasta文件

我希望使用unix中的scaffold_mapping.txt文件重命名我的脚手架,其中.txt文件如下所示: $头scaffold_mapping.txt >#ID_covAvg_fold_length长度 >scaffold_1_c1_cov61.

回答 1 投票 0

如何过滤“生产性”氨基酸序列

我有一个具有不同氨基酸序列的fasta文件,例如: >ABC HSTSDSAQTMFPVALLLLAAGSCVKGEQLTQPTSVTVQPGQRLTITCQVSYSLGTYFTAW IRQPAGKGLEWIGMRSTGASYYKDSLKNKFSIDLDTSSKTVTLNGQNVQPEDTAVYYCAR

回答 1 投票 0

通过删除“-”之后的字符串来仅编辑 fasta 标题的第一列

我有一个具有以下标头结构的fasta文件: >Saurogobio_punctatus-NC_080528.1|taxid=1771284|细胞生物,真核生物,后孔动物,后生动物

回答 1 投票 0

计数 fasta 文件中的读取次数(循环)

我想使用 awk 计算 fasta 文件的读取次数。 fasta 文件中的读取以“> NAME”开头,后跟一行和“DNA 代码”。就我而言,fasta 文件

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.