fasta 相关问题

FASTA是用于蛋白质和核酸的序列比对的软件包。 FASTA也是这些程序用来表示肽或核苷酸序列的文件格式的名称。该格式是生物信息学中事实上的标准。

计算文件中由特定字符分隔的行数和字符数

我有一个fasta文件: >1 AGGGTCACGTAATGCTGATCCAGTCTTGTTTTTTTTTCATTCATGTTCCCGCTCTTGCT TTGATTCCGACTTCTAACGTTTAACCTGTGATCAGACGTTTCACTGCTCCATATTTTACG TGTGCCTGCCGGTCATCTTGGGTAGAGTTAGCATATCC >2

回答 6 投票 0

Perl:匹配数组元素,然后将上一个(后面 5 个索引)数组元素复制到新数组

本质上我想做的是搜索一个大文本文件来识别每个显示“未找到匹配项”的元素,并将匹配的标识符复制到新列表中。我对第一个很好...

回答 4 投票 0

如何使用 Bash 脚本查找 FASTA 文件的 GC 内容?

我想使用 Bash 脚本从 FASTA 格式文件中查找 GC 内容。 GC含量基本上是((G+C)的数量)/((A+T+G+C)的数量)。 我正在尝试使用 wc 命令。 ...

回答 3 投票 0

将 FASTA 读入数据帧并提取 FASTA 文件的子序列

我有一个 DNA 序列的小 fasta 文件,如下所示: >NM_000016 700 200 234 ACATATTGGAGGCCGAAACAATGAGGCGTGATCAACTCAGTATATCAC >NM_000775 700 124 236

回答 5 投票 0

使用条件语句将 Fasta 名称更改为标识符值;由于长度不等导致的错误

我对 R 比较陌生,想将它用于群体遗传学课程。我已经成功编写了一个脚本,通过登录号从 GenBank 中提取 Fasta 文件,但是 DNA 的名称

回答 1 投票 0

我正在尝试使用 grep sed 或 awk 来解析文件的单独行的字符之间[重复]

尝试在本示例文本中解析 behen 和 > 的下一个实例: >S_behen_BOx6592|contig_6484&contig_7580 TCCGAACCATAGCAAACATCGAAAGGAGTTTCGAAGGAAGTTTCCTGAGATGTTATAAAAG

回答 1 投票 0

我尝试使用 grep sed 或 awk 来解析文件的单独行的字符之间

尝试在本示例文本中解析 behen 和 > 的下一个实例: >S_behen_BOx6592|contig_6484&contig_7580 TCCGAACCATAGCAAACATCGAAAGGAGTTTCGAAGGAAGTTTCCTGAGATGTTATAAAAG

回答 1 投票 0

如何从 Perl 中的 stdin 和文件进行透明的 gzip 解压缩?

我编写了一些用于处理 FASTA/FASTQ 文件的脚本(例如 fastx-length.pl),但希望使它们更通用并接受压缩和未压缩文件作为命令行

回答 3 投票 0

优化 for 循环以使用字典值格式化新的 fasta 文件

我有一个 for 循环可以满足我的需要,但是,我想知道该循环是否可以进一步优化。 我有一本字典,其中每个键都有一个与其关联的值列表。价值清单...

回答 2 投票 0

在 R 中比较 fasta 文件与 tsv 文件

我有一个像这样的fasta文件: >IGHV6-22_F GTTTGAATGGCCAGGC... >IGHV1-21_F GTGCAGATGGTCAGAC... >IGHV3-20_F GTGTGAAGGGTGAACA... >IGHV3-18_F 还有一个像这样的 tsv 文件: df.allVHitsWith...

回答 1 投票 0

从文件中查找正确的行并使用它们创建新文件

我正在使用 Bash(对我来说非常陌生)。我有2个源文件。 其中之一(名称:clusters.txt)如下所示: 集群 10:WP_1.2 WP_1.1 WP_1.4 ...... 集群 15:WP_2.1 WP_1.4 WP_1.3 ...... 在sh...

回答 1 投票 0

如何使用 bash 替换多行 FASTA 文件中的特定字符串模式?

我有一个大型多行 FASTA 文件,如下所示: >NWQ47741.1 CLTR1 蛋白,部分 [Melospiza_melodia] 脊椎动物 CLSQGTMTALSPNLSCHNPSIDDFRNSVYSTLYSMISIMGFVGNGVVLYVLIRTYRQKTA

回答 1 投票 0

将子串按给定比例与fasta格式的序列交换

我有两个非交错 fasta 格式的序列: >序列1 啊啊啊啊啊 >序列2 TTTTTTTTTT 我想按一定比例交换两个序列的部分。比例为0.5(...

回答 1 投票 0

替换没有键值对文件的fasta头

尝试以下方法使用bioawk替换没有键值对的fasta标头 对于 $(ls *.faa) 中的 infile 做 前缀=$(基本名称$infile .faa) bioawk -c fastx '{ print ">&q...

回答 1 投票 0

如何在不仅仅是 fasta 文件中线性化 fasta 序列?

我正在运行 ipcress 进行计算机 PCR,结果如下所示: Ipcres 结果 实验:底漆1 底漆:B A 目标:QLOD02000001.1:过滤器(未屏蔽),全基因组鸟枪序列 比赛...

回答 1 投票 0

如何查找fasta文件中的序列长度?

我目前正在使用一个 fasta 文件(文本文件),其中包含 DNA 提取序列(重叠群)列表,每个序列都有一个标头,后面跟着几行核苷酸,这是...的核苷酸长度

回答 4 投票 0

如何计算由另一种行分隔的一组行中的字符?

我目前正在使用一个 fasta 文件(文本文件),其中包含 DNA 提取序列(重叠群)列表,每个序列都有一个标头,后面跟着几行核苷酸,这是...的核苷酸长度

回答 4 投票 0

我应该如何在 fasta 文件中实现条件字符串替换?

我有一个很大的fasta文件,每个序列标题中都有各种细菌物种名称,看起来像这样 文件.fasta >细菌;放线菌;放线菌;链霉菌;

回答 1 投票 0

使用 R 根据 FASTA 文件中名称的初始段使它们唯一

我的目标是根据 FASTA 文件中名称初始部分的唯一性来排除序列。但是,当我创建并使用下面的代码时遇到了错误。 通常是 FASTA 文件

回答 1 投票 0

根据序列长度对FASTA文件进行排序

我正在处理鸟类的基因组序列,并且我已经通过 RepeatMasker 运行了该基因组。我想找到每类重复中最长的序列。如何根据

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.