fasta 相关问题

FASTA是用于蛋白质和核酸的序列比对的软件包。 FASTA也是这些程序用来表示肽或核苷酸序列的文件格式的名称。该格式是生物信息学中事实上的标准。

我有一个fasta文件： >1 AGGGTCACGTAATGCTGATCCAGTCTTGTTTTTTTTTCATTCATGTTCCCGCTCTTGCT TTGATTCCGACTTCTAACGTTTAACCTGTGATCAGACGTTTCACTGCTCCATATTTTACG TGTGCCTGCCGGTCATCTTGGGTAGAGTTAGCATATCC >2

awk bioinformatics fasta

回答 6 投票 0

Perl：匹配数组元素，然后将上一个（后面 5 个索引）数组元素复制到新数组

本质上我想做的是搜索一个大文本文件来识别每个显示“未找到匹配项”的元素，并将匹配的标识符复制到新列表中。我对第一个很好...

regex perl bioinformatics fasta regular-language

回答 4 投票 0

如何使用 Bash 脚本查找 FASTA 文件的 GC 内容？

我想使用 Bash 脚本从 FASTA 格式文件中查找 GC 内容。 GC含量基本上是((G+C)的数量)/((A+T+G+C)的数量)。我正在尝试使用 wc 命令。 ...

linux bash bioinformatics fasta dna-sequence

回答 3 投票 0

将 FASTA 读入数据帧并提取 FASTA 文件的子序列

我有一个 DNA 序列的小 fasta 文件，如下所示： >NM_000016 700 200 234 ACATATTGGAGGCCGAAACAATGAGGCGTGATCAACTCAGTATATCAC >NM_000775 700 124 236

r subset bioinformatics fasta

回答 5 投票 0

使用条件语句将 Fasta 名称更改为标识符值；由于长度不等导致的错误

我对 R 比较陌生，想将它用于群体遗传学课程。我已经成功编写了一个脚本，通过登录号从 GenBank 中提取 Fasta 文件，但是 DNA 的名称

paste fasta names

回答 1 投票 0

我正在尝试使用 grep sed 或 awk 来解析文件的单独行的字符之间[重复]

尝试在本示例文本中解析 behen 和 > 的下一个实例： >S_behen_BOx6592|contig_6484&contig_7580 TCCGAACCATAGCAAACATCGAAAGGAGTTTCGAAGGAAGTTTCCTGAGATGTTATAAAAG

unix awk sed grep fasta

回答 1 投票 0

我尝试使用 grep sed 或 awk 来解析文件的单独行的字符之间

尝试在本示例文本中解析 behen 和 > 的下一个实例： >S_behen_BOx6592|contig_6484&contig_7580 TCCGAACCATAGCAAACATCGAAAGGAGTTTCGAAGGAAGTTTCCTGAGATGTTATAAAAG

unix awk sed grep fasta

回答 1 投票 0

如何从 Perl 中的 stdin 和文件进行透明的 gzip 解压缩？

我编写了一些用于处理 FASTA/FASTQ 文件的脚本（例如 fastx-length.pl），但希望使它们更通用并接受压缩和未压缩文件作为命令行

fasta fastq compression perl

回答 3 投票 0

优化 for 循环以使用字典值格式化新的 fasta 文件

我有一个 for 循环可以满足我的需要，但是，我想知道该循环是否可以进一步优化。我有一本字典，其中每个键都有一个与其关联的值列表。价值清单...

python loops optimization fasta

回答 2 投票 0

在 R 中比较 fasta 文件与 tsv 文件

我有一个像这样的fasta文件： >IGHV6-22_F GTTTGAATGGCCAGGC... >IGHV1-21_F GTGCAGATGGTCAGAC... >IGHV3-20_F GTGTGAAGGGTGAACA... >IGHV3-18_F 还有一个像这样的 tsv 文件： df.allVHitsWith...

r csv row fasta

回答 1 投票 0

从文件中查找正确的行并使用它们创建新文件

我正在使用 Bash（对我来说非常陌生）。我有2个源文件。其中之一（名称：clusters.txt）如下所示：集群 10：WP_1.2 WP_1.1 WP_1.4 ...... 集群 15：WP_2.1 WP_1.4 WP_1.3 ...... 在sh...

r bash bioinformatics fasta

回答 1 投票 0

如何使用 bash 替换多行 FASTA 文件中的特定字符串模式？

我有一个大型多行 FASTA 文件，如下所示： >NWQ47741.1 CLTR1 蛋白，部分 [Melospiza_melodia] 脊椎动物 CLSQGTMTALSPNLSCHNPSIDDFRNSVYSTLYSMISIMGFVGNGVVLYVLIRTYRQKTA

bash awk sed bioinformatics fasta

回答 1 投票 0

将子串按给定比例与fasta格式的序列交换

我有两个非交错 fasta 格式的序列： >序列1 啊啊啊啊啊 >序列2 TTTTTTTTTT 我想按一定比例交换两个序列的部分。比例为0.5（...