fasta 相关问题

FASTA是用于蛋白质和核酸的序列比对的软件包。 FASTA也是这些程序用来表示肽或核苷酸序列的文件格式的名称。该格式是生物信息学中事实上的标准。

Spark如何读取分布式文件

Fasta 文件是一个多行文件。它的结构就像 >ID_1 ACGTAGCATGC >ID_2 AGCTAGTACATC 因此,为了获取序列,我必须读取 2 行中的 1 行。 我有多个大 fasta 文件(每个 f 120Go...

回答 2 投票 0

删除重复序列 fasta 文件时出错 - 标题中的问题

这里是python菜鸟。 我正在尝试以 fasta 格式组合一些蛋白质序列,然后删除重复项。我通过搜索找到了这段代码,它工作得很好,但我遇到了一个问题,我......

回答 0 投票 0

txt 文件,在 R 中包含 FASTA 数据

我有一个 .txt 文件,其中包含 FASTA 格式的氨基酸序列(它包括行与行之间的空格): Protein_A|maker-scaffold10x_349_pilon-augustus-gene-0.9

回答 0 投票 0

用不同文件中的索引替换 FASTA 文件中的数值。 (首选 Bash)

我有一个充满以下格式(依此类推)的fasta文件的文件夹,其中以>开头的行是DNA序列的读取名称,下一行是序列本身。这个...

回答 3 投票 0

如何使用类似 Python 标头的 fasta 将字符串序列格式化为某个预定长度

我有一个名为 input.txt 的文本文件,如下所示。 A C H E C Q D S S C H C R Q K L E D T S C H L E D V G K M N T Y H C G E G I N N G P N A S C K F M L P C V V A E F E N H T E T D W R C K L ...

回答 1 投票 0

创建一个函数,将输入的 fasta 文件名(X7.fasta)和输出的 fasta 文件名(X7_genes.fasta)作为输入,并一次完成所有步骤

您好我整天都在尝试解决这个问题。尽管如此,我正在寻找如何创建一个函数,将一个 fasta 文件作为输入,另一个 fasta 文件作为输出,并且...

回答 0 投票 0

删除 fasta 文件中的单词列表

我有一个这样的fasta文件: solper_LA1333_DN23684_c0_g1_i1.p1>solper_LA1333_DN23684_c0_g1_i4.p1>solper_LA1333_DN23684_c0_g1_i6.p1>solper_LA1333_DN23684_c0_g1_i8.p1

回答 0 投票 0

用“类似于”之后的下一个词更改 fasta 标题

(交叉发布到 Biostars:https://www.biostars.org/p/9562110/) 我有一个带注释的 fasta 文件,我想在 > 下一个单词“类似于”之后添加到第一个位置 >_Anouracaudifer_000...

回答 2 投票 0

有没有办法使用 Python 从 UniProt 中获取蛋白质序列?

我正在寻找一种通过在输入中指定蛋白质 UniProt ID 从 UniProt 检索 FASTA 文件的方法。我的目标是创建一个能够创建 FASTA 文件的 Google Colab,我可以在其中指定...

回答 1 投票 0

使用 PowerShell 为多个 .faa 文件将文件名添加到以“>”开头的字符行

我有 100 个包含蛋白质序列的 FASTA 存储在一个目录中。我需要将它们各自的文件名添加到每个 FASTA 标头中(字符串字符串以“...

回答 1 投票 0

在 UNIX 中重命名 fasta/fastq 文件中的条目

我有 x 个读段的 fasta 文件,我想重命名每个读段的 ID。 我的文件如下: >e855552f-9484-4674-8fc4-d9b1f1add023 runid=4140cbe7f7cd36a17a00b732f27dd37bd09e4380 sampleid=mari...

回答 1 投票 0

我正在尝试使用 for 循环将 fasta 文档转换为 python 中的字典,但只捕获了我的最后一次迭代

我正在尝试编写代码来创建一个字典,该字典读取 fasta 文档的 dna 序列,其中 dna 序列的名称在包含...的行的开头用“>”表示...

回答 2 投票 0

将数据框中的 fasta 文件拆分为第 4 列并重命名,在 R 中

//#我有一个 fASTA 文件,我想将其放入一个包含 4 列的表格中 #代码 安装.packages(“seqinr”) 图书馆(“seqinr”) DNASEQ<- read.fasta(file = "C:/Users/user/Download...

回答 1 投票 0

如何从fasta计算距离矩阵?

我想执行以下操作,但我遇到了困难。 我想将 multifasta 文件中的氨基酸序列转换为具有欧氏距离和皮尔逊相关性的矩阵(或向量)

回答 1 投票 0

Cannot import name 'TextFace' error while using ETE3 for Phylogeny Tree

我正在尝试安装 ETE3 进行系统发育分析,但在安装时显示错误:无法导入名称“TextFace” 我尝试了所有可用的选项,但未能成功。 任何帮助都是

回答 0 投票 0

将 3 行行中的最后两行合并在一起

我想将第 2-3 行合并在一起并保留第 1 行。这是我的文本示例 >chrX:147147161-147148161 ATGATGGTGATGTACAGATGGTTTTTGG TTATCTAATTCATGTGTTGGTCAGATCAA >chrY:16119725-

回答 2 投票 0

将多个 FASTA 文件拆分为单独的文件,保留其原始名称

我正在尝试使用之前发布在该论坛上的 AWK 脚本。我正在尝试将包含多个 DNA 序列的大型 FASTA 文件拆分为单独的 FASTA 文件。我需要分开...

回答 5 投票 0

如何只保留一行的第二个字段并打印这一行和下一行?

我有一个包含 2 行的 fasta 格式的文件: 第一行以符号 > 第二行字母。 我只想保留第一行的第二个字段(逗号分隔符...

回答 4 投票 0

在 C++ 中读取 fasta 文件的最有效方法是什么? [关闭]

我正在编写涉及对大型 fasta 文件进行迭代的性能关键代码,其中某些行可能多达数十万个字符。到目前为止我一直这样做的方式是: #在...

回答 0 投票 0

如何在R中使用for循环将fasta分成两列而不使用任何包?

我有一个fasta文件,它看起来像下面的,还有其他头和相应的序列。我如何写一个带有 "for循环 "的代码,将其转换为一个数据帧,其中ORF名称是......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.