bioinformatics 相关问题

仅将此标记用于与生物信息学相关的编程相关问题。其他问题不属于此处,但可能是https://bioinformatics.stackexchange.com/上的主题。有关更多信息,请参阅标记维基。

将捐助者级别的元数据添加到集成的 Seurat 对象

我正在尝试将患者级别的元数据添加到现有的 Seurat 对象中。这包括每个参与者的生化信息,例如血糖、HsCRP、BMI 等。如何将这些数据添加到我的

回答 1 投票 0

在有向无环图中找到最长路径

在边加权 DAG 中找到两个节点之间的最长路径。 输入:一个边加权图,一个源节点source,一个sink节点sink。 输出:从源到汇的最长路径的长度,

回答 1 投票 0

如何创建热图来显示SSR在整个基因组上的密度和分布?

#设置bin大小 bin_size = 11000 # 创建热图 heatmap_data = np.zeros((len(ssr2_locations), seq_length // bin_size)) ssr_labels = 列表(ssr2_locations.keys()) 对于我,枚举中的 ssr(

回答 0 投票 0

如果第一两列的条件为真,则计算第三列的总和和平均值[关闭]

[我是 awk 和 linux 的新手,非常感谢您的帮助。 如果第4列有CACTA,第8列有CDS,则应统计CDS中的CACTA个数,求和覆盖的碱基数...

回答 1 投票 0

Pamr 包问题

我在尝试 pamr 教程时遇到问题:https://compdiag.molgen.mpg.de/docs/readme.html pamr.train(可汗.数据) 1 中的错误:ncol(data$x):长度为 0 的参数 谁能帮我解决这个问题...

回答 0 投票 0

如何在 ggplot 和图例中以数字方式排序覆盖图

我根据以下数据创建了这个图 > 头(data.frame(ali)) qname qlen qstart qend strand tname tlen tstart tend nmatch alen mapq 1 1 2535400 16999 2505...

回答 1 投票 0

差异蛋白表达分析——无显着差异

我想使用limma对一组蛋白质进行差异表达分析。这两组是“C”和“D”,它们是 colnames(mat) 的子字符串。我的输出显示

回答 0 投票 0

比较两种不同性状的 GWAS 输出?

假设我有精神分裂症和抑郁症的 GWAS 汇总统计数据,我想获得两者之间关联的一些基本指标。最好的方法是什么? 老实说我不知道

回答 0 投票 0

从附近删除字符串,但不一定在开头或结尾

我有一个包含约 10,000 个字符串的文件需要编辑。字符串很长(成百上千个字符),我想删除结尾附近的重复 A 或开头附近的 T...

回答 2 投票 0

在 sam 文件中编辑正则表达式的特例

我有一个 sam 文件,我需要编辑文件开头以 @SQ 开头的每一行以及第二部分中的每一行以及对齐信息。对于那些不熟悉的人...

回答 2 投票 0

从代表性序列中提取特定的蛋白质序列,并从 MAG 中确定它们的基因拷贝数 [关闭]

我对大多数生物信息学工具还是陌生的。我使用 get_homologues 管道运行泛基因组分析。 我提取并注释了 shell 和 cloud 基因(文件 1)。我想搜索这个

回答 0 投票 0

ModuleNotFoundError:没有名为“modeller.automodel”的模块

我在运行有关蛋白质建模的脚本 python 时遇到此错误。我需要一些帮助请在这里截图关于 erreur

回答 0 投票 0

使用 ggplo2 和 gggenes 在 x 轴上添加标签

有 21 个样本(在分子列中)和 157 个独特元素在基因列中的数据(80% 共同),所以我为每个样本创建了一个包含检测到的元素(基因列)的数据框,但我只是。 ..

回答 0 投票 0

使用ete3和曼哈顿距离矩阵浓缩为字典的邻居加入算法

我的算法如下: 而 len(t.get_leaves()) > 2: min_dist = float('inf') 对于 t 中的节点 1: 对于 t 中的节点 2: 如果节点 1 != 节点 2: 距离=总和(

回答 0 投票 0

将 GenBank 文件信息解析为 R 的问题

用于将 GenBank 文件解析为 R 的 Bioconductor 包函数似乎永远不适用于细菌基因组(我猜没有人关心我们微生物学家),所以我编写了以下代码来阅读......

回答 0 投票 0

Awk 打印匹配字符串前后的记录

我有很多包含基因注释和序列的 FASTA 文件。我感兴趣的基因之一是 CadC。我还想看的是 CadC 周围的基因,它们可能会被列出...

回答 1 投票 0

How to change UNK to certain res type in a pdb [关闭]

我从 diffdock 得到一个肽配体 sdf。我将这个 sdf 文件转换为 pdb 文件,发现当配体是肽时,res 类型都是 UNK。我想知道这个结果可能是 diffdock i.. .

回答 0 投票 0

在 UNIX 中重命名 fasta/fastq 文件中的条目

我有 x 个读段的 fasta 文件,我想重命名每个读段的 ID。 我的文件如下: >e855552f-9484-4674-8fc4-d9b1f1add023 runid=4140cbe7f7cd36a17a00b732f27dd37bd09e4380 sampleid=mari...

回答 1 投票 0

Biopython 包

我安装了Bio并更新了它,但是我又出现了这个错误。 >>> 从 Bio.SubsMat 导入 MatrixInfo ModuleNotFoundError:没有名为“Bio.SubsMat”的模块 我删除并重新安装了几次...

回答 1 投票 0

我正在尝试使用 for 循环将 fasta 文档转换为 python 中的字典,但只捕获了我的最后一次迭代

我正在尝试编写代码来创建一个字典,该字典读取 fasta 文档的 dna 序列,其中 dna 序列的名称在包含...的行的开头用“>”表示...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.