bioinformatics 相关问题

仅将此标记用于与生物信息学相关的编程相关问题。其他问题不属于此处,但可能是https://bioinformatics.stackexchange.com/上的主题。有关更多信息,请参阅标记维基。

残留接触图

如何使用Biopython从PDB文件计算蛋白质残基接触图,最终接触图作为.npy文件存储在Numpy数组中。 如果可以的话,请给我一些明确的指导或

回答 1 投票 0

根据常见子模式对短的同质字符串(DNA)进行聚类并提取类的共识

任务: 将大量短 DNA 片段聚类到共享共同子序列模式的类别中,并找到每个类别的共有序列。 泳池:约。 300 个序列片段 8 - 20 让...

回答 3 投票 0

创建一个采用 2 个 DNA 序列的函数,检查它们是否具有相同的长度、是否是有效序列以及它们具有什么类型的突变

我正在尝试创建一个函数,它接受 2 个 DNA 序列作为参数并检查 3 件事(按此顺序): 比较它们以查看它们的长度是否相同 检查它们是否都有效

回答 1 投票 0

将“DeseqStats”对象转换为 pandas 数据框?

是否可以将 DeseqStats 对象从 PyDESeq2 转换为 Pandas DataFrame? results_summary = stat_res results_as_html = results_summary.tables[1].as_html() pd.read_html(results_as_html, h...

回答 1 投票 0

Snakemake 工作流程独立工作,但作为模块导入时失败

我有两条工作管道。第一个管道从配置文件获取输入,然后创建 .csv 输出文件。第二个管道接收前一个管道的 .csv 输出。当我运行这些时

回答 1 投票 0

提交的 Snakemake 规则开始运行并立即失败,没有抛出任何错误,但 Snakemake 继续运行

我为我的项目编写了一个snakemake管道,其中一部分看起来像这样: 样本,= glob_wildcards("/absolute/path/to/samples/{sample}.bam") 统治一切: 输入:

回答 1 投票 0

估计 SNP 的频率

我成功运行了整个序列比对、SNP 和 INDELS 流程。然而,我想估计识别每个 SNP 的读取频率。我需要频率来正确估计我...

回答 1 投票 0

从bam文件中提取读取位置

我有一个包含多个 SNP 的 vcf 文件,现在我想看看这些 SNP 是否均匀分布在我从中获取 SNP 的 bam 文件的读取中。具体来说,我想绘制...

回答 2 投票 0

修改.pdb文件中的值并另存为新文件

对于作业,我必须在 Python 中读取一个小的 .pdb 文件,更改一些值,然后将其另存为新的 .pdb 文件。 我的原始文件是这样的: ATOM 19 HD2 TYR 1 26.910 61.717 39.8...

回答 1 投票 0

RcppExports.o:RcppExports.cpp:(.rdata+0x720):对“VirFinder_countSeqFeatureCpp”的未定义引用

我正在使用 rstudio 并尝试使用 devtools::load_all() 来加载包,但是,我遇到了未定义的引用错误。 (函数(命令 = NULL,args = 字符(),error_on_status =

回答 1 投票 0

将 pymol 迭代的结果附加到变量中

我有以下代码: def 抓取(resi): s1 = f"resi {resi} & 名称 P" s2 = f"resi {resi} & 名称 C4'" s3 = f"resi {int(resi) + 1} & 名称 P" ...

回答 1 投票 0

获取基因符号的 ENSEMBL ID

我正在从 NCBI 的基因表达综合网站下载 GSE 文件。恰巧我通过分析数据下载了表达式,文件是GSExxxxx。这些列表中有表达表

回答 1 投票 0

Snakemake:处理目录中的配对读取

存在一个包含配对读取的目录,配对的名称和数量未知,可能的文件扩展名是.fastq或.fastq.gz。 我需要有关如何最好地在目录中进行配对读取的建议...

回答 1 投票 0

大型 Pandas 数据框查找重叠区域

我在 pandas 中有一个 Pandas DataFrame,其基因组区域由其染色体、起始位置和终止位置表示。我正在尝试识别同一染色体内的重叠区域,并且

回答 1 投票 0

在 R 中运行 GDC_prepare 时出现问题

我正在尝试从 GDC 检索并准备一些数据,并且正在运行从 YouTube 视频复制粘贴的以下代码:video。 下面是代码: 库(TCGAbiolinks) 图书馆(tidyver...

回答 2 投票 0

如何使用 R 查找集合之间重复的内容?

假设我有三个数据集,每个数据集都是差异表达基因的列表。如何使用 R 找到在所有三组中重复的基因? 数据集的一个示例是: (会有hun...

回答 1 投票 0

跨列查找多个时间报告

我正在尝试评估伤害数据集。数据来自 4 个来源(医院、全科医生、自我报告、死亡),每个来源均以年为单位给出受伤时间(连续变量)。一个人我...

回答 1 投票 0

10x Multiome 数据上的 Cell Ranger Arc 错误:没有 I2 读取 FASTQ,我们无法从 FASTQ 标头读取 16 基条形码

我正在尝试对我的 FASTQ 文件运行 cellranger-arc 计数,这些文件是我在 NovaSeqX 上运行 10 倍多组测序而得到的(我将其提交给核心,他们对它进行了多路分离 - 我已经联系过了,但是

回答 1 投票 0

在 Python 或 Bash 中计算和显示大文件中残基之间的交互

我有一个大文件,其中包含有关蛋白质中残基之间相互作用的数据。文件中的每一行代表一次交互,第一列指示交互类型(例如...

回答 1 投票 0

从文件中删除终止密码子并将其替换为NNN

我想编写 Perl 代码来检查终止密码子并将其替换为 NNN。我写的代码如下: #!/usr/bin/perl 使用严格; 使用警告; # 检查文件名是否以

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.