bioinformatics 相关问题

仅将此标记用于与生物信息学相关的编程相关问题。其他问题不属于此处,但可能是https://bioinformatics.stackexchange.com/上的主题。有关更多信息,请参阅标记维基。

R 一对多映射

meth.genes 是一个字符向量,基于与 meth 数据框的行名相对应的基因名称。然而,这是一对多的匹配,一个基因可以映射到多个ro...

回答 2 投票 0

如何在将字符串拆分为列表中的编号元素后删除“'”字符?

我正在编写代码将 DNA 菌株翻译成相应的蛋白质,并且我已经设法将 DNA 分成三联体,将它们变成列表的元素。 然而,问题是,因为我拼...

回答 0 投票 0

结合两个分类列为每个成对组合创建二进制列

我正在尝试采用两列特征并生成成对组合以进行相关性分析。我从一个看起来像这样的数据框开始: 性年龄收获_DPI M_1_10w_M_L ...

回答 3 投票 0

Python 子进程被杀死。可能是因为内存问题。如何解决这个问题?

我正在使用 python 子进程模块在我的 python 代码中运行一个 unix 命令。我只想检查输入文件的同一行中是否存在特定搜索词(输入文件大小为 1.8...

回答 0 投票 0

我的开放阅读框 (ORF) 查找代码没有找到序列中最长的 ORF

我正在尝试编写一个函数来找到最长的开放阅读框。然而,在这个例子中,它没有找到最长的 ORF,我不明白为什么。 这是顺序:

回答 1 投票 0

如何从fasta计算距离矩阵?

我想执行以下操作,但我遇到了困难。 我想将 multifasta 文件中的氨基酸序列转换为具有欧氏距离和皮尔逊相关性的矩阵(或向量)

回答 1 投票 0

如何在特定条件下保留然后重命名文件并在 R 中运行循环

我可以请你帮忙吗?我想在 R 环境中清理文件。该文件将命名为 T1-T1_R1.fastq、T1-T1_R2.fastq、T1-T2_R1.fastq、T1-T2_R2.fastq 等。我只想保留具有相似特征的文件...

回答 0 投票 0

Cannot import name 'TextFace' error while using ETE3 for Phylogeny Tree

我正在尝试安装 ETE3 进行系统发育分析,但在安装时显示错误:无法导入名称“TextFace” 我尝试了所有可用的选项,但未能成功。 任何帮助都是

回答 0 投票 0

如何让我的 csv 比较结果适用于 3 个单独的列而不是一个

我编写的程序需要 2 个 csv,一个来自我们的每个基因结果报告者,并将它们合并到“样本 ID”列中。 化验 ID_x 基因符号 NCBI SNP 参考 样品编号 呼叫_x

回答 2 投票 0

如何从 Pubmed 下载全文?

我正在做一个需要使用 Genia 语料库的项目。根据文献,Genia 语料库是由通过搜索 3 个 Mesh 术语提取的文章制成的:“转录因子”、“bloo ...

回答 4 投票 0

使用 bioinfokit 更改绘图轴

我有以下代码使用 Bioinfokit 生成火山图: pip 安装生物信息包 将熊猫导入为 pd 将 numpy 导入为 np 导入生物信息包 从 bioinfokit 导入分析,visuz 进口

回答 1 投票 0

如何在 R 中的 RNA-Seq 读取计数后将 ID 更改为名称?

我已经根据我通过 GenomicAlignment 包从 UCSC 数据库获得的参考“hg38.knownGene.gtf”对我的 RNA-Seq 样本进行了计数。我拥有的输出文件包含不熟悉的...

回答 0 投票 0

如何在 snakemake 的规则中运行 for 循环时转义 MissingOutputException

我有以下蛇文件: 导入操作系统 SAMPLES = [i.replace('sample_', '') for i in os.listdir('final_raw')] 统治一切: 输入: 展开('分析/结果/未映射/混合/读取1_{样本...

回答 0 投票 0

目标规则不能包含通配符。请指定具体的文件或没有通配符错误的规则

我有一个 snakemake 脚本 # 最小的例子 配置文件:“../snakemake/config.yaml” 导入操作系统 规则生成包括: 输入: archaic_inc=config['input']['archaic_include'...

回答 1 投票 0

Running fGSEA, not all stats values are finite numbers 错误:

我正在尝试对我保存的数据运行 fgsea 分析: 水库<- read.delim ("Rank_fgsea_data.rnk", header=T, colClasses = c("numeric", "character")) res$Gene....

回答 0 投票 0

使用 bash 将树文件转换为表格格式

我有这个输入,我正在尝试使用此代码将其转换为表格格式 回声“((((hg38:0.0059208,panTro4:0.00614632):0.00912834,ponAbe2:0.0162903):0.0103823,((((rheMac3:0.002205,macFa ...

回答 0 投票 0

难以解释 Biopython ncbi blast 函数的 .xml 结果文件

我想对猪核苷酸基因组序列进行序列搜索“CCTTCATTCTTCTGTATTGGAGACTTACAGTTGGCACAAGGCTTGGAGTT”,看看我是否能在比对中找到完美匹配。我用过...

回答 0 投票 0

连接数据帧时如何在 pandas multiindex 中保留类别 dtype?

我正在处理我希望能够控制排序顺序的数据(在我的实际用例中,染色体名称,但在这里我使用了虚拟名称),这将是 MultiIndex 的一部分(也包含

回答 0 投票 0

如果我知道范围,则在 R 中填充或填充数据框

我正在寻找类似于 bedtools subtract 但带有数据框的东西。 例如,假设我在这里将范围作为数据框: 开始结束值 0 100 个人 我还有另一个数据框,它是如此......

回答 3 投票 0

使用 statsmodels 在 python 中计算类内相关系数

我正在使用 statsmodels.formula.api.mixedlm 来计算类内相关系数和其他指标。 我的数据集非常简单,它包含一个特征值、一个访问日期和一个主题 ID...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.