如何根据对黑白猪基因的研究从 364 经验派生的数据集中分离差异表达的基因

问题描述 投票:0回答:0

我会尽我所能解释,因为我这样做是为了帮同事的忙,似乎有几种方法可以做到这一点,我什至不确定他是否知道自己想要什么。他正在研究肌肉内脂肪沉积,其中 2 组(黑色和白色)猪,每组黑色和白色(分别)有 3 个样本(经典 DEF 研究),364 个基因中的每一个都有相关的 q_values/FDR(调整后的 log2fold 变化 p -values) 和 excel 文件中的 Fold Change(和其他参数),其中 Fold Change 从最高到最低排序,即一个基因的 FC 为 15,另一个基因的 FC 为 2,而其他基因的 FC 非常低值,并且从仅查看数据集来看,如果不是超过一半,q_values 远小于 0.05,没有特定顺序。首先,我是只比较 q_value 还是 FC,还是同时使用 q_value 和 FC 来生成,最终可能是 Python 或 R 中的热图或散点图(我先尝试一下 Python)。仅使用 q_values 来查看值与表达水平的比较似乎是合乎逻辑的基因表达值的差异,如果对于具有低或小于 0.05 q_value 的特定脂肪基因,可能与黑白猪基因表达的更大差异更密切相关,并且可能有利于已知具有更多的黑猪高度上调的脂肪基因?你明白我的意思吗?问题的一部分是,我必须假设其中的 2 列是 p_values 或 q_values,其中在分别标记为 FC(折叠更改)的黑色和白色的平均表达式之后有另一列。任何帮助我前进的帮助,至少在正确的方向上,我都非常感激我使用 Python 的地方,但如果更容易的话,不介意使用 R。提前致谢!

老实说,我没有尝试那么多,因为我不知道从哪里开始。我加载了数据,对其进行了整形、查看等,并考虑了将假定的 q_value 列绘制为 FC 列的散点图,但我不确定是否需要这样做,如果需要,我会告诉我任何事物。我可以阻止我输入的代码,但它只是上传文件并使用 df.head ()。

python r heatmap p-value q-value
© www.soinside.com 2019 - 2024. All rights reserved.