我正在尝试基于 GEO 数据 (GSE166427) 上的 ChAMP 包来分析差异甲基化基因。虽然,我想知道应该如何生成“Sample Sheet.csv”文件来进行分析,因为下载的文件之间没有示例表文件,并且文件名如下:
[1] "GSM3759532_CLX_Methylation_A2004_N" "GSM3759533_CLX_Methylation_A2004_T"
[3] "GSM3759534_CLX_Methylation_A2027_N" "GSM3759535_CLX_Methylation_A2027_T"
[5] "GSM3759536_CLX_Methylation_A2050_N" "GSM3759537_CLX_Methylation_A2050_T"
所以,我无法处理所需的列,Sentrix_ID,Sentrix_Position等
是否有任何函数或包可以自动准备samplesheet.csv文件?
我不知道它是否相关,但我使用的是我的好朋友 thomas 编写的库,它实现了冠军管道标准化的所有必要内容。
包含样本表部分。 这是库https://github.com/V1CEE/PyNCBI_modified/tree/main/PyNCBI
它分叉了,因为我需要修复一些致命的编译错误才能使其工作。 您可以查看实现内部并单独使用示例表生成的部分,它位于 FileUtilities.py 文件下。
享受!