在 R 中,使用 Immunarch 包,可以使用以下函数观察 CDR3 长度在多个数据集中的分布:
repExplore(immdata1$data, .method = "len", .col = "aa") %\>% vis()
这些是分类在 immdata1 下的每个数据集中的样本数量:
如您所见,一个数据集的样本数 (22626) 明显多于其他数据集。
有没有办法向 Immunarch 函数添加标准化,或者是否有另一个在 R 中有用的包,或者我可以用 Python 做些什么。
还没有尝试过任何东西,只是一个新手。