有没有办法使用 R/Python 标准化以下数据？

问题描述投票：0回答：0

在 R 中，使用 Immunarch 包，可以使用以下函数观察 CDR3 长度在多个数据集中的分布：

repExplore(immdata1$data, .method = "len", .col = "aa") %\>% vis()

这些是分类在 immdata1 下的每个数据集中的样本数量：

如您所见，一个数据集的样本数 (22626) 明显多于其他数据集。

有没有办法向 Immunarch 函数添加标准化，或者是否有另一个在 R 中有用的包，或者我可以用 Python 做些什么。

还没有尝试过任何东西，只是一个新手。

python

bioinformatics

normalization