有没有办法使用 R/Python 标准化以下数据?

问题描述 投票:0回答:0

在 R 中,使用 Immunarch 包,可以使用以下函数观察 CDR3 长度在多个数据集中的分布:

repExplore(immdata1$data, .method = "len", .col = "aa") %\>% vis()

这些是分类在 immdata1 下的每个数据集中的样本数量:

  • `[2577],
  • [863],
  • [1455],
  • [1170],
  • [8241],
  • [337],
  • [2586],
  • [1637],
  • [3038],
  • [2296],
  • [500],
  • [1727],
  • [3458],
  • [9335],
  • [3479],
  • [3027],
  • [22626],
  • [1453],
  • [2081],
  • [841],
  • [2293],
  • [2797],
  • [5805]

如您所见,一个数据集的样本数 (22626) 明显多于其他数据集。

有没有办法向 Immunarch 函数添加标准化,或者是否有另一个在 R 中有用的包,或者我可以用 Python 做些什么。

还没有尝试过任何东西,只是一个新手。

python r bioinformatics normalization
© www.soinside.com 2019 - 2024. All rights reserved.