如何在 R 中对从 .csv 导入的大数据执行多项统计检验(即两侧 t 检验)?

问题描述 投票:0回答:1

尝试对使用 csv 导入的数据执行 ttest。

数据如下:

sheet containing data

具有 99 个基因的“正常”病例和“癌症”病例值。

我如何设置代码来统计比较“正常”和“癌症”值(每个类别 n=20) 分别为每一列?

这将是双边 t 检验,因此结果将显示: 基因1、基因2.....基因99的正常值和癌症值之间的统计差异。

我希望避免为每个单独的列查找均值、标准差等,并希望对我的数据进行集体测试。

r statistics
1个回答
0
投票

我曾经在 R 基础上编写过一个函数来做到这一点。该函数在github上。

 remotes::install_github('oonyambu/SLR')
 SLR::multiple_tests(. ~ category, df)

例如

t.test
对于
iris
数据集:

 SLR::multiple_tests(.~Species, iris)
© www.soinside.com 2019 - 2024. All rights reserved.