在R中使用来自2个不同数据框架的列变量进行T检验。

问题描述 投票:1回答:1

我试图在R中进行一个T检验,以确定在美国西部的美国和外国出生的工人之间的工资是否有统计学上的显著差异。我有2个不同的数据框架,基于出生地的两组数据,并想比较我的工资列变量 "adj_SALARY"。为了简单起见,假设在US_Born_west数据框架中有3个观测值,在Immigrant_West数据框架中有5个观测值。

US_born_West$adj_SALARY=30000, 25000,22000
   Immigrant_West$adj_SALARY=14000,20000,12000,16000,15000

#Here is what I attempted to run: 

    t.test(US_born_West$adj_SALARY~Immigrant_West$adj_SALARY, alternative="greater",conf.level = .95)

However I received this error message: "Error in model.frame.default(formula = US_born_West$adj_SALARY ~ Immigrant_West$adj_SALARY) : 
  variable lengths differ (found for 'Immigrant_West$adj_SALARY')" 

Any ideas on how I can fix this? Thank you! 
r testing multiple-columns t-test
1个回答
0
投票

US_born_West$adj_SALARYImmigrant_West$adj_SALARY 是不等长的。使用公式界面的 t.test 会给出一个错误。我们可以将它们作为单个向量来传递。

t.test(US_born_West$adj_SALARY, Immigrant_West$adj_SALARY, 
       alternative="greater",conf.level = .95)
© www.soinside.com 2019 - 2024. All rights reserved.