我有 Zillow 的数据集。
train <- read.csv("train.data.csv")
我找到了平均房价最高的 3 个邮政编码。
train$zipcode <- as.factor(train$zipcode)
l<-tapply(train$price, train$zip, mean)
sort(l,decreasing = TRUE)
这给了我 98039、98004 和 98040。我想为这 3 个变量创建 3 个价格箱线图。我该怎么做?
我假设你的数据就像下面的
df
。一个变量用于价格,一个变量用于 df$price
和 df$zip
以下的邮政编码
您可以使用基础 r
boxplot
功能
df=data.frame(price=c(10,15,20,14,22,26,30,12),
zip=c("zip1","zip1","zip1","zip1",
"zip2","zip2","zip2","zip2"))
head(df,4)
#> price zip
#> 1 10 zip1
#> 2 15 zip1
#> 3 20 zip1
#> 4 14 zip1
boxplot(price~zip , data=df)
创建于 2023-04-09 与 reprex v2.0.2