如何统计数据集中的数据集

问题描述 投票:0回答:1

对于大学,我必须回答 RMD 文件中的一些问题。我们有一个问题的数据集。但对于大多数问题,我们必须计算数据集中变量的观察结果。例如,有一个名为:Room_Type 的变量,这可以是整个房屋、私人房间或共享房间。另一个变量称为床位。现在我们要数一下有多少间两床房。其中有多少是私人公寓。有人可以帮忙吗?先谢谢你了

附注这是我的第一个问题所以我不知道我是否做对了

我尝试了一个计数公式,但我发现这不是东西。我试图找到答案,但提出问题感觉很简单。 AI 也没有给我一个像样的答案。

r count dataset formula
1个回答
0
投票

如果这类似于伦敦 AirBnb 数据,其中房源描述如下所示:

Rental unit in Islington · ★4.80 · 1 bedroom · 1 bed · 1 shared bath...
,描述的列名称为“名称”,例如:

然后您可以使用以下脚本提取卧室数量:

library(tidyverse)
df = read_csv('London AirBnB Listings.csv')

# find the beginning and end of the word bedroom
df2 = df %>% 
  mutate(b1 = str_locate(name, 'bedroom'))

# create a new column that indicated where 'bedroom' starts 
df2$start = df2$b1[,"start"]

# get 3 characters before bedroom, that is the number of bedrooms
df2 <- df2 %>%
  mutate(n_bedrooms = str_sub(name, start-3, start-1))

结果将是一个新列,n_bedrooms:

© www.soinside.com 2019 - 2024. All rights reserved.