对于大学,我必须回答 RMD 文件中的一些问题。我们有一个问题的数据集。但对于大多数问题,我们必须计算数据集中变量的观察结果。例如,有一个名为:Room_Type 的变量,这可以是整个房屋、私人房间或共享房间。另一个变量称为床位。现在我们要数一下有多少间两床房。其中有多少是私人公寓。有人可以帮忙吗?先谢谢你了
附注这是我的第一个问题所以我不知道我是否做对了
我尝试了一个计数公式,但我发现这不是东西。我试图找到答案,但提出问题感觉很简单。 AI 也没有给我一个像样的答案。
如果这类似于伦敦 AirBnb 数据,其中房源描述如下所示:
Rental unit in Islington · ★4.80 · 1 bedroom · 1 bed · 1 shared bath...
,描述的列名称为“名称”,例如:
然后您可以使用以下脚本提取卧室数量:
library(tidyverse)
df = read_csv('London AirBnB Listings.csv')
# find the beginning and end of the word bedroom
df2 = df %>%
mutate(b1 = str_locate(name, 'bedroom'))
# create a new column that indicated where 'bedroom' starts
df2$start = df2$b1[,"start"]
# get 3 characters before bedroom, that is the number of bedrooms
df2 <- df2 %>%
mutate(n_bedrooms = str_sub(name, start-3, start-1))
结果将是一个新列,n_bedrooms: