如何统计数据集中的数据集

Question

对于大学，我必须回答 RMD 文件中的一些问题。我们有一个问题的数据集。但对于大多数问题，我们必须计算数据集中变量的观察结果。例如，有一个名为：Room_Type 的变量，这可以是整个房屋、私人房间或共享房间。另一个变量称为床位。现在我们要数一下有多少间两床房。其中有多少是私人公寓。有人可以帮忙吗？先谢谢你了

附注这是我的第一个问题所以我不知道我是否做对了

我尝试了一个计数公式，但我发现这不是东西。我试图找到答案，但提出问题感觉很简单。 AI 也没有给我一个像样的答案。

Answer 1

如果这类似于伦敦 AirBnb 数据，其中房源描述如下所示：

Rental unit in Islington · ★4.80 · 1 bedroom · 1 bed · 1 shared bath...

，描述的列名称为“名称”，例如：

然后您可以使用以下脚本提取卧室数量：

library(tidyverse)
df = read_csv('London AirBnB Listings.csv')

# find the beginning and end of the word bedroom
df2 = df %>% 
  mutate(b1 = str_locate(name, 'bedroom'))

# create a new column that indicated where 'bedroom' starts 
df2$start = df2$b1[,"start"]

# get 3 characters before bedroom, that is the number of bedrooms
df2 <- df2 %>%
  mutate(n_bedrooms = str_sub(name, start-3, start-1))

结果将是一个新列，n_bedrooms：

如何统计数据集中的数据集

问题描述投票：0回答：1

1个回答

最新问题

如何统计数据集中的数据集

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1