我对R还是很陌生,我正在努力尝试做一件可能非常简单的事情。
我从2010年至2019年下载了洛杉矶的犯罪数据。有2,114,010行数据。现在,在我的“全球环境”区域中将其称为“ df”。
我想操纵一个标题为“发生”的特定列-这是犯罪发生的日期参考。
现在,将其设置为YYYY-MM-DD(即2010-02-20)。
我正在尝试将所有三个分隔成单独的列。我已经在该论坛和StackExchange上搜索了Googled,Googled和Googled,并尝试了很多尝试,但是无法使其正常工作。
我尝试了Lubridate并按照说明进行其他回答,但它根本不会创建新列(年,月,日各一个)。
这里有一些数据集的代表...我没有包括所有不同的变量,因为它们不是问题。
如上所述,我试图将“发生”分为单独的“年”,“月”和“天”列。
> head(df, 10)[c('dr_no','occurred','time','area_name')]
dr_no occurred time area_name
1 1307355 2010-02-20 1350 Newton
2 11401303 2010-09-12 45 Pacific
3 70309629 2010-08-09 1515 Newton
4 90631215 2010-01-05 150 Hollywood
5 100100501 2010-01-02 2100 Central
6 100100506 2010-01-04 1650 Central
7 100100508 2010-01-07 2005 Central
8 100100509 2010-01-08 2100 Central
9 100100510 2010-01-09 230 Central
10 100100511 2010-01-06 2100 Central
我们可以用tidyverse
和lubridate
来做到这一点>
library(dplyr)
library(lubridate)
df <- df %>%
mutate(occurred = as.Date(occurred),
year = year(occurred), month = month(occurred), day = day(occurred))