我试图使用NOAA数据找出一系列日期之间的历史平均温度,并与长期平均温度进行比较。
我正在使用rnoaa包,并且遇到了一些障碍。对于长期平均值,我使用以下语法成功:
library('rnoaa')
start_date = "2010-01-15"
end_date = "2010-11-14"
station_id = "USW00093738"
weather_data <- ncdc(datasetid='NORMAL_DLY', stationid=paste0('GHCND:',station_id),
datatypeid='dly-tavg-normal',
startdate = start_date, enddate = end_date,limit=365)
这让我可以解析weather_data$data
在1月15日到11月14日期间为该站提供的长期平均温度。
但是,我似乎找不到历史平均温度的正确数据集或数据类型。我想获得与上述代码相同的数据,除了那些天的实际日平均温度。知道怎么查询这个吗?我已经在这里呆了几个小时而没有运气。
我试过的东西如下:
weather_data <- ncdc(datasetid='GHCND', stationid=paste0('GHCND:',station_id),
startdate = start_date, enddate = end_date,limit=365)
uniq_d_types = unique(weather_data$data$datatype)
View(uniq_d_types)
这让我看到GHCND数据集中的唯一数据类型,但没有一种数据类型似乎是日平均温度。有什么想法吗?
为了使用rnoaa
包从NOAA数据获得平均每日实际温度,必须使用每小时数据并按天汇总。每小时NOAA数据位于NORMAL_HLY
数据集中,所需数据类型为HLY-TEMP-NORMAL
。
library('rnoaa')
library(lubridate)
options(noaakey = "obtain key from NOAA website")
start_date = "2010-01-15"
end_date = "2010-01-31"
station_id = "USW00093738"
weather_data <- ncdc(datasetid='NORMAL_HLY', stationid=paste0('GHCND:',station_id),
datatypeid = "HLY-TEMP-NORMAL",
startdate = start_date, enddate = end_date,limit=500)
data <- weather_data$data
data$year <- year(data$date)
data$month <- month(data$date)
data$day <- day(data$date)
# summarize to average daily temps
aggregate(value ~ year + month + day,mean,data = data)
......和输出:
> aggregate(value ~ year + month + day,mean,data = data)
year month day value
1 2010 1 15 323.5417
2 2010 1 16 322.8750
3 2010 1 17 323.4167
4 2010 1 18 323.7500
5 2010 1 19 323.2083
6 2010 1 20 321.0833
7 2010 1 21 318.4167
8 2010 1 22 317.6667
9 2010 1 23 319.0000
10 2010 1 24 321.0833
11 2010 1 25 323.5417
12 2010 1 26 326.0833
13 2010 1 27 328.4167
14 2010 1 28 330.9583
15 2010 1 29 333.2917
16 2010 1 30 335.7917
17 2010 1 31 308.0000
>
请注意,此数据集中的温度以十分之一度为单位存储,因此在2010年1月15日至31日期间,杜勒斯国际机场气象站的平均日气温在30.8度至33.5度之间。
另请注意,要通过stationId
计算平均值并在多个气象站运行,只需将station
添加到aggregate()
函数中。
> # summarize to average daily temps by station
> aggregate(value ~ station + year + month + day,mean,data = data)
station year month day value
1 GHCND:USW00093738 2010 1 15 323.5417
2 GHCND:USW00093738 2010 1 16 322.8750
3 GHCND:USW00093738 2010 1 17 323.4167
4 GHCND:USW00093738 2010 1 18 323.7500
5 GHCND:USW00093738 2010 1 19 323.2083
6 GHCND:USW00093738 2010 1 20 321.0833
7 GHCND:USW00093738 2010 1 21 318.4167
8 GHCND:USW00093738 2010 1 22 317.6667
9 GHCND:USW00093738 2010 1 23 319.0000
10 GHCND:USW00093738 2010 1 24 321.0833
11 GHCND:USW00093738 2010 1 25 323.5417
12 GHCND:USW00093738 2010 1 26 326.0833
13 GHCND:USW00093738 2010 1 27 328.4167
14 GHCND:USW00093738 2010 1 28 330.9583
15 GHCND:USW00093738 2010 1 29 333.2917
16 GHCND:USW00093738 2010 1 30 335.7917
17 GHCND:USW00093738 2010 1 31 308.0000
>
答案是从NOAA的ISD数据库中获取历史(意味着实际的,在指定的当天 - 不是长期平均值)天气数据。通过查看此处的isd-history.csv
文件可以找到USAF和WBAN值:
ftp://ftp.ncdc.noaa.gov/pub/data/noaa
这是一个示例查询。
out <- isd(usaf='724030', wban = '93738', year=2018)
这将从ISD映射中获取多年的每小时天气数据。然后,您可以根据自己的需要解析/处理这些数据(例如,像我这样的每日平均温度)。