区域统计量计算像素份额并确定R中最频繁的类别

Question

我已经在此处发布了一个相关的问题：Zonal statistics to get majority pixel value per polygon in R?，但是这次我想确定SpatialPolygonsDataFrame中不同多边形中权重份额最高的像素类。（类似于QGIS插件：区域统计>多数）出于统计原因，在我的实际数据集中，我想将每个多边形的末尾的主要类分配给@data插槽。

具有一些代码：

set.seed(6)
# Create interger class raster
r <- raster(ncol=36, nrow=18)
r[] <- round(runif(ncell(r),1,10),digits=0)
r[]<-as.integer(r[])
# Create two polygons
cds1 <- rbind(c(-180,-20), c(-160,5), c(-60, 0), c(-160,-60), c(-180,-20))
cds2 <- rbind(c(80,0), c(50,30), c(60,0), c(60,-25))
polys <- SpatialPolygonsDataFrame(SpatialPolygons(list(Polygons(list(Polygon(cds1)), 1), 
Polygons(list(Polygon(cds2)),2))),data.frame(ID=c(1,2)))

# Extract raster values to polygons                             
v <- extract(r, polys, weights = TRUE)

到目前为止，一切都很好，但是在另一个问题中，我对于每个列表元素只有一个值向量，因此可以计算频率并确定具有最高份额的类的名称。

这次，我在列表中有两列：（如何在列表内调用这种数据结构？是矩阵还是列表索引？）：

[[1]]
...
[[2]]
     value      weight
[1,]    10 0.066071429
[2,]     9 0.085714286
[3,]     8 0.098214286
[4,]     4 0.026785714
[5,]     4 0.178571429
[6,]     2 0.098214286
[7,]     3 0.178571429
[8,]     2 0.107142857
[9,]     3 0.137500000
[10,]     3 0.005357143
[11,]     6 0.017857143

例如，如何运行dplyr::group_by()和summarise()。我用dplyr::summarize_at尝试了不同的方法，但是我很困惑如何处理此数据类型。

Answer 1

v列表的主要问题是每个条目都是一个类matrix对象。因此，您需要先将每个列表条目转换为data.frame，然后才能使用dplyr功能。

library(dplyr)

#Each entry in the list is a matrix object
class(v[[1]])
#[1] "matrix"

#Thus, you need to transform every entry to data.frame
v<-lapply(v, function(x) as.data.frame(x))
#Then set a name for every list entry, in order to use bind_rows
names(v)<-c("1","2")
#use bind_rows
df<-bind_rows(v, .id = "id")
#Get the most frequent class and its frequency
df %>%
  group_by(id,value) %>%
  count() %>%
  ungroup()%>%
  group_by(id)%>%
  summarize(most_freqclass = value[which(n == max(n))],
            max_freq = max(n))

区域统计量计算像素份额并确定R中最频繁的类别

问题描述投票：0回答：1

1个回答

最新问题

区域统计量计算像素份额并确定R中最频繁的类别

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1