我刚刚开始使用ESRI API来处理GIS数据(shapefiles),我也在使用此代码(https://github.com/mraad/spark-shp)使用spark读取数据(运行scala代码) .
我的问题是,我们如何从形状文件中提取多边形,因为我在文档中找不到它 当我读取 Shapefile 时,我只得到一个带有点而不是多边形的 RDD
可能值得在您的查询中针对相关 GitHub 项目提出问题。维护人员最适合回答您的问题,这可以帮助他们改进文档。
据我所知,您应该得到
DataFrame
而不是 RDD
。因此,也许您使用的方法级别低于预期。 DataFrameReader
上的This扩展方法建议我您应该使用
shp
方法来加载文件并返回 DataFrame
。在同一个文件中,还有另一个 shp
扩展方法出现在该项目 tests 中,显示文件的加载,如下所示:
val results = sparkSession
.sqlContext
.shp(path)
您需要导入包/隐式才能访问这些方法。