是否有一个火花api来建立火花堆叠合奏或应该从头开始构建它们?我没有在网上找到有关此主题的任何资源
正如在AKSW的评论中所说,在当前的Apache Spark MLlib中,只有两个特定的Ensemble Models实现,其中包括用于Bagging的Random Forests和用于Boosting的Gradient Boosted Trees。
对于堆叠部分,我认为你在MLlib上找不到任何东西,你必须通过以下任何一种方式自己完成:
第二个是方便的,因为它可以作为Tuning Tools使用所有MLlib工具
对于第二个解决方案,我创建了一个包含Boosting,Bagging和Stacking Meta-Estimators的库:spark-ensemble
你可以从中获得一些实现的想法!