我已将数据加载到elasticsearch中。 如何在 h2o 中获取 elasticsearch 数据?
没有直接的方法或API可用于将数据从elasticsearch加载到H2O中。 h2o支持文件和JDBC,因此您可以将数据从ES写入CSV文件。然后使用 POST /3/ImportFiles 将数据导入 h2o。您可以参考我的相关答案how to create an h2oframe
对此我会直言不讳。其中之一是询问 ETL 流程。基本上,您所做的就是将索引作为 csv 导出到 hadoop、云存储桶或 SQL 数据库中,然后按照各种教程之一将数据集导入到 h2o 中。
就我个人而言,我只是使用 Airflow DAG 从 ELK 导出,将其转换为 pandas 数据帧,然后将数据帧上传到 PostgreSQL 数据库;然后使用 h2o 波脚本进行跟踪,该脚本会随着数据库中新数据的 Airflow DAG 被触发。
人们也可以使用一堆 bash 脚本和 cron 作业来完成这一切。
最新版本的elasticsearch带有sql接口,可以通过jdbc或odbc连接。我没有尝试过将其与 H2O 一起使用,但理论上......