我需要数据湖,根据用例应用程序使用不同类型的存储。我有MySQL,Hive,谷歌云存储。我使用Presto作为查询引擎。我想让它成为一站式解决方案,人们可以访问任何类型的数据存储数据?我已经配置MySQL Connector和Hive Connector工作正常。我尝试使用TPCH连接器连接Google云端存储。
这是正确的方法吗?我正确的方向吗?
据我所知,Presto的Google云端存储连接器并不存在。您可以考虑构建一个并回馈开源。或者随时联系Starburst Data(www.starburstdata.com)
不,TPCH连接器(https://docs.starburstdata.com/latest/connector/tpch.html)并不意味着连接到任何真正的存储引擎。相反,它会在运行时为TPC-H基准测试所需的表生成数据。它的主要用途是测试ANSI SQL语法。
您可以尝试设置Minio Server并使用Hive Connector(S3)