Spark 结构化流 Kinesis 数据源

问题描述 投票:0回答:2

是否可以使用 Kinesis 流作为 Spark 结构化流的数据源?我找不到任何可用的连接器。

apache-spark spark-structured-streaming
2个回答
4
投票

Qubole 有一个 kinesis-sql 库正是用于此目的。

https://github.com/qubole/kinesis-sql

然后您可以使用与任何其他 Spark 结构化流源类似的源:

val source = spark
   .readStream
   .format("kinesis")
   .option("streamName", "spark-source-stream")
   .option("endpointUrl", "https://kinesis.us-east-1.amazonaws.com")
   .option("awsAccessKeyId", [YOUR_AWS_ACCESS_KEY_ID])
   .option("awsSecretKey", [YOUR_AWS_SECRET_KEY])
   .option("startingPosition", "TRIM_HORIZON")
   .load

0
投票

这是另一个支持 EFO 的 Spark Structured Streaming kinesis 连接器 https://github.com/awslabs/spark-sql-kinesis-connector/

© www.soinside.com 2019 - 2024. All rights reserved.