Kafka Connect S3动态S3文件夹结构创建?

问题描述 投票:0回答:1

我有manually installed Confluent Kafka Connect S3使用独立方法,而不是通过Confluent的过程或作为整个平台的一部分。

我可以使用以下命令从命令行成功启动连接器:

./kafka_2.11-2.1.0/bin/connect-standalone.sh connect.properties s3-sink.properties

可以看出来自AWS MSK的主题CDC抵消被消费。没有错误被抛出。但是,在AWS S3中,没有为新数据创建文件夹结构,也不存储任何JSON数据。

问题

  1. 连接器是否应该在看到主题的第一个JSON数据包时动态创建文件夹结构?
  2. 除了配置awscli凭证之外,connect.properties和s3-sink.properties还有其他设置需要设置才能正确连接到S3存储桶吗?
  3. 有关安装文档的建议比Confluent网站上的独立文档更全面? (上面链接)

connect.properties

bootstrap.servers =节录:9092,删节:9092,节录:9092

plugin.path = / plugins / kafka-connect-s3 key.converter = org.apache.kafka.connect.json.JsonConverter value.converter = org.apache.kafka.connect.json.JsonConverter key.converter.schemas.enable = false value.converter.schemas.enable = false internal.key.converter = org.apache.kafka.connect.json.JsonConverter internal.value.converter = org.apache.kafka.connect.json.JsonConverter internal.key.converter。 schemas.enable = false internal.value.converter.schemas.enable = false offset.storage.file.filename = / tmp / connect.offsets

是3-斯诺克.properties

name = s3-sink connector.class = io.confluent.connect.s3.S3SinkConnector tasks.max = 1 topics = database_schema_topic1,database_schema_topic2,database_schema_topic3 s3.region = us-east-2 s3.bucket.name = databasekafka s3.part。 size = 5242880 flush.size = 1 storage.class = io.confluent.connect.s3.storage.S3Storage format.class = io.confluent.connect.s3.format.json.JsonFormat schema.generator.class = io.confluent。 connect.storage.hive.schema.DefaultSchemaGenerator partitioner.class = io.confluent.connect.storage.partitioner.DefaultPartitioner schema.compatibility = NONE

amazon-web-services amazon-s3 apache-kafka apache-kafka-connect confluent
1个回答
1
投票

连接器是否应该在看到主题的第一个JSON数据包时动态创建文件夹结构?是的,即使您使用参数“topics.dir”和“path.format”控制此路径(目录结构)

除了配置awscli凭证之外,connect.properties和s3-sink.properties还有其他设置需要设置才能正确连接到S3存储桶吗?默认情况下,S3连接器将通过环境变量或凭证文件使用Aws凭据(访问ID和密钥)。您可以通过修改参数“s3.credentials.provider.class”来进行更改。参数的默认值为“DefaultAWSCredentialsProviderChain”

有关安装文档的建议比Confluent网站上的独立文档更全面? (上面链接)我建议您使用分布式模式,因为它为您的连接群集和在其上运行的连接器提供高可用性。您可以通过以下文档来配置分布式模式下的连接群集。 https://docs.confluent.io/current/connect/userguide.html#connect-userguide-dist-worker-config

© www.soinside.com 2019 - 2024. All rights reserved.