我有一个使用spring-integration-aws
版本1.1.0.RELEASE
开发的kinesis消费者应用程序。
在我的测试中,我在同一个使用者组中运行此应用程序的两个实例,并从具有两个分片的流中消耗。在我的测试中,我意识到KinesisMessageDrivenChannelAdapter
会以三种方式分发消息:
从生产者方面,消息在两个分片之间均匀分布。我想知道kinesis适配器如何在消费者之间分发消息,如果支持我如何在消费者之间获得均匀分布。
谢谢
更新(适配器配置)
@Bean
public KinesisMessageDrivenChannelAdapter kinesisInboundChannelAdapter(
AmazonKinesis amazonKinesis) {
String[] streamNames = this.consumerClientProperties.getKinesis().getStreamNames();
KinesisMessageDrivenChannelAdapter adapter =
new KinesisMessageDrivenChannelAdapter(amazonKinesis, streamNames);
adapter.setConverter(null);
adapter.setOutputChannel(new QueueChannel());
adapter.setCheckpointStore(dynamoDbMetaDataStore());
adapter.setCheckpointMode(CheckpointMode.record);
adapter.setStartTimeout(10000);
adapter.setConsumerGroup(consumerClientProperties.getName());
adapter.setListenerMode(ListenerMode.record);
adapter.setDescribeStreamRetries(1);
return adapter;
}
@Bean
public DynamoDbMetadataStore dynamoDbMetaDataStore() {
DynamoDbMetadataStore dynamoDbMetaDataStore = new DynamoDbMetadataStore(amazonDynamoDB(),
consumerClientProperties.getName());
return dynamoDbMetaDataStore;
}
建议大家升级到最新的Spring Integration AWS 2.0
:https://spring.io/blog/2018/08/21/spring-integration-for-aws-2-0-ga-and-spring-cloud-stream-kinesis-binder-1-0-ga
在Kinesis消费者层面上做了很多修复,现在我们有一个领导者选举不会多次订阅相同的分片。
我们的想法是在处理记录时进行严格的排序,因此每个集群只有一个线程可以访问一个分片。该线程可能会处理多个分片。
无论如何,如果你使用两个应用程序实例,你需要注入一个基于共享数据的MetadataStore
,例如: DynamoDbMetadataStore
。