更改事件中心和使用者组后,事件中心源连接器抛出“无效偏移”错误

问题描述 投票:0回答:1

我的设置中有一个事件中心源连接器,它最初指向命名空间内的单个分区事件中心。最近,我们决定迁移到新的事件中心,并在同一命名空间内增加分区数量。进行必要的更改后,我为新的事件中心创建了一个新的使用者组。

但是,我的连接工作任务之一遇到了问题,该任务连续失败并出现以下错误:

Caused by: com.microsoft.azure.eventhubs.impl.AmqpException: The supplied offset '34361193416' is invalid. The last offset in the system is '357208'

有趣的是,连接到不同分区的其他任务运行顺利,并按预期处理数据。该问题似乎与新事件中心中用于分区零的旧偏移量有关。我尝试修改容错能力,并通过添加 DLQ 主题来包含毒丸处理机制,但没有成功。

我尝试在Microsoft和Confluence网站上寻找解决方案,但找不到任何相关信息。有其他人遇到过这种行为吗?我该如何解决它以确保数据正确流动而不会造成任何损失?

apache-kafka apache-kafka-connect azure-eventhub
1个回答
0
投票

遇到的错误似乎与在尝试使用新事件中心的数据时使用前一个事件中心的旧偏移量有关,这导致了“无效偏移量”异常。

当切换到分区数量增加的新事件中心时,与每个分区关联的偏移量也会发生变化。但是,连接器似乎卡在分区零的旧偏移上,导致了上述问题。

要解决此问题,您需要重置连接器的偏移。执行此操作的一种方法是将连接器配置文件中的名称参数更改为新的唯一名称。通过执行此操作,连接器将重置其内部状态(包括偏移量),并开始使用新事件中心中正确位置的数据。

请务必遵循以下步骤:

  • 编辑连接器配置文件(通常是 JSON 或属性文件)。
  • 在配置中找到 name 参数并将其值更改为新的唯一名称。例如,如果它最初设置为“my-connector”,您可以将其更改为“my-connector-v2”或任何其他唯一名称。
  • 保存对配置文件的更改后重新启动事件中心源连接器。重新启动后,连接器将开始使用正确的偏移量使用来自新事件中心的数据,并且您不应再遇到“无效偏移量”错误。来自分区零的数据流应该恢复,并且您应该避免接收器主题中任何进一步的数据丢失。

请记住验证连接器的其余配置(例如连接字符串、使用者组和目标接收器主题)是否已为新事件中心正确设置。

请注意,这个解决方案是基于实践经验的,在微软和Confluence的官方文档中并没有明确概述。但是,通过执行以下步骤,我能够成功解决“无效偏移”错误

© www.soinside.com 2019 - 2024. All rights reserved.