为数据库中的多个表配置 debezium 连接器

问题描述 投票:0回答:2

我正在尝试为 MySQL 数据库中的多个表配置 Debezium 连接器(我在 MySQL 8.0 上使用 Debezium 1.4)。 我的公司在kafka中创建主题时需要遵循一个命名模式,并且该模式不允许使用下划线(_),所以我不得不将它们替换为连字符(-)

所以,我的主题名称是:

主题1

fjf.db.top-domain.domain.sub-domain.transaction-search.order-status
WHERE
- transaction-search = schema "transaction_search"
- order-status = table "order_status". 
- All changes in that table, must go to that topic.

主题2

fjf.db.top-domain.domain.sub-domain.transaction-search.shipping-tracking
WHERE
- transaction-search = schema "transaction_search"
- shipping-tracking = table "shipping_tracking"
- All changes in that table, must go to that topic.

主题3

fjf.db.top-domain.domain.sub-domain.transaction-search.proposal
WHERE
- transaction-search = schema "transaction_search"
- proposal = table "proposal"
- All changes in that table, must go to that topic.

我正在尝试使用转换“ByLogicalTableRouter”,但我找不到解决我的情况的正则表达式解决方案。

{ "name": "debezium.connector",
 "config":
    { 
"connector.class": "io.debezium.connector.mysql.MySqlConnector",
"tasks.max": "1",
"database.hostname": "myhostname",
"database.port": "3306",
"database.user": "debezium", 
"database.password": "password", 
"database.server.id": "1000", 
"database.server.name": "fjf.db.top-domain.domain.sub-domain.transaction-search",
"schema.include.list": "transaction_search",
"table.include.list": "transaction_search.order_status,transaction_search.shipping_tracking,transaction_search.proposal",
"database.history.kafka.bootstrap.servers": "kafka.intranet:9097",
"database.history.kafka.topic": "fjf.db.top-domain.domain.sub-domain.transaction-search.schema-history",
"snapshot.mode": "schema_only",
"transforms":"RerouteName,RerouteUnderscore",
"transforms.RerouteName.type":"io.debezium.transforms.ByLogicalTableRouter",
"transforms.RerouteName.topic.regex":"(.*)transaction_search(.*)",
"transforms.RerouteName.topic.replacement": "$1$2" 
"transforms.RerouteUnderscore.type":"io.debezium.transforms.ByLogicalTableRouter",
"transforms.RerouteUnderscore.topic.regex":"(.*)_(.*)",
"transforms.RerouteUnderscore.topic.replacement": "$1-$2" 
    }
}
  • 在第一个转换中,我尝试删除重复的架构 主题路由中的名称。
  • 在第二次变换中,替换所有 仍然是下划线 _ 对于 hiphens -

但是这样,我收到下面的错误,这表明它正在尝试将所有内容发送到同一主题

Caused by: org.apache.kafka.connect.errors.SchemaBuilderException: Cannot create field because of field name duplication __dbz__physicalTableIdentifier

我如何进行转换,将每个表的事件转发到各自的主题?

mysql apache-kafka apache-kafka-connect debezium cdc
2个回答
0
投票
  1. 删除架构名称

在第一个转换中,我尝试删除主题路由中重复的架构名称。

使用正则表达式进行转换后,您将有两个点,因此您需要修复它:

"transforms.RerouteName.topic.regex":"([^.]+)\\.transaction_search\\.([^.]+)",
"transforms.RerouteName.topic.replacement": "$1.$2" 
  1. 替换 hiphens 的下划线

您可以尝试使用Kafka Connect Common Transformations中的ChangeCase SMT。


0
投票

我是初学者,想问一下第二个问题怎么解决,用什么参数,因为我的第二个错误经常出现,而且很多字段以前都出现过

© www.soinside.com 2019 - 2024. All rights reserved.