当前项目数据源较多,目前各个指标均存放在 MySQL 中,后续可能会同步到 Hive、Hudi 以及 ClickHouse 等数据库中。关于 MySQL 数据全量同步到 Hive 使用的是 DataX,但由于其支持的数据源较少,因此需要调研新的数据集成与同步框架。 在初步对比 flink_cdc 和 seatunnel 之后,考虑使用门槛,先调研 flink_cdc~~