跳到主要内容

StarRocks Flink Connector 版本发布说明

通知

用户指南

源代码: starrocks-connector-for-apache-flink

JAR 文件命名格式

  • Flink 1.15 及以上版本: flink-connector-starrocks-${connector_version}_flink-${flink_version}.jar
  • Flink 1.15 之前版本: flink-connector-starrocks-${connector_version}_flink-${flink_version}_${scala_version}.jar

获取 JAR 文件的方法

  • 直接从 Maven Central 仓库 下载 Flink 连接器 JAR 文件。
  • 在您的 Maven 项目的 pom.xml 文件中添加 Flink 连接器作为依赖并下载。有关具体说明,请参阅 用户指南
  • 将源代码编译成 Flink 连接器 JAR 文件。有关具体说明,请参阅 用户指南

版本要求

连接器FlinkStarRocksJavaScala
1.2.121.16,1.17,1.18,1.19,1.202.1 及更高版本82.11,2.12
1.2.111.15,1.16,1.17,1.18,1.19,1.202.1 及更高版本82.11,2.12
1.2.101.15,1.16,1.17,1.18,1.192.1 及更高版本82.11,2.12
1.2.91.15,1.16,1.17,1.182.1 及更高版本82.11,2.12
1.2.81.13,1.14,1.15,1.16,1.172.1 及更高版本82.11,2.12
1.2.71.11,1.12,1.13,1.14,1.152.1 及更高版本82.11,2.12

注意

一般来说,最新版本的 Flink 连接器仅保持与最近三个 Flink 版本的兼容性。

发布说明

1.2

1.2.12

发布日期:2025 年 9 月 19 日

改进
  • 支持为源指定仓库。 #423
  • 添加了安全策略。 #434
  • 对错误日志中的敏感数据进行了净化。 #446
  • 支持为 Stream Load 事务接口配置 prepared_timeout#453
Bug 修复

已修复以下问题:

  • 如果打开失败,源读取器未关闭。 #441
  • StreamLoadManagerV2.flush 中的任何异常导致的错误成功。 #451

1.2.11

发布日期:2025 年 6 月 3 日

功能

  • 支持 CSV 格式的 LZ4 压缩。 #408
  • 添加了对 Flink 1.20 的支持。 #409

改进

  • 添加了一个禁用将 JSON 包装到 JSON 数组中的选项。 #344
  • 更新了 FastJSON 以解决 CVE-2022-25845。 #394
  • 从警告日志中移除了数据行指标,以避免在日志中暴露有效负载。 #420

Bug 修复

  • StarRocksDynamicTableSource 的影子克隆导致的错误下推结果(修复后,将使用 StarRocksDynamicTableSource 的深拷贝)。 #421

1.2.10

功能

  • 支持读取 JSON 列。 #334
  • 支持读取 ARRAY、STRUCT 和 MAP 列。 #347
  • 支持在以 JSON 格式下沉数据时使用 LZ4 压缩。 #354
  • 支持 Flink 1.19。 #379

改进

  • 支持配置套接字超时。 #319
  • Stream Load 事务接口支持异步 preparecommit 操作。 #328
  • 支持将 StarRocks 表中的部分列映射到 Flink 源表。 #352
  • 使用 Stream Load 事务接口时支持设置特定仓库。 #361

Bug 修复

修复了以下问题

  • StarRocksDynamicLookupFunction 中的 StarRocksSourceBeReader 在数据读取完成后未关闭。 #351
  • 将空的 JSON 字符串加载到 JSON 列时抛出异常。 #380

1.2.9

本次发布包含一些新功能和错误修复。最显著的改进是 Flink 连接器与 Flink CDC 3.0 集成,可以轻松地从 CDC 源(如 MySQL 和 Kafka)构建到 StarRocks 的流式 ELT 管道。您可以在 使用 Flink CDC 3.0 同步数据(支持 Schema 变更) 中找到详细信息。

功能

  • 实现 Catalog 以支持 Flink CDC 3.0。 #295
  • FLIP-191 中实现新的 Sink API,以支持 Flink CDC 3.0。 #301
  • 支持 Flink 1.18。 #305

Bug 修复

  • 修复了误导性的线程名称和日志。 #290
  • 修复了写入多个表时使用的错误的 stream-load-sdk 配置。 #298

1.2.8

本次发布包含一些改进和错误修复。主要变更如下:

  • 支持 Flink 1.16 和 1.17。
  • 建议在配置 Sink 时设置 sink.label-prefix 以保证 exactly-once 语义。有关具体说明,请参阅 Exactly Once

改进

  • 支持配置是否使用 Stream Load 事务接口来保证 at-least-once。 #228
  • 为 Sink V1 添加了重试指标。 #229
  • 当 EXISTING_JOB_STATUS 为 FINISHED 时,无需获取 LabelState。 #231
  • 移除 Sink V1 的无用堆栈跟踪日志。 #232
  • [重构] 将 StarRocksSinkManagerV2 移至 stream-load-sdk。 #233
  • 根据 Flink 表的 Schema 自动检测部分更新,而不是用户显式指定的 sink.properties.columns 参数。 #235
  • [重构] 将 probeTransactionStreamLoad 移至 stream-load-sdk。 #240
  • 为 stream-load-sdk 添加 git-commit-id-plugin。 #242
  • 使用 info 日志记录 DefaultStreamLoader#close。 #243
  • 支持生成不含依赖项的 stream-load-sdk JAR 文件。 #245
  • 在 stream-load-sdk 中将 fastjson 替换为 jackson。 #247
  • 支持处理 update_before 记录。 #250
  • 将 Apache 许可证添加到文件中。 #251
  • 支持在 stream-load-sdk 中获取异常。 #252
  • 默认启用 strip_outer_arrayignore_json_size#259
  • 当 Flink 作业恢复且 Sink 语义为 exactly-once 时,尝试清理遗留的事务。 #271
  • 重试失败后返回第一个异常。 #279

Bug 修复

  • 修复 StarRocksStreamLoadVisitor 中的拼写错误。 #230
  • 修复 fastjson 类加载器泄漏。 #260

测试

  • 添加了从 Kafka 加载到 StarRocks 的测试框架。 #249

文档

  • 重构文档。 #262
  • 改进了 Sink 的文档。 #268 #275
  • 为 Sink 添加了 DataStream API 的示例。 #253
开心的水獭 RockyStarRocks 助手

AI 生成的答案基于文档和其他来源。请在非生产环境中测试答案。