跳到主要内容
版本: 最新版本-3.5

FE 配置

FE 参数分为动态参数和静态参数。

  • 动态参数可以通过运行 SQL 命令进行配置和调整,非常方便。但是,如果您重新启动 FE,这些配置将失效。因此,我们建议您也修改 **fe.conf** 文件中的配置项,以防止修改丢失。

  • 静态参数只能在 FE 配置文件 **fe.conf** 中进行配置和调整。**修改此文件后,您必须重新启动 FE 才能使更改生效。**

参数是否为动态参数由 ADMIN SHOW CONFIG 的输出中的 IsMutable 列指示。TRUE 表示动态参数。

请注意,动态和静态 FE 参数都可以在 **fe.conf** 文件中配置。

查看 FE 配置项

FE 启动后,您可以在 MySQL 客户端上运行 ADMIN SHOW FRONTEND CONFIG 命令来检查参数配置。如果要查询特定参数的配置,请运行以下命令

ADMIN SHOW FRONTEND CONFIG [LIKE "pattern"];

有关返回字段的详细说明,请参见 ADMIN SHOW CONFIG

注意

您必须具有管理员权限才能运行集群管理相关命令。

配置 FE 参数

配置 FE 动态参数

您可以使用 ADMIN SET FRONTEND CONFIG 配置或修改 FE 动态参数的设置。

ADMIN SET FRONTEND CONFIG ("key" = "value");
注意

使用 ADMIN SET FRONTEND 进行的配置更改将在 FE 重启后恢复为 fe.conf 文件中的默认值。因此,如果您希望更改永久生效,我们建议您也修改 fe.conf 中的配置项。

配置 FE 静态参数

注意

FE 的静态参数通过在配置文件 **fe.conf** 中更改它们并重新启动 FE 以使更改生效来设置。

了解 FE 参数

日志记录

log_roll_size_mb
  • 默认值:1024
  • 类型:Int
  • 单位:MB
  • 是否可变:否
  • 描述:系统日志文件或审计日志文件的最大大小。
  • 引入版本:-
sys_log_dir
  • 默认值:StarRocksFE.STARROCKS_HOME_DIR + "/log"
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:存储系统日志文件的目录。
  • 引入版本:-
sys_log_level
  • 默认值:INFO
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:系统日志条目的严重性级别分类。有效值:INFOWARNERRORFATAL
  • 引入版本:-
sys_log_roll_num
  • 默认值:10
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:在 sys_log_roll_interval 参数指定的每个保留期内可以保留的系统日志文件的最大数量。
  • 引入版本:-
sys_log_verbose_modules
  • 默认值:空字符串
  • 类型:String[]
  • 单位:-
  • 是否可变:否
  • 描述:StarRocks 为其生成系统日志的模块。如果此参数设置为 org.apache.starrocks.catalog,则 StarRocks 仅为 catalog 模块生成系统日志。使用逗号 (,) 和空格分隔模块名称。
  • 引入版本:-
sys_log_roll_interval
  • 默认值:DAY
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:StarRocks 轮换系统日志条目的时间间隔。有效值:DAYHOUR
    • 如果此参数设置为 DAY,则在系统日志文件的名称中添加 yyyyMMdd 格式的后缀。
    • 如果此参数设置为 HOUR,则在系统日志文件的名称中添加 yyyyMMddHH 格式的后缀。
  • 引入版本:-
sys_log_delete_age
  • 默认值:7d
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:系统日志文件的保留期。默认值 7d 指定每个系统日志文件可以保留 7 天。StarRocks 检查每个系统日志文件并删除 7 天前生成的日志文件。
  • 引入版本:-
audit_log_dir
  • 默认值:StarRocksFE.STARROCKS_HOME_DIR + "/log"
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:存储审计日志文件的目录。
  • 引入版本:-
audit_log_roll_num
  • 默认值:90
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:在 audit_log_roll_interval 参数指定的每个保留期内可以保留的审计日志文件的最大数量。
  • 引入版本:-
audit_log_modules
  • 默认值:slow_query, query
  • 类型:String[]
  • 单位:-
  • 是否可变:否
  • 描述:StarRocks 为其生成审计日志条目的模块。默认情况下,StarRocks 为 slow_query 模块和 query 模块生成审计日志。从 v3.0 开始支持 connection 模块。使用逗号 (,) 和空格分隔模块名称。
  • 引入版本:-
qe_slow_log_ms
  • 默认值:5000
  • 类型:Long
  • 单位:毫秒
  • 是否可变:是
  • 描述:用于确定查询是否为慢查询的阈值。如果查询的响应时间超过此阈值,则将其记录为 **fe.audit.log** 中的慢查询。
  • 引入版本:-
audit_log_roll_interval
  • 默认值:DAY
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:StarRocks 轮换审计日志条目的时间间隔。有效值:DAYHOUR
    • 如果此参数设置为 DAY,则在审计日志文件的名称中添加 yyyyMMdd 格式的后缀。
    • 如果此参数设置为 HOUR,则在审计日志文件的名称中添加 yyyyMMddHH 格式的后缀。
  • 引入版本:-
audit_log_delete_age
  • 默认值:30d
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:审计日志文件的保留期。默认值 30d 指定每个审计日志文件可以保留 30 天。StarRocks 检查每个审计日志文件并删除 30 天前生成的日志文件。
  • 引入版本:-
dump_log_dir
  • 默认值:StarRocksFE.STARROCKS_HOME_DIR + "/log"
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:存储 dump 日志文件的目录。
  • 引入版本:-
dump_log_roll_num
  • 默认值:10
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:在 dump_log_roll_interval 参数指定的每个保留期内可以保留的 dump 日志文件的最大数量。
  • 引入版本:-
dump_log_modules
  • 默认值:query
  • 类型:String[]
  • 单位:-
  • 是否可变:否
  • 描述:StarRocks 为其生成 dump 日志条目的模块。默认情况下,StarRocks 为 query 模块生成 dump 日志。使用逗号 (,) 和空格分隔模块名称。
  • 引入版本:-
dump_log_roll_interval
  • 默认值:DAY
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:StarRocks 轮换 dump 日志条目的时间间隔。有效值:DAYHOUR
    • 如果此参数设置为 DAY,则在 dump 日志文件的名称中添加 yyyyMMdd 格式的后缀。
    • 如果此参数设置为 HOUR,则在 dump 日志文件的名称中添加 yyyyMMddHH 格式的后缀。
  • 引入版本:-
dump_log_delete_age
  • 默认值:7d
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:dump 日志文件的保留期。默认值 7d 指定每个 dump 日志文件可以保留 7 天。StarRocks 检查每个 dump 日志文件并删除 7 天前生成的日志文件。
  • 引入版本:-

服务器

frontend_address
  • 默认值:0.0.0.0
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:FE 节点的 IP 地址。
  • 引入版本:-
priority_networks
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:声明具有多个 IP 地址的服务器的选择策略。请注意,最多一个 IP 地址必须与此参数指定的列表匹配。此参数的值是一个列表,该列表由以 CIDR 表示法表示的条目组成,这些条目用分号 (;) 分隔,例如 10.10.10.0/24。如果没有 IP 地址与此列表中的条目匹配,则将随机选择服务器的可用 IP 地址。从 v3.3.0 开始,StarRocks 支持基于 IPv6 的部署。如果服务器同时具有 IPv4 和 IPv6 地址,并且未指定此参数,则系统默认使用 IPv4 地址。您可以通过将 net_use_ipv6_when_priority_networks_empty 设置为 true 来更改此行为。
  • 引入版本:-
net_use_ipv6_when_priority_networks_empty
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:否
  • 描述:一个布尔值,用于控制在未指定 priority_networks 时是否优先使用 IPv6 地址。true 表示当托管节点的服务器同时具有 IPv4 和 IPv6 地址并且未指定 priority_networks 时,允许系统优先使用 IPv6 地址。
  • 引入版本:v3.3.0
http_port
  • 默认值:8030
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:FE 节点中的 HTTP 服务器侦听的端口。
  • 引入版本:-
http_worker_threads_num
  • 默认值:0
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:http 服务器处理 http 请求的工作线程数。对于负值或 0 值,线程数将是 cpu 核心数的两倍。
  • 引入版本:v2.5.18, v3.0.10, v3.1.7, v3.2.2
http_backlog_num
  • 默认值:1024
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:FE 节点中 HTTP 服务器保存的 backlog 队列的长度。
  • 引入版本:-
enable_http_async_handler
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否允许系统异步处理 HTTP 请求。如果启用此功能,Netty 工作线程收到的 HTTP 请求将被提交到单独的线程池进行服务逻辑处理,以避免阻塞 HTTP 服务器。如果禁用,Netty 工作线程将处理服务逻辑。
  • 引入版本:4.0.0
http_async_threads_num
  • 默认值:4096
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:用于异步 HTTP 请求处理的线程池的大小。别名为 max_http_sql_service_task_threads_num
  • 引入版本:4.0.0
cluster_name
  • 默认值:StarRocks Cluster
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:FE 所属的 StarRocks 集群的名称。集群名称显示为网页上的 Title
  • 引入版本:-
rpc_port
  • 默认值:9020
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:FE 节点中的 Thrift 服务器侦听的端口。
  • 引入版本:-
thrift_server_max_worker_threads
  • 默认值:4096
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:FE 节点中的 Thrift 服务器支持的最大工作线程数。
  • 引入版本:-
thrift_server_queue_size
  • 默认值:4096
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:请求正在等待的队列的长度。如果 Thrift 服务器中正在处理的线程数超过 thrift_server_max_worker_threads 中指定的值,则将新请求添加到等待队列。
  • 引入版本:-
thrift_client_timeout_ms
  • 默认值:5000
  • 类型:Int
  • 单位:毫秒
  • 是否可变:否
  • 描述:空闲客户端连接超时的时长。
  • 引入版本:-
thrift_backlog_num
  • 默认值:1024
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:FE 节点中 Thrift 服务器保存的 backlog 队列的长度。
  • 引入版本:-
brpc_idle_wait_max_time
  • 默认值:10000
  • 类型:Int
  • 单位:毫秒
  • 是否可变:否
  • 描述:bRPC 客户端在空闲状态下等待的最大时长。
  • 引入版本:-
query_port
  • 默认值:9030
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:FE 节点中的 MySQL 服务器侦听的端口。
  • 引入版本:-
mysql_nio_backlog_num
  • 默认值:1024
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:FE 节点中 MySQL 服务器保存的 backlog 队列的长度。
  • 引入版本:-
mysql_service_nio_enable_keep_alive
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:否
  • 描述:为 MySQL 连接启用 TCP Keep-Alive。对于负载均衡器后面的长时间空闲连接很有用。
  • 引入版本:-
mysql_service_io_threads_num
  • 默认值:4
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:FE 节点中 MySQL 服务器可以运行以处理 I/O 事件的最大线程数。
  • 引入版本:-
max_mysql_service_task_threads_num
  • 默认值:4096
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:FE 节点中 MySQL 服务器可以运行以处理任务的最大线程数。
  • 引入版本:-
mysql_server_version
  • 默认值:8.0.33
  • 类型:String
  • 单位:-
  • 是否可变:是
  • 描述:返回给客户端的 MySQL 服务器版本。修改此参数将影响以下情况中的版本信息
    1. select version();
    2. 握手数据包版本
    3. 全局变量 version 的值(show variables like 'version';
  • 引入版本:-
qe_max_connection
  • 默认值:4096
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:所有用户可以与 FE 节点建立的最大连接数。从 v3.1.12 和 v3.2.7 开始,默认值已从 1024 更改为 4096
  • 引入版本:-

元数据和集群管理

cluster_id
  • 默认值:-1
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:FE 所属的 StarRocks 集群的 ID。具有相同集群 ID 的 FE 或 BE 属于同一 StarRocks 集群。有效值:任何正整数。默认值 -1 指定 StarRocks 将在集群的 leader FE 首次启动时为 StarRocks 集群生成一个随机集群 ID。
  • 引入版本:-
meta_dir
  • 默认值:StarRocksFE.STARROCKS_HOME_DIR + "/meta"
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:存储元数据的目录。
  • 引入版本:-
edit_log_type
  • 默认值:BDB
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:可以生成的编辑日志的类型。将值设置为 BDB
  • 引入版本:-
edit_log_port
  • 默认值:9010
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:用于集群中 Leader、Follower 和 Observer FE 之间通信的端口。
  • 引入版本:-
edit_log_roll_num
  • 默认值:50000
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:在为这些日志条目创建日志文件之前可以写入的最大元数据日志条目数。此参数用于控制日志文件的大小。新日志文件写入 BDBJE 数据库。
  • 引入版本:-
metadata_ignore_unknown_operation_type
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否忽略未知日志 ID。回滚 FE 时,早期版本的 FE 可能无法识别某些日志 ID。如果值为 TRUE,则 FE 忽略未知日志 ID。如果值为 FALSE,则 FE 退出。
  • 引入版本:-
meta_delay_toleration_second
  • 默认值:300
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:follower 和 observer FE 上的元数据可以落后于 leader FE 上的元数据的最大持续时间。单位:秒。如果超过此持续时间,则非 leader FE 将停止提供服务。
  • 引入版本:-
master_sync_policy
  • 默认值:SYNC

  • 类型:String

  • 单位:-

  • 是否可变:否

  • 描述:leader FE 将日志刷新到磁盘所依据的策略。此参数仅在当前 FE 为 leader FE 时有效。有效值

    • SYNC:提交事务时,会生成一个日志条目并同时刷新到磁盘。
    • NO_SYNC:在提交事务时,不会同时生成和刷新日志条目。
    • WRITE_NO_SYNC:提交事务时,会同时生成日志条目,但不会刷新到磁盘。

    如果您只部署了一个 follower FE,我们建议您将此参数设置为 SYNC。如果您部署了三个或更多 follower FE,我们建议您将此参数和 replica_sync_policy 都设置为 WRITE_NO_SYNC

  • 引入版本:-

replica_sync_policy
  • 默认值:SYNC
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:follower FE 将日志刷新到磁盘所依据的策略。此参数仅在当前 FE 为 follower FE 时有效。有效值
    • SYNC:提交事务时,会生成一个日志条目并同时刷新到磁盘。
    • NO_SYNC:在提交事务时,不会同时生成和刷新日志条目。
    • WRITE_NO_SYNC:提交事务时,会同时生成日志条目,但不会刷新到磁盘。
  • 引入版本:-
replica_ack_policy
  • 默认值:SIMPLE_MAJORITY
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:日志条目被视为有效的策略。默认值 SIMPLE_MAJORITY 指定如果大多数 follower FE 返回 ACK 消息,则日志条目被视为有效。
  • 引入版本:-
bdbje_heartbeat_timeout_second
  • 默认值:30
  • 类型:Int
  • 单位:秒
  • 是否可变:否
  • 描述:StarRocks 集群中 leader、follower 和 observer FE 之间的心跳超时的时间量。
  • 引入版本:-
bdbje_replica_ack_timeout_second
  • 默认值:10
  • 类型:Int
  • 单位:秒
  • 是否可变:否
  • 描述:当元数据从 leader FE 写入 follower FE 时,leader FE 可以等待来自指定数量的 follower FE 的 ACK 消息的最大时长。单位:秒。如果要写入大量元数据,则 follower FE 需要很长时间才能将 ACK 消息返回到 leader FE,从而导致 ACK 超时。在这种情况下,元数据写入失败,FE 进程退出。我们建议您增加此参数的值以防止这种情况。
  • 引入版本:-
bdbje_lock_timeout_second
  • 默认值:1
  • 类型:Int
  • 单位:秒
  • 是否可变:否
  • 描述:基于 BDB JE 的 FE 中锁超时的时长。
  • 引入版本:-
bdbje_reset_election_group
  • 默认值:false
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:是否重置 BDBJE 复制组。如果此参数设置为 TRUE,则 FE 将重置 BDBJE 复制组(即删除所有可选 FE 节点的信息)并作为 leader FE 启动。重置后,此 FE 将是集群中唯一的成员,其他 FE 可以使用 ALTER SYSTEM ADD/DROP FOLLOWER/OBSERVER 'xxx' 重新加入此集群。仅当无法选举 leader FE 因为大多数 follower FE 的数据已损坏时才使用此设置。reset_election_group 用于替换 metadata_failure_recovery
  • 引入版本:-
max_bdbje_clock_delta_ms
  • 默认值:5000
  • 类型:Long
  • 单位:毫秒
  • 是否可变:否
  • 描述:StarRocks 集群中 leader FE 和 follower 或 observer FE 之间允许的最大时钟偏移。
  • 引入版本:-
txn_rollback_limit
  • 默认值:100
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:可以回滚的最大事务数。
  • 引入版本:-
heartbeat_mgr_threads_num
  • 默认值:8
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:Heartbeat Manager 可以运行以运行心跳任务的线程数。
  • 引入版本:-
heartbeat_mgr_blocking_queue_size
  • 默认值:1024
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:存储由 Heartbeat Manager 运行的心跳任务的阻塞队列的大小。
  • 引入版本:-
catalog_try_lock_timeout_ms
  • 默认值:5000
  • 类型:Long
  • 单位:毫秒
  • 是否可变:是
  • 描述:获取全局锁的超时持续时间。
  • 引入版本:-
ignore_materialized_view_error
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:FE 是否忽略由物化视图错误引起的元数据异常。如果 FE 由于物化视图错误引起的元数据异常而无法启动,您可以将此参数设置为 true 以允许 FE 忽略该异常。
  • 引入版本:v2.5.10
ignore_meta_check
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:非 Leader FE 是否忽略来自 Leader FE 的元数据差距。如果值为 TRUE,则非 Leader FE 将忽略来自 Leader FE 的元数据差距并继续提供数据读取服务。即使您长时间停止 Leader FE,此参数也可确保连续的数据读取服务。如果值为 FALSE,则非 Leader FE 不会忽略来自 Leader FE 的元数据差距并停止提供数据读取服务。
  • 引入版本:-
drop_backend_after_decommission
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否在 BE 退役后删除 BE。TRUE 表示 BE 在退役后立即删除。FALSE 表示 BE 在退役后不删除。
  • 引入版本:-
enable_collect_query_detail_info
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否收集查询的 Profile。如果此参数设置为 TRUE,则系统将收集查询的 Profile。如果此参数设置为 FALSE,则系统不会收集查询的 Profile。
  • 引入版本:-
profile_info_format
  • 默认值:default
  • 类型:String
  • 单位:-
  • 是否可变:是
  • 描述:系统输出的 Profile 的格式。有效值:defaultjson。设置为 default 时,Profile 为默认格式。设置为 json 时,系统以 JSON 格式输出 Profile。
  • 引入版本:v2.5
enable_background_refresh_connector_metadata
  • 默认值:在 v3.0 及更高版本中为 true,在 v2.5 中为 false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否启用定期 Hive 元数据缓存刷新。启用后,StarRocks 会轮询 Hive 集群的元存储(Hive Metastore 或 AWS Glue),并刷新频繁访问的 Hive catalog 的缓存元数据以感知数据更改。true 表示启用 Hive 元数据缓存刷新,false 表示禁用它。
  • 引入版本:v2.5.5
background_refresh_metadata_interval_millis
  • 默认值:600000
  • 类型:Int
  • 单位:毫秒
  • 是否可变:是
  • 描述:两次连续 Hive 元数据缓存刷新之间的时间间隔。
  • 引入版本:v2.5.5
background_refresh_metadata_time_secs_since_last_access_secs
  • 默认值:3600 * 24
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:Hive 元数据缓存刷新任务的到期时间。对于已访问的 Hive catalog,如果超过指定时间未访问,StarRocks 将停止刷新其缓存的元数据。对于未访问的 Hive catalog,StarRocks 不会刷新其缓存的元数据。
  • 引入版本:v2.5.5
enable_statistics_collect_profile
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否为统计信息查询生成 Profile。您可以将此项设置为 true 以允许 StarRocks 为系统统计信息的查询生成查询 Profile。
  • 引入版本:v3.1.5

metadata_enable_recovery_mode

  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:否
  • 描述:是否启用元数据恢复模式。启用此模式后,如果集群的部分元数据丢失,可以基于BE的信息进行恢复。目前,仅可以恢复分区的版本信息。
  • 引入版本:v3.3.0
black_host_history_sec
  • 默认值:2 * 60
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:BE节点历史连接失败信息在BE黑名单中的保留时间。如果一个BE节点被自动添加到BE黑名单中,StarRocks会评估其连接性,并判断是否可以从BE黑名单中移除。在black_host_history_sec内,只有当黑名单中的BE节点的连接失败次数少于black_host_connect_failures_within_time中设置的阈值时,才能从BE黑名单中移除。
  • 引入版本:v3.3.0
black_host_connect_failures_within_time
  • 默认值:5
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:黑名单中的BE节点允许的连接失败次数阈值。如果一个BE节点被自动添加到BE黑名单中,StarRocks会评估其连接性,并判断是否可以从BE黑名单中移除。在black_host_history_sec内,只有当黑名单中的BE节点的连接失败次数少于black_host_connect_failures_within_time中设置的阈值时,才能从BE黑名单中移除。
  • 引入版本:v3.3.0

lock_manager_enabled

  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:否
  • 描述:是否启用锁管理器。锁管理器对锁进行集中管理。例如,它可以控制是否将元数据锁的粒度从数据库级别细化到表级别。
  • 引入版本:v3.3.0
lock_manager_enable_using_fine_granularity_lock
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:否
  • 描述:是否将元数据锁的粒度从数据库级别细化到表级别。将元数据锁细化到表级别后,可以减少锁冲突和争用,从而提高负载和查询并发性。此参数仅在启用lock_manager_enabled时生效。
  • 引入版本:v3.3.0
enable_legacy_compatibility_for_replication
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否启用复制的旧版兼容性。StarRocks在旧版本和新版本之间可能表现不同,从而导致跨集群数据迁移期间出现问题。因此,您必须在数据迁移之前启用目标集群的旧版兼容性,并在数据迁移完成后禁用它。true表示启用此模式。
  • 引入于:v3.1.10, v3.2.6
automated_cluster_snapshot_interval_seconds
  • 默认值:600
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:触发自动集群快照任务的时间间隔。
  • 引入于:v3.4.2

用户、角色和权限

privilege_max_total_roles_per_user
  • 默认值:64
  • 类型:Int
  • 单位
  • 是否可变:是
  • 描述:用户可以拥有的最大角色数。
  • 引入于:v3.0.0
privilege_max_role_depth
  • 默认值:16
  • 类型:Int
  • 单位
  • 是否可变:是
  • 描述:角色的最大角色深度(继承级别)。
  • 引入于:v3.0.0

查询引擎

publish_version_interval_ms
  • 默认值:10
  • 类型:Int
  • 单位:毫秒
  • 是否可变:否
  • 描述:发布验证任务的发布时间间隔。
  • 引入版本:-
statistic_cache_columns
  • 默认值:100000
  • 类型:Long
  • 单位:-
  • 是否可变:否
  • 描述:统计信息表可以缓存的行数。
  • 引入版本:-
statistic_cache_thread_pool_size
  • 默认值:10
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:用于刷新统计信息缓存的线程池大小。
  • 引入版本:-
max_allowed_in_element_num_of_delete
  • 默认值:10000
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:DELETE语句中IN谓词允许的最大元素数量。
  • 引入版本:-
enable_materialized_view
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否启用物化视图的创建。
  • 引入版本:-
enable_materialized_view_spill
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否为物化视图刷新任务启用中间结果溢写。
  • 引入于:v3.1.1
enable_backup_materialized_view
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:备份或还原特定数据库时,是否启用异步物化视图的BACKUP和RESTORE。如果此项设置为false,StarRocks将跳过备份异步物化视图。
  • 引入于:v3.2.0
enable_experimental_mv
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否启用异步物化视图功能。TRUE表示启用此功能。从v2.5.2开始,默认情况下启用此功能。对于早于v2.5.2的版本,默认情况下禁用此功能。
  • 引入于:v2.4
enable_colocate_mv_index
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:创建同步物化视图时,是否支持将同步物化视图索引与基表并置。如果此项设置为true,则tablet sink将加快同步物化视图的写入性能。
  • 引入于:v3.2.0
default_mv_refresh_immediate
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否在创建后立即刷新异步物化视图。如果此项设置为true,则新创建的物化视图将立即刷新。
  • 引入于:v3.2.3
enable_materialized_view_metrics_collect
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:默认情况下是否收集异步物化视图的监控指标。
  • 引入于:v3.1.11, v3.2.5
enable_materialized_view_text_based_rewrite
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:默认情况下是否启用基于文本的查询重写。如果此项设置为true,则系统会在创建异步物化视图时构建抽象语法树。
  • 引入于:v3.2.5
enable_mv_automatic_active_check
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否启用系统自动检查并重新激活由于基表(视图)经历了Schema Change或已被删除并重新创建而设置为非活动的异步物化视图。请注意,此功能不会重新激活用户手动设置为非活动的物化视图。
  • 引入于:v3.1.6
enable_active_materialized_view_schema_strict_check
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:激活非活动物化视图时,是否严格检查数据类型长度的一致性。如果此项设置为false,则如果基表中数据类型的长度已更改,则物化视图的激活不会受到影响。
  • 引入于:v3.3.4
mv_active_checker_interval_seconds
  • 默认值:60
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:当启用后台active_checker线程时,系统将定期检测并自动重新激活由于架构更改或基表(或视图)的重建而变为非活动的物化视图。此参数控制检查器线程的调度间隔,以秒为单位。默认值由系统定义。
  • 引入于:v3.1.6
default_mv_partition_refresh_number
  • 默认值:1
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:当物化视图刷新涉及多个分区时,此参数控制默认情况下在单个批次中刷新多少个分区。从 3.3.0 版本开始,系统默认一次刷新一个分区,以避免潜在的内存不足 (OOM) 问题。在早期版本中,默认情况下一次刷新所有分区,这可能导致内存耗尽和任务失败。但是,请注意,当物化视图刷新涉及大量分区时,一次仅刷新一个分区可能会导致过多的调度开销、更长的总体刷新时间以及大量的刷新记录。在这种情况下,建议适当调整此参数,以提高刷新效率并降低调度成本。
  • 引入版本:v3.3.0
enable_udf
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:否
  • 描述:是否启用UDF。
  • 引入版本:-
enable_decimal_v3
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否支持DECIMAL V3数据类型。
  • 引入版本:-
enable_sql_blacklist
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否启用SQL查询的黑名单检查。启用此功能后,无法执行黑名单中的查询。
  • 引入版本:-
dynamic_partition_enable
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否启用动态分区功能。启用此功能后,StarRocks会动态地为新数据创建分区,并自动删除过期分区,以确保数据的新鲜度。
  • 引入版本:-
dynamic_partition_check_interval_seconds
  • 默认值:600
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:检查新数据的时间间隔。如果检测到新数据,StarRocks会自动为数据创建分区。
  • 引入版本:-
max_query_retry_time
  • 默认值:2
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:FE上查询重试的最大次数。
  • 引入版本:-
max_create_table_timeout_second
  • 默认值:600
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:创建表的最大超时时长。
  • 引入版本:-
create_table_max_serial_replicas
  • 默认值:128
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:要串行创建的最大副本数。如果实际副本数超过此值,则将并发创建副本。如果表的创建花费很长时间才能完成,请尝试减小此值。
  • 引入版本:-
http_slow_request_threshold_ms
  • 默认值:5000
  • 类型:Int
  • 单位:毫秒
  • 是否可变:是
  • 描述:如果HTTP请求的响应时间超过此参数指定的值,则会生成日志来跟踪此请求。
  • 引入于:v2.5.15, v3.1.5
max_partitions_in_one_batch
  • 默认值:4096
  • 类型:Long
  • 单位:-
  • 是否可变:是
  • 描述:批量创建分区时可以创建的最大分区数。
  • 引入版本:-
max_running_rollup_job_num_per_table
  • 默认值:1
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:一个表可以并行运行的最大汇总作业数。
  • 引入版本:-
expr_children_limit
  • 默认值:10000
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:表达式中允许的最大子表达式数。
  • 引入版本:-
max_planner_scalar_rewrite_num
  • 默认值:100000
  • 类型:Long
  • 单位:-
  • 是否可变:是
  • 描述:优化器可以重写标量运算符的最大次数。
  • 引入版本:-
max_scalar_operator_optimize_depth
  • 默认值:256
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:ScalarOperator优化可以应用的最大深度。
  • 引入版本:-
max_scalar_operator_flat_children
  • 默认值:10000
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:ScalarOperator的最大平面子节点数。您可以设置此限制以防止优化器使用过多内存。
  • 引入版本:-
enable_statistic_collect
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否为CBO收集统计信息。默认情况下启用此功能。
  • 引入版本:-
enable_statistic_collect_on_first_load
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否在首次将数据加载到表中时自动收集统计信息。如果一个表有多个分区,则任何将数据加载到此表的空分区都会触发对此分区的自动统计信息收集。如果频繁创建新表并且频繁加载数据,则内存和CPU开销将会增加。
  • 引入于:v3.1
statistic_auto_analyze_start_time
  • 默认值:00:00:00
  • 类型:String
  • 单位:-
  • 是否可变:是
  • 描述:自动收集的开始时间。取值范围:00:00:00 - 23:59:59
  • 引入版本:-
statistic_auto_analyze_end_time
  • 默认值:23:59:59
  • 类型:String
  • 单位:-
  • 是否可变:是
  • 描述:自动收集的结束时间。取值范围:00:00:00 - 23:59:59
  • 引入版本:-
statistic_analyze_status_keep_second
  • 默认值:3 * 24 * 3600
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:保留收集任务历史记录的持续时间。默认值为3天。
  • 引入版本:-
statistic_collect_interval_sec
  • 默认值:5 * 60
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:在自动收集中检查数据更新的时间间隔。
  • 引入版本:-
statistic_update_interval_sec
  • 默认值:24 * 60 * 60
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:统计信息缓存的更新时间间隔。
  • 引入版本:-
enable_collect_full_statistic
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否启用自动完整统计信息收集。默认情况下启用此功能。
  • 引入版本:-
statistic_auto_collect_ratio
  • 默认值:0.8
  • 类型:Double
  • 单位:-
  • 是否可变:是
  • 描述:确定自动收集的统计信息是否健康的阈值。如果统计信息健康状况低于此阈值,则会触发自动收集。
  • 引入版本:-
statistic_auto_collect_small_table_rows
  • 默认值:10000000
  • 类型:Long
  • 单位:-
  • 是否可变:是
  • 描述:在自动收集中确定外部数据源(Hive,Iceberg,Hudi)中的表是否为小表的阈值。如果表的行数小于此值,则该表被认为是小表。
  • 引入于:v3.2
statistic_max_full_collect_data_size
  • 默认值:100 * 1024 * 1024 * 1024
  • 类型:Long
  • 单位:字节
  • 是否可变:是
  • 描述:自动收集统计信息的数据大小阈值。如果总大小超过此值,则执行抽样收集而不是完整收集。
  • 引入版本:-
statistic_collect_max_row_count_per_query
  • 默认值:5000000000
  • 类型:Long
  • 单位:-
  • 是否可变:是
  • 描述:单个分析任务要查询的最大行数。如果超过此值,则分析任务将被拆分为多个查询。
  • 引入版本:-
statistic_sample_collect_rows
  • 默认值:200000
  • 类型:Long
  • 单位:-
  • 是否可变:是
  • 描述:抽样收集要收集的最小行数。如果参数值超过表中实际的行数,则执行完整收集。
  • 引入版本:-
histogram_buckets_size
  • 默认值:64
  • 类型:Long
  • 单位:-
  • 是否可变:是
  • 描述:直方图的默认桶数。
  • 引入版本:-
histogram_mcv_size
  • 默认值:100
  • 类型:Long
  • 单位:-
  • 是否可变:是
  • 描述:直方图的最常见值(MCV)的数量。
  • 引入版本:-
histogram_sample_ratio
  • 默认值:0.1
  • 类型:Double
  • 单位:-
  • 是否可变:是
  • 描述:直方图的采样率。
  • 引入版本:-
histogram_max_sample_row_count
  • 默认值:10000000
  • 类型:Long
  • 单位:-
  • 是否可变:是
  • 描述:直方图要收集的最大行数。
  • 引入版本:-
connector_table_query_trigger_task_schedule_interval
  • 默认值:30
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:调度程序线程调度查询触发的后台任务的时间间隔。此项用于替换 v3.4.0 中引入的 connector_table_query_trigger_analyze_schedule_interval。 此处,后台任务指的是 v3.4 中的 ANALYZE 任务,以及高于 v3.4 的版本中低基数列字典的收集任务。
  • 引入于:v3.4.2
connector_table_query_trigger_analyze_small_table_rows
  • 默认值:10000000
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:确定表是否为查询触发的ANALYZE任务的小表的阈值。
  • 引入于:v3.4.0
connector_table_query_trigger_analyze_small_table_interval
  • 默认值:2 * 3600
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:小表的查询触发的ANALYZE任务的时间间隔。
  • 引入于:v3.4.0
connector_table_query_trigger_analyze_large_table_interval
  • 默认值:12 * 3600
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:大表的查询触发的ANALYZE任务的时间间隔。
  • 引入于:v3.4.0
connector_table_query_trigger_analyze_max_pending_task_num
  • 默认值:100
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:FE上处于Pending状态的查询触发的ANALYZE任务的最大数量。
  • 引入于:v3.4.0
connector_table_query_trigger_analyze_max_running_task_num
  • 默认值:2
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:FE上处于Running状态的查询触发的ANALYZE任务的最大数量。
  • 引入于:v3.4.0
enable_local_replica_selection
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否为查询选择本地副本。本地副本减少了网络传输成本。如果此参数设置为TRUE,则CBO优先选择与当前FE具有相同IP地址的BE上的平板副本。如果此参数设置为FALSE,则可以选择本地副本和非本地副本。
  • 引入版本:-
max_distribution_pruner_recursion_depth
  • 默认值:100
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:: 分区裁剪器允许的最大递归深度。增加递归深度可以裁剪更多元素,但也会增加CPU消耗。
  • 引入版本:-
slow_query_analyze_threshold
  • 默认值:5
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:: 查询触发查询反馈分析的执行时间阈值。
  • 引入于:v3.4.0
low_cardinality_threshold
  • 默认值:255
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:低基数字典的阈值。
  • 引入于:v3.5.0

加载和卸载

load_straggler_wait_second
  • 默认值:300
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:BE副本可以容忍的最大加载延迟。如果超过此值,则执行克隆以从其他副本克隆数据。
  • 引入版本:-
load_checker_interval_second
  • 默认值:5
  • 类型:Int
  • 单位:秒
  • 是否可变:否
  • 描述:轮询处理加载作业的时间间隔。
  • 引入版本:-
broker_load_default_timeout_second
  • 默认值:14400
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:Broker Load作业的超时时长。
  • 引入版本:-
min_bytes_per_broker_scanner
  • 默认值:67108864
  • 类型:Long
  • 单位:字节
  • 是否可变:是
  • 描述:Broker Load实例可以处理的最小允许数据量。
  • 引入版本:-
insert_load_default_timeout_second
  • 默认值:3600
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:用于加载数据的INSERT INTO语句的超时时长。
  • 引入版本:-
stream_load_default_timeout_second
  • 默认值:600
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:每个Stream Load作业的默认超时时长。
  • 引入版本:-
max_stream_load_timeout_second
  • 默认值:259200
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:Stream Load作业允许的最大超时时长。
  • 引入版本:-
max_load_timeout_second
  • 默认值:259200
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:加载作业允许的最大超时时长。如果超过此限制,则加载作业将失败。此限制适用于所有类型的加载作业。
  • 引入版本:-
min_load_timeout_second
  • 默认值:1
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:加载作业允许的最小超时时长。此限制适用于所有类型的加载作业。
  • 引入版本:-
spark_dpp_version
  • 默认值:1.0.0
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:使用的Spark动态分区修剪(DPP)的版本。
  • 引入版本:-
spark_load_default_timeout_second
  • 默认值:86400
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:每个Spark Load作业的超时时长。
  • 引入版本:-
spark_home_default_dir
  • 默认值:StarRocksFE.STARROCKS_HOME_DIR + "/lib/spark2x"
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:Spark客户端的根目录。
  • 引入版本:-
spark_resource_path
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:Spark依赖包的根目录。
  • 引入版本:-
spark_launcher_log_dir
  • 默认值:sys_log_dir + "/spark_launcher_log"
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:存储Spark日志文件的目录。
  • 引入版本:-
yarn_client_path
  • 默认值:StarRocksFE.STARROCKS_HOME_DIR + "/lib/yarn-client/hadoop/bin/yarn"
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:Yarn客户端包的根目录。
  • 引入版本:-
yarn_config_dir
  • 默认值:StarRocksFE.STARROCKS_HOME_DIR + "/lib/yarn-config"
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:存储Yarn配置文件的目录。
  • 引入版本:-
desired_max_waiting_jobs
  • 默认值:1024
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:FE中挂起的最大作业数。该数量指的是所有作业,例如表创建、加载和架构更改作业。如果FE中挂起的作业数达到此值,FE将拒绝新的加载请求。此参数仅对异步加载生效。从v2.5开始,默认值从100更改为1024。
  • 引入版本:-
max_running_txn_num_per_db
  • 默认值:1000
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:StarRocks集群中每个数据库允许运行的最大加载事务数。默认值为1000。从v3.1开始,默认值从100更改为1000。当数据库运行的实际加载事务数超过此参数的值时,将不会处理新的加载请求。同步加载作业的新请求将被拒绝,异步加载作业的新请求将被放入队列。我们不建议您增加此参数的值,因为这会增加系统负载。
  • 引入版本:-
max_broker_load_job_concurrency
  • 默认值:5
  • 别名:async_load_task_pool_size
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:StarRocks集群中允许的最大并发Broker Load作业数。此参数仅对Broker Load有效。此参数的值必须小于max_running_txn_num_per_db的值。从v2.5开始,默认值从10更改为5
  • 引入版本:-
load_parallel_instance_num (已弃用)
  • 默认值:1
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:BE上每个加载作业的最大并发加载实例数。此项从v3.1开始已弃用。
  • 引入版本:-
disable_load_job
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:当集群遇到错误时是否禁用加载。这样可以防止集群错误造成的任何损失。默认值为FALSE,表示未禁用加载。TRUE表示已禁用加载,并且集群处于只读状态。
  • 引入版本:-
history_job_keep_max_second
  • 默认值:7 * 24 * 3600
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:可以保留历史作业的最大持续时间,例如架构更改作业。
  • 引入版本:-
label_keep_max_second
  • 默认值:3 * 24 * 3600
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:已完成且处于 FINISHED 或 CANCELLED 状态的加载作业的标签保留的最长时间,以秒为单位。默认值为 3 天。超过此时间后,标签将被删除。此参数适用于所有类型的加载作业。过大的值会消耗大量内存。
  • 引入版本:-
label_keep_max_num
  • 默认值:1000
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:一段时间内可以保留的加载作业的最大数量。如果超过此数量,历史作业的信息将被删除。
  • 引入版本:-
max_routine_load_task_concurrent_num
  • 默认值:5
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:每个 Routine Load 作业的最大并发任务数。
  • 引入版本:-
max_routine_load_task_num_per_be
  • 默认值:16
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:每个 BE 上的最大并发 Routine Load 任务数。自 v3.1.0 起,此参数的默认值从 5 增加到 16,不再需要小于或等于 BE 静态参数 routine_load_thread_pool_size(已弃用)的值。
  • 引入版本:-
max_routine_load_batch_size
  • 默认值:4294967296
  • 类型:Long
  • 单位:字节
  • 是否可变:是
  • 描述:Routine Load 任务可以加载的最大数据量。
  • 引入版本:-
routine_load_task_consume_second
  • 默认值:15
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:集群中每个 Routine Load 任务消耗数据的最长时间。自 v3.1.0 起,Routine Load 作业在 job_properties 中支持新的参数 task_consume_second。此参数适用于 Routine Load 作业中的单个加载任务,更灵活。
  • 引入版本:-
routine_load_task_timeout_second
  • 默认值:60
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:集群中每个 Routine Load 任务的超时时长。自 v3.1.0 起,Routine Load 作业在 job_properties 中支持新的参数 task_timeout_second。此参数适用于 Routine Load 作业中的单个加载任务,更灵活。
  • 引入版本:-
routine_load_unstable_threshold_second
  • 默认值:3600
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:如果 Routine Load 作业中的任何任务滞后,Routine Load 作业将被设置为 UNSTABLE 状态。具体来说,如果正在消耗的消息的时间戳与当前时间之间的差异超过此阈值,并且数据源中存在未消耗的消息。
  • 引入版本:-
enable_routine_load_lag_metrics
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否收集 Routine Load Kafka 分区偏移量滞后指标。请注意,将此项设置为 true 将调用 Kafka API 以获取分区的最新偏移量。
  • 引入版本:-
min_routine_load_lag_for_metrics
  • 默认值:10000
  • 类型:INT
  • 单位:-
  • 是否可变:是
  • 描述:要在监控指标中显示的 Routine Load 作业的最小偏移量滞后。偏移量滞后大于此值的 Routine Load 作业将显示在指标中。
  • 引入版本:-
max_tolerable_backend_down_num
  • 默认值:0
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:允许的最大故障 BE 节点数。如果超过此数量,Routine Load 作业将无法自动恢复。
  • 引入版本:-
period_of_auto_resume_min
  • 默认值:5
  • 类型:Int
  • 单位:分钟
  • 是否可变:是
  • 描述:自动恢复 Routine Load 作业的间隔。
  • 引入版本:-
export_task_default_timeout_second
  • 默认值:2 * 3600
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:数据导出任务的超时时长。
  • 引入版本:-
export_max_bytes_per_be_per_task
  • 默认值:268435456
  • 类型:Long
  • 单位:字节
  • 是否可变:是
  • 描述:单个数据卸载任务可以从单个 BE 导出的最大数据量。
  • 引入版本:-
export_task_pool_size
  • 默认值:5
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:卸载任务线程池的大小。
  • 引入版本:-
export_checker_interval_second
  • 默认值:5
  • 类型:Int
  • 单位:秒
  • 是否可变:否
  • 描述:调度加载作业的时间间隔。
  • 引入版本:-
export_running_job_num_limit
  • 默认值:5
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:可以并行运行的数据导出任务的最大数量。
  • 引入版本:-
empty_load_as_error
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:如果没有加载数据,是否返回错误消息“所有分区都没有加载数据”。有效值
    • true:如果没有加载数据,系统将显示失败消息并返回错误“所有分区都没有加载数据”。
    • false:如果没有加载数据,系统将显示成功消息并返回 OK,而不是错误。
  • 引入版本:-
external_table_commit_timeout_ms
  • 默认值:10000
  • 类型:Int
  • 单位:毫秒
  • 是否可变:是
  • 描述:将写事务提交(发布)到 StarRocks 外部表的超时时长。默认值 10000 表示 10 秒的超时时长。
  • 引入版本:-
enable_sync_publish
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否同步执行加载事务的发布阶段的 apply 任务。此参数仅适用于主键表。有效值
    • TRUE (默认):apply 任务在加载事务的发布阶段同步执行。这意味着只有在 apply 任务完成后才会将加载事务报告为成功,并且可以真正查询加载的数据。当任务一次加载大量数据或频繁加载数据时,将此参数设置为 true 可以提高查询性能和稳定性,但可能会增加加载延迟。
    • FALSE:apply 任务在加载事务的发布阶段异步执行。这意味着提交 apply 任务后加载事务报告为成功,但无法立即查询加载的数据。在这种情况下,并发查询需要等待 apply 任务完成或超时才能继续。当任务一次加载大量数据或频繁加载数据时,将此参数设置为 false 可能会影响查询性能和稳定性。
  • 引入于:v3.2.0
label_clean_interval_second
  • 默认值:4 * 3600
  • 类型:Int
  • 单位:秒
  • 是否可变:否
  • 描述:清理标签的时间间隔。单位:秒。我们建议您指定较短的时间间隔,以确保可以及时清理历史标签。
  • 引入版本:-
transaction_clean_interval_second
  • 默认值:30
  • 类型:Int
  • 单位:秒
  • 是否可变:否
  • 描述:清理已完成事务的时间间隔。单位:秒。我们建议您指定较短的时间间隔,以确保可以及时清理已完成的事务。
  • 引入版本:-
transaction_stream_load_coordinator_cache_capacity
  • 默认值:4096
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:缓存的容量,用于存储从事务标签到协调器节点的映射。
  • 引入版本:-
transaction_stream_load_coordinator_cache_expire_seconds
  • 默认值:900
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:将协调器映射保留在缓存中的时间(TTL),超过此时间后将被逐出。
  • 引入版本:-

存储

default_replication_num
  • 默认值:3
  • 类型:Short
  • 单位:-
  • 是否可变:是
  • 描述:设置在 StarRocks 中创建表时,每个数据分区的默认副本数。可以在创建表时通过在 CREATE TABLE DDL 中指定 replication_num=x 来覆盖此设置。
  • 引入版本:-
enable_strict_storage_medium_check
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:FE 是否在用户创建表时严格检查 BE 的存储介质。如果此参数设置为 TRUE,则 FE 在用户创建表时检查 BE 的存储介质,如果 BE 的存储介质与 CREATE TABLE 语句中指定的 storage_medium 参数不同,则返回错误。例如,CREATE TABLE 语句中指定的存储介质是 SSD,但 BE 的实际存储介质是 HDD。因此,表创建失败。如果此参数为 FALSE,则 FE 在用户创建表时不会检查 BE 的存储介质。
  • 引入版本:-
catalog_trash_expire_second
  • 默认值:86400
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:删除数据库、表或分区后,可以保留元数据的最长时间。如果此时间到期,数据将被删除,并且无法通过 RECOVER 命令恢复。
  • 引入版本:-
enable_auto_tablet_distribution
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否自动设置 bucket 数量。
    • 如果此参数设置为 TRUE,则在创建表或添加分区时,无需指定 bucket 数量。 StarRocks 会自动确定 bucket 数量。
    • 如果此参数设置为 FALSE,则在创建表或添加分区时,需要手动指定 bucket 数量。如果在向表中添加新分区时未指定 bucket 计数,则新分区将继承在创建表时设置的 bucket 计数。但是,您也可以手动指定新分区的 bucket 数量。
  • 引入于:v2.5.7
enable_experimental_rowstore
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否启用 混合行-列存储 功能。
  • 引入于:v3.2.3

enable_experimental_gin

  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否启用 全文倒排索引 功能。
  • 引入版本:v3.3.0
storage_usage_soft_limit_percent
  • 默认值:90
  • 别名:storage_high_watermark_usage_percent
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:BE 目录中存储使用百分比的软限制。如果 BE 存储目录的存储使用率(以百分比表示)超过此值,并且剩余存储空间小于 storage_usage_soft_limit_reserve_bytes,则无法将 tablet 克隆到此目录中。
  • 引入版本:-
storage_usage_soft_limit_reserve_bytes
  • 默认值:200 * 1024 * 1024 * 1024
  • 别名:storage_min_left_capacity_bytes
  • 类型:Long
  • 单位:字节
  • 是否可变:是
  • 描述:BE 目录中剩余存储空间的软限制。如果 BE 存储目录中的剩余存储空间小于此值,并且存储使用率(以百分比表示)超过 storage_usage_soft_limit_percent,则无法将 tablet 克隆到此目录中。
  • 引入版本:-
storage_usage_hard_limit_percent
  • 默认值:95
  • 别名:storage_flood_stage_usage_percent
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:BE 目录中存储使用百分比的硬限制。如果 BE 存储目录的存储使用率(以百分比表示)超过此值,并且剩余存储空间小于 storage_usage_hard_limit_reserve_bytes,则将拒绝加载和恢复作业。您需要将此项与 BE 配置项 storage_flood_stage_usage_percent 一起设置,以使配置生效。
  • 引入版本:-
storage_usage_hard_limit_reserve_bytes
  • 默认值:100 * 1024 * 1024 * 1024
  • 别名:storage_flood_stage_left_capacity_bytes
  • 类型:Long
  • 单位:字节
  • 是否可变:是
  • 描述:BE 目录中剩余存储空间的硬限制。如果 BE 存储目录中的剩余存储空间小于此值,并且存储使用率(以百分比表示)超过 storage_usage_hard_limit_percent,则将拒绝加载和恢复作业。您需要将此项与 BE 配置项 storage_flood_stage_left_capacity_bytes 一起设置,以使配置生效。
  • 引入版本:-
alter_table_timeout_second
  • 默认值:86400
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:schema change 操作 (ALTER TABLE) 的超时时长。
  • 引入版本:-
enable_fast_schema_evolution
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否为 StarRocks 集群中的所有表启用快速 schema evolution。有效值为 TRUEFALSE(默认)。启用快速 schema evolution 可以提高 schema 更改的速度,并减少添加或删除列时的资源使用。
  • 引入于:v3.2.0

注意

  • StarRocks shared-data 集群从 v3.3.0 开始支持此参数。
  • 如果需要为特定表配置快速 schema evolution,例如禁用特定表的快速 schema evolution,则可以在创建表时设置表属性 fast_schema_evolution
recover_with_empty_tablet
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否用空 tablet 替换丢失或损坏的 tablet 副本。如果 tablet 副本丢失或损坏,则对此 tablet 或其他健康 tablet 的数据查询可能会失败。用空 tablet 替换丢失或损坏的 tablet 副本可确保仍然可以执行查询。但是,由于数据丢失,结果可能不正确。默认值为 FALSE,这意味着丢失或损坏的 tablet 副本不会被空 tablet 替换,并且查询失败。
  • 引入版本:-
tablet_create_timeout_second
  • 默认值:10
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:创建 tablet 的超时时长。从 v3.1 开始,默认值从 1 更改为 10。
  • 引入版本:-
tablet_delete_timeout_second
  • 默认值:2
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:删除 tablet 的超时时长。
  • 引入版本:-
check_consistency_default_timeout_second
  • 默认值:600
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:副本一致性检查的超时时长。您可以根据 tablet 的大小设置此参数。
  • 引入版本:-
tablet_sched_slot_num_per_path
  • 默认值:8
  • 别名:schedule_slot_num_per_path
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:可以在 BE 存储目录中并发运行的与 tablet 相关的任务的最大数量。从 v2.5 开始,此参数的默认值从 4 更改为 8
  • 引入版本:-
tablet_sched_max_scheduling_tablets
  • 默认值:10000
  • 别名:max_scheduling_tablets
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:可以同时调度的 tablet 的最大数量。如果超过此值,则将跳过 tablet 平衡和修复检查。
  • 引入版本:-
tablet_sched_disable_balance
  • 默认值:false
  • 别名:disable_balance
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否禁用 tablet 平衡。 TRUE 表示禁用 tablet 平衡。 FALSE 表示启用 tablet 平衡。
  • 引入版本:-
tablet_sched_disable_colocate_balance
  • 默认值:false
  • 别名:disable_colocate_balance
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否禁用 Colocate Table 的副本平衡。 TRUE 表示禁用副本平衡。 FALSE 表示启用副本平衡。
  • 引入版本:-
tablet_sched_be_down_tolerate_time_s
  • 默认值:900
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:调度程序允许 BE 节点保持不活动状态的最长时间。达到时间阈值后,该 BE 节点上的 tablet 将迁移到其他活动的 BE 节点。
  • 引入于:v2.5.7
tablet_sched_max_balancing_tablets
  • 默认值:500
  • 别名:max_balancing_tablets
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:可以同时平衡的 tablet 的最大数量。如果超过此值,则将跳过 tablet 重新平衡。
  • 引入版本:-
tablet_sched_storage_cooldown_second
  • 默认值:-1
  • 别名:storage_cooldown_second
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:从创建表时开始的自动冷却的延迟。默认值 -1 指定禁用自动冷却。如果要启用自动冷却,请将此参数设置为大于 -1 的值。
  • 引入版本:-
tablet_sched_max_not_being_scheduled_interval_ms
  • 默认值:15 * 60 * 1000
  • 类型:Long
  • 单位:毫秒
  • 是否可变:是
  • 描述:在调度 tablet 克隆任务时,如果 tablet 在此参数中指定的时间内未被调度,StarRocks 会为其提供更高的优先级以尽快调度它。
  • 引入版本:-
tablet_sched_balance_load_score_threshold
  • 默认值:0.1
  • 别名:balance_load_score_threshold
  • 类型:Double
  • 单位:-
  • 是否可变:是
  • 描述:用于确定 BE 的负载是否平衡的百分比阈值。如果 BE 的负载低于所有 BE 的平均负载,并且差值大于此值,则该 BE 处于低负载状态。相反,如果 BE 的负载高于平均负载,并且差值大于此值,则该 BE 处于高负载状态。
  • 引入版本:-
tablet_sched_num_based_balance_threshold_ratio
  • 默认值:0.5
  • 别名:-
  • 类型:Double
  • 单位:-
  • 是否可变:是
  • 描述:基于数量的平衡可能会破坏磁盘大小平衡,但磁盘之间的最大差距不能超过 tablet_sched_num_based_balance_threshold_ratio * tablet_sched_balance_load_score_threshold。如果集群中存在从 A 到 B 和 B 到 A 不断平衡的 tablet,请减小此值。如果您希望 tablet 分布更加平衡,请增加此值。
  • 引入于:- 3.1
tablet_sched_balance_load_disk_safe_threshold
  • 默认值:0.5
  • 别名:balance_load_disk_safe_threshold
  • 类型:Double
  • 单位:-
  • 是否可变:是
  • 描述:用于确定 BE 的磁盘使用情况是否平衡的百分比阈值。如果所有 BE 的磁盘使用率都低于此值,则认为已平衡。如果磁盘使用率大于此值,并且最高和最低 BE 磁盘使用率之间的差值大于 10%,则认为磁盘使用率不平衡,并且会触发 tablet 重新平衡。
  • 引入版本:-
tablet_sched_repair_delay_factor_second
  • 默认值:60
  • 别名:tablet_repair_delay_factor_second
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:修复副本的时间间隔,以秒为单位。
  • 引入版本:-
tablet_sched_min_clone_task_timeout_sec
  • 默认值:3 * 60
  • 别名:min_clone_task_timeout_sec
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:克隆 tablet 的最短超时时长。
  • 引入版本:-
tablet_sched_max_clone_task_timeout_sec
  • 默认值:2 * 60 * 60
  • 别名:max_clone_task_timeout_sec
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:此克隆 tablet 的最大超时时长。
  • 引入版本:-
tablet_stat_update_interval_second
  • 默认值:300
  • 类型:Int
  • 单位:秒
  • 是否可变:否
  • 描述:FE 从每个 BE 检索 tablet 统计信息的时间间隔。
  • 引入版本:-
max_automatic_partition_number
  • 默认值:4096
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:自动创建的分区的最大数量。
  • 引入于:v3.1
auto_partition_max_creation_number_per_load
  • 默认值:4096
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:加载任务可以在表(具有 Expression Partitioning 策略)中创建的最大分区数。
  • 引入于:v3.3.2
max_partition_number_per_table
  • 默认值:100000
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:可以在表中创建的最大分区数。
  • 引入于:v3.3.2
max_bucket_number_per_partition
  • 默认值:1024
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:可以在分区中创建的最大 bucket 数。
  • 引入于:v3.3.2
max_column_number_per_table
  • 默认值:10000
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:可以在表中创建的最大列数。
  • 引入于:v3.3.2

Shared-Data

run_mode
  • 默认值:shared_nothing

  • 类型:String

  • 单位:-

  • 是否可变:否

  • 描述:StarRocks 集群的运行模式。有效值:shared_datashared_nothing (默认)。

    • shared_data 表示以共享数据模式运行 StarRocks。
    • shared_nothing 表示以 shared-nothing 模式运行 StarRocks。

    注意

    • 您不能同时为 StarRocks 集群采用 shared_datashared_nothing 模式。不支持混合部署。
    • 部署集群后,请勿更改 run_mode。否则,集群将无法重启。不支持从 shared-nothing 集群转换为 shared-data 集群,反之亦然。
  • 引入版本:-

cloud_native_meta_port
  • 默认值:6090
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:FE 云原生元数据服务器 RPC 监听端口。
  • 引入版本:-
enable_load_volume_from_conf
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:否
  • 描述:是否允许 StarRocks 使用 FE 配置文件中指定的对象存储相关属性创建内置存储卷。从 v3.4.1 开始,默认值从 true 更改为 false
  • 引入于:v3.1.0
cloud_native_storage_type
  • 默认值:S3
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:您使用的对象存储类型。在共享数据模式下,StarRocks 支持将数据存储在 HDFS、Azure Blob(从 v3.1.1 开始支持)、Azure Data Lake Storage Gen2(从 v3.4.1 开始支持)、Google Storage(带有原生 SDK,从 v3.5.1 开始支持)和与 S3 协议兼容的对象存储系统(如 AWS S3 和 MinIO)中。有效值:S3(默认)、HDFSAZBLOBADLS2GS。如果将此参数指定为 S3,则必须添加带有 aws_s3 前缀的参数。如果将此参数指定为 AZBLOB,则必须添加带有 azure_blob 前缀的参数。如果将此参数指定为 ADLS2,则必须添加带有 azure_adls2 前缀的参数。如果将此参数指定为 GS,则必须添加带有 gcp_gcs 前缀的参数。如果将此参数指定为 HDFS,则只需指定 cloud_native_hdfs_url
  • 引入版本:-
cloud_native_hdfs_url
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:HDFS 存储的 URL,例如 hdfs://127.0.0.1:9000/user/xxx/starrocks/
  • 引入版本:-
aws_s3_path
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于存储数据的 S3 路径。它由 S3 bucket 的名称和其下的子路径(如果有)组成,例如 testbucket/subpath
  • 引入于:v3.0
aws_s3_region
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:您的 S3 bucket 所在的区域,例如 us-west-2
  • 引入于:v3.0
aws_s3_endpoint
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于访问您的 S3 bucket 的端点,例如 https://s3.us-west-2.amazonaws.com
  • 引入于:v3.0
aws_s3_use_aws_sdk_default_behavior
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:否
  • 描述:是否使用 AWS SDK 的默认身份验证凭证。有效值:true 和 false(默认)。
  • 引入于:v3.0
aws_s3_use_instance_profile
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:否
  • 描述:是否使用 Instance Profile 和 Assumed Role 作为访问 S3 的凭证方法。有效值:true 和 false(默认)。
    • 如果您使用基于 IAM 用户的凭证(Access Key 和 Secret Key)访问 S3,则必须将此项指定为 false,并指定 aws_s3_access_keyaws_s3_secret_key
    • 如果您使用 Instance Profile 访问 S3,则必须将此项指定为 true
    • 如果您使用 Assumed Role 访问 S3,则必须将此项指定为 true,并指定 aws_s3_iam_role_arn
    • 如果您使用外部 AWS 账户,您还必须指定 aws_s3_external_id
  • 引入于:v3.0
aws_s3_access_key
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于访问您的 S3 bucket 的 Access Key ID。
  • 引入于:v3.0
aws_s3_secret_key
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于访问您的 S3 bucket 的 Secret Access Key。
  • 引入于:v3.0
aws_s3_iam_role_arn
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:对存储数据文件的 S3 bucket 具有权限的 IAM 角色的 ARN。
  • 引入于:v3.0
aws_s3_external_id
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于跨账户访问您的 S3 bucket 的 AWS 账户的外部 ID。
  • 引入于:v3.0
azure_blob_endpoint
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:您的 Azure Blob Storage 账户的端点,例如 https://test.blob.core.windows.net
  • 引入于:v3.1
azure_blob_path
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于存储数据的 Azure Blob Storage 路径。它由存储账户中容器的名称和容器下的子路径(如果有)组成,例如 testcontainer/subpath
  • 引入于:v3.1
azure_blob_shared_key
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于授权对您的 Azure Blob Storage 的请求的共享密钥。
  • 引入于:v3.1
azure_blob_sas_token
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于授权对您的 Azure Blob Storage 的请求的共享访问签名 (SAS)。
  • 引入于:v3.1
azure_adls2_endpoint
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:您的 Azure Data Lake Storage Gen2 账户的端点,例如 https://test.dfs.core.windows.net
  • 引入于:v3.4.1
azure_adls2_path
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于存储数据的 Azure Data Lake Storage Gen2 路径。它由文件系统名称和目录名称组成,例如 testfilesystem/starrocks
  • 引入于:v3.4.1
azure_adls2_shared_key
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于授权对您的 Azure Data Lake Storage Gen2 的请求的共享密钥。
  • 引入于:v3.4.1
azure_adls2_sas_token
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于授权对您的 Azure Data Lake Storage Gen2 的请求的共享访问签名 (SAS)。
  • 引入于:v3.4.1
azure_adls2_oauth2_use_managed_identity
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:否
  • 描述:是否使用托管身份验证来授权对您的 Azure Data Lake Storage Gen2 的请求。
  • 引入于:v3.4.4
azure_adls2_oauth2_tenant_id
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于授权对您的 Azure Data Lake Storage Gen2 的请求的托管身份的租户 ID。
  • 引入于:v3.4.4
azure_adls2_oauth2_client_id
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于授权对您的 Azure Data Lake Storage Gen2 的请求的托管身份的客户端 ID。
  • 引入于:v3.4.4
azure_use_native_sdk
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否使用本机 SDK 访问 Azure Blob Storage,从而允许使用托管身份和服务主体进行身份验证。如果此项设置为 false,则仅允许使用共享密钥和 SAS 令牌进行身份验证。
  • 引入于:v3.4.4
gcp_gcs_path
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于存储数据的 Google Cloud 路径。它由您的 Google Cloud bucket 的名称及其下的子路径(如果有)组成,例如 testbucket/subpath
  • 引入于:v3.5.1
gcp_gcs_service_account_email
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:在创建服务账户时生成的 JSON 文件中的电子邮件地址,例如 user@hello.iam.gserviceaccount.com
  • 引入于:v3.5.1
gcp_gcs_service_account_private_key_id
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:在创建服务账户时生成的 JSON 文件中的私钥 ID。
  • 引入于:v3.5.1
gcp_gcs_service_account_private_key
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:服务账户创建时生成的 JSON 文件中的私钥。例如:-----BEGIN PRIVATE KEY----xxxx-----END PRIVATE KEY-----\n
  • 引入于:v3.5.1
gcp_gcs_impersonation_service_account
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:如果您使用基于模拟的身份验证来访问 Google Storage,则您要模拟的服务账户。
  • 引入于:v3.5.1
gcp_gcs_use_compute_engine_service_account
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:否
  • 描述:是否使用绑定到 Compute Engine 的服务账户。
  • 引入于:v3.5.1
lake_compaction_score_selector_min_score
  • 默认值:10.0
  • 类型:Double
  • 单位:-
  • 是否可变:是
  • 描述:触发共享数据集群中 Compaction 操作的 Compaction Score 阈值。当分区的 Compaction Score 大于或等于此值时,系统会对该分区执行 Compaction。
  • 引入于:v3.1.0
lake_compaction_max_tasks
  • 默认值:-1
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:共享数据集群中允许的最大并发 Compaction 任务数。将此项设置为 -1 表示以自适应方式计算并发任务数。将此值设置为 0 将禁用 Compaction。
  • 引入于:v3.1.0
lake_compaction_history_size
  • 默认值:20
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:要在共享数据集群的 Leader FE 节点的内存中保留的最近成功完成的 Compaction 任务记录数。您可以使用 SHOW PROC '/compactions' 命令查看最近成功完成的 Compaction 任务记录。请注意,Compaction 历史记录存储在 FE 进程内存中,如果 FE 进程重新启动,则会丢失。
  • 引入于:v3.1.0
lake_publish_version_max_threads
  • 默认值:512
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:共享数据集群中 Version Publish 任务的最大线程数。
  • 引入于:v3.2.0
lake_autovacuum_parallel_partitions
  • 默认值:8
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:共享数据集群中可以同时进行 AutoVacuum 的最大分区数。AutoVacuum 是 Compaction 后的垃圾回收。
  • 引入于:v3.1.0
lake_autovacuum_partition_naptime_seconds
  • 默认值:180
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:共享数据集群中同一分区上 AutoVacuum 操作之间的最小间隔。
  • 引入于:v3.1.0
lake_autovacuum_grace_period_minutes
  • 默认值:30
  • 类型:Long
  • 单位:分钟
  • 是否可变:是
  • 描述:共享数据集群中保留历史数据版本的时间范围。在此时间范围内的历史数据版本不会在 Compaction 后通过 AutoVacuum 自动清除。您需要将此值设置得大于最大查询时间,以避免正在运行的查询访问的数据在查询完成之前被删除。自 v3.3.0、v3.2.5 和 v3.1.10 起,默认值已从 5 更改为 30
  • 引入于:v3.1.0
lake_autovacuum_stale_partition_threshold
  • 默认值:12
  • 类型:Long
  • 单位:小时
  • 是否可变:是
  • 描述:如果分区在此时间范围内没有更新(加载、DELETE 或 Compaction),系统将不会在此分区上执行 AutoVacuum。
  • 引入于:v3.1.0
lake_enable_ingest_slowdown
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否在共享数据集群中启用数据摄取减速。启用数据摄取减速后,如果分区的 Compaction Score 超过 lake_ingest_slowdown_threshold,则将对该分区的加载任务进行限制。仅当 run_mode 设置为 shared_data 时,此配置才生效。从 v3.3.6 开始,默认值已从 false 更改为 true
  • 引入于:v3.2.0
lake_ingest_slowdown_threshold
  • 默认值:100
  • 类型:Long
  • 单位:-
  • 是否可变:是
  • 描述:触发共享数据集群中数据摄取减速的 Compaction Score 阈值。仅当 lake_enable_ingest_slowdown 设置为 true 时,此配置才生效。
  • 引入于:v3.2.0
lake_ingest_slowdown_ratio
  • 默认值:0.1

  • 类型:Double

  • 单位:-

  • 是否可变:是

  • 描述:触发数据摄取减速时加载速率减慢的比率。

    数据加载任务包括两个阶段:数据写入和数据提交 (COMMIT)。数据摄取减速是通过延迟数据提交来实现的。延迟比率使用以下公式计算:(compaction_score - lake_ingest_slowdown_threshold) * lake_ingest_slowdown_ratio。例如,如果数据写入阶段需要 5 分钟,lake_ingest_slowdown_ratio 为 0.1,并且 Compaction Score 比 lake_ingest_slowdown_threshold 高 10,则数据提交时间的延迟为 5 * 10 * 0.1 = 5 分钟,这意味着平均加载速度减半。

  • 引入于:v3.2.0

注意

  • 如果加载任务同时写入多个分区,则所有分区中的最大 Compaction Score 用于计算提交时间的延迟。
  • 提交时间的延迟是在第一次尝试提交时计算的。一旦设置,它将不会改变。一旦延迟时间结束,只要 Compaction Score 不高于 lake_compaction_score_upper_bound,系统将执行数据提交操作。
  • 如果提交时间的延迟超过加载任务的超时时间,则任务将直接失败。
lake_compaction_score_upper_bound
  • 默认值:2000
  • 类型:Long
  • 单位:-
  • 是否可变:是
  • 描述:共享数据集群中分区的 Compaction Score 上限。0 表示没有上限。仅当 lake_enable_ingest_slowdown 设置为 true 时,此项才生效。当分区的 Compaction Score 达到或超过此上限时,将拒绝传入的加载任务。从 v3.3.6 开始,默认值已从 0 更改为 2000
  • 引入于:v3.2.0
lake_compaction_disable_ids
  • 默认值:""
  • 类型:String
  • 单位:-
  • 是否可变:是
  • 描述:在共享数据模式下禁用 Compaction 的表或分区列表。格式为 tableId1;partitionId2,用分号分隔,例如 12345;98765
  • 引入于:v3.4.4
lake_compaction_allow_partial_success
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:如果此项设置为 true,则当共享数据集群中的一个子任务成功时,系统会将 Compaction 操作视为成功。
  • 引入版本:v3.5.2
lake_enable_balance_tablets_between_workers
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否在共享数据集群中云原生表的 Tablet 迁移期间平衡计算节点之间的 Tablet 数量。true 表示平衡计算节点之间的 Tablet,false 表示禁用此功能。
  • 引入于:v3.3.4
lake_balance_tablets_threshold
  • 默认值:0.15
  • 类型:Double
  • 单位:-
  • 是否可变:是
  • 描述:系统用于判断共享数据集群中工作节点之间 Tablet 平衡的阈值。不平衡因子计算为 f = (MAX(tablets) - MIN(tablets)) / AVERAGE(tablets)。如果因子大于 lake_balance_tablets_threshold,则会触发 Tablet 平衡。仅当 lake_enable_balance_tablets_between_workers 设置为 true 时,此项才生效。
  • 引入于:v3.3.4
shard_group_clean_threshold_sec
  • 默认值:3600
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:FE 清理共享数据集群中未使用的 Tablet 和分片组之前的时间。在此阈值内创建的 Tablet 和分片组不会被清理。
  • 引入版本:-
star_mgr_meta_sync_interval_sec
  • 默认值:600
  • 类型:Long
  • 单位:秒
  • 是否可变:否
  • 描述:FE 在共享数据集群中定期与 StarMgr 运行元数据同步的间隔。
  • 引入版本:-
meta_sync_force_delete_shard_meta
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否允许直接删除共享数据集群的元数据,绕过清理远程存储文件。建议仅当需要清理的分片数量过多时才将此项设置为 true,这会导致 FE JVM 上的极端内存压力。请注意,启用此功能后,属于分片或 Tablet 的数据文件无法自动清理。
  • 引入版本:v3.2.10、v3.3.3

其他

tmp_dir
  • 默认值:StarRocksFE.STARROCKS_HOME_DIR + "/temp_dir"
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:存储临时文件的目录,例如备份和恢复过程中生成的文件。这些过程完成后,生成的临时文件将被删除。
  • 引入版本:-
plugin_dir
  • 默认值:System.getenv("STARROCKS_HOME") + "/plugins"
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:存储插件安装包的目录。
  • 引入版本:-
plugin_enable
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否可以在 FE 上安装插件。只能在 Leader FE 上安装或卸载插件。
  • 引入版本:-
max_agent_task_threads_num
  • 默认值:4096
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:代理任务线程池中允许的最大线程数。
  • 引入版本:-
agent_task_resend_wait_time_ms
  • 默认值:5000
  • 类型:Long
  • 单位:毫秒
  • 是否可变:是
  • 描述:FE 必须等待多长时间才能重新发送代理任务。只有当任务创建时间和当前时间之间的差距超过此参数的值时,才能重新发送代理任务。此参数用于防止重复发送代理任务。
  • 引入版本:-
backup_job_default_timeout_ms
  • 默认值:86400 * 1000
  • 类型:Int
  • 单位:毫秒
  • 是否可变:是
  • 描述:备份作业的超时时间。如果超过此值,备份作业将失败。
  • 引入版本:-
locale
  • 默认值:zh_CN.UTF-8
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:FE 使用的字符集。
  • 引入版本:-
report_queue_size (已弃用)
  • 默认值:100
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:可以在报告队列中等待的最大作业数。该报告是关于 BE 的磁盘、任务和 Tablet 信息。如果队列中堆积了太多报告作业,则会发生 OOM。
  • 引入版本:-
enable_metric_calculator
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:否
  • 描述:指定是否启用用于定期收集指标的功能。有效值:TRUEFALSETRUE 指定启用此功能,FALSE 指定禁用此功能。
  • 引入版本:-
max_small_file_number
  • 默认值:100
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:可以在 FE 目录中存储的最大小文件数。
  • 引入版本:-
max_small_file_size_bytes
  • 默认值:1024 * 1024
  • 类型:Int
  • 单位:字节
  • 是否可变:是
  • 描述:小文件的最大大小。
  • 引入版本:-
small_file_dir
  • 默认值:StarRocksFE.STARROCKS_HOME_DIR + "/small_files"
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:小文件的根目录。
  • 引入版本:-
enable_auth_check
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:否
  • 描述:指定是否启用身份验证检查功能。有效值:TRUEFALSETRUE 指定启用此功能,FALSE 指定禁用此功能。
  • 引入版本:-
authentication_ldap_simple_server_host
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:是
  • 描述:运行 LDAP 服务器的主机。
  • 引入版本:-
authentication_ldap_simple_server_port
  • 默认值:389
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:LDAP 服务器的端口。
  • 引入版本:-
authentication_ldap_simple_bind_base_dn
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:是
  • 描述:基本 DN,LDAP 服务器从中开始搜索用户的身份验证信息的点。
  • 引入版本:-
authentication_ldap_simple_user_search_attr
  • 默认值:uid
  • 类型:String
  • 单位:-
  • 是否可变:是
  • 描述:标识 LDAP 对象中用户的属性的名称。
  • 引入版本:-
authentication_ldap_simple_bind_root_dn
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:是
  • 描述:用于搜索用户身份验证信息的管理员 DN。
  • 引入版本:-
authentication_ldap_simple_bind_root_pwd
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:是
  • 描述:用于搜索用户身份验证信息的管理员的密码。
  • 引入版本:-
jwt_jwks_url
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:JSON Web Key Set (JWKS) 服务的 URL 或 fe/conf 目录下公钥本地文件的路径。
  • 引入于:v3.5.0
jwt_principal_field
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于标识 JWT 中指示主题 (sub) 的字段的字符串。默认值为 sub。此字段的值必须与登录 StarRocks 的用户名相同。
  • 引入于:v3.5.0
jwt_required_issuer
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于标识 JWT 中颁发者 (iss) 的字符串列表。仅当列表中的一个值与 JWT 颁发者匹配时,JWT 才被视为有效。
  • 引入于:v3.5.0
jwt_required_audience
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于标识 JWT 中受众 (aud) 的字符串列表。仅当列表中的一个值与 JWT 受众匹配时,JWT 才被视为有效。
  • 引入于:v3.5.0
oauth2_auth_server_url
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:授权 URL。用户的浏览器将被重定向到的 URL,以便开始 OAuth 2.0 授权过程。
  • 引入于:v3.5.0
oauth2_token_server_url
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:授权服务器上 StarRocks 从中获取访问令牌的端点的 URL。
  • 引入于:v3.5.0
oauth2_client_id
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:StarRocks 客户端的公共标识符。
  • 引入于:v3.5.0
oauth2_client_secret
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于通过授权服务器授权 StarRocks 客户端的密钥。
  • 引入于:v3.5.0
oauth2_redirect_url
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:在 OAuth 2.0 身份验证成功后用户的浏览器将被重定向到的 URL。授权码将被发送到此 URL。在大多数情况下,需要将其配置为 http://<starrocks_fe_url>:<fe_http_port>/api/oauth2
  • 引入于:v3.5.0
oauth2_jwks_url
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:JSON Web Key Set (JWKS) 服务的 URL 或 conf 目录下本地文件的路径。
  • 引入于:v3.5.0
oauth2_principal_field
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于标识 JWT 中指示主题 (sub) 的字段的字符串。默认值为 sub。此字段的值必须与登录 StarRocks 的用户名相同。
  • 引入于:v3.5.0
oauth2_required_issuer
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于标识 JWT 中颁发者 (iss) 的字符串列表。仅当列表中的一个值与 JWT 颁发者匹配时,JWT 才被视为有效。
  • 引入于:v3.5.0
oauth2_required_audience
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于标识 JWT 中受众 (aud) 的字符串列表。仅当列表中的一个值与 JWT 受众匹配时,JWT 才被视为有效。
  • 引入于:v3.5.0
auth_token
  • 默认值:空字符串
  • 类型:String
  • 单位:-
  • 是否可变:否
  • 描述:用于 FE 所属的 StarRocks 集群内身份验证的令牌。如果未指定此参数,StarRocks 会在首次启动集群的 Leader FE 时为集群生成一个随机令牌。
  • 引入版本:-
hive_meta_load_concurrency
  • 默认值:4
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:Hive 元数据支持的最大并发线程数。
  • 引入版本:-
hive_meta_cache_refresh_interval_s
  • 默认值:3600 * 2
  • 类型:Long
  • 单位:秒
  • 是否可变:否
  • 描述:Hive 外部表的缓存元数据更新的时间间隔。
  • 引入版本:-
hive_meta_cache_ttl_s
  • 默认值:3600 * 24
  • 类型:Long
  • 单位:秒
  • 是否可变:否
  • 描述:Hive 外部表的缓存元数据过期的时长。
  • 引入版本:-
hive_meta_store_timeout_s
  • 默认值:10
  • 类型:Long
  • 单位:秒
  • 是否可变:否
  • 描述:连接到 Hive 元存储超时的时间。
  • 引入版本:-
es_state_sync_interval_second
  • 默认值:10
  • 类型:Long
  • 单位:秒
  • 是否可变:否
  • 描述:FE 获取 Elasticsearch 索引并同步 StarRocks 外部表的元数据的时间间隔。
  • 引入版本:-
max_upload_task_per_be
  • 默认值:0
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:在每个 BACKUP 操作中,StarRocks 分配给 BE 节点的最大上传任务数。如果此项设置为小于或等于 0,则不限制任务数。
  • 引入于:v3.1.0
max_download_task_per_be
  • 默认值:0
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:在每个 RESTORE 操作中,StarRocks 分配给 BE 节点的最大下载任务数。如果此项设置为小于或等于 0,则不限制任务数。
  • 引入于:v3.1.0
enable_colocate_restore
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否为 Colocate 表启用备份和还原。true 表示为 Colocate 表启用备份和还原,false 表示禁用它。
  • 引入版本:v3.2.10、v3.3.3
mv_plan_cache_expire_interval_sec
  • 默认值:24 * 60 * 60
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:物化视图计划缓存(用于物化视图重写)到期前的有效时间。默认值为 1 天。
  • 引入于:v3.2
mv_plan_cache_thread_pool_size
  • 默认值:3
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:物化视图计划缓存(用于物化视图重写)的默认线程池大小。
  • 引入于:v3.2
mv_plan_cache_max_size
  • 默认值:1000
  • 类型:Long
  • 单位
  • 是否可变:是
  • 描述:物化视图计划缓存(用于物化视图重写)的最大大小。如果用于透明查询重写的物化视图很多,您可以增加此值。
  • 引入于:v3.2
enable_materialized_view_concurrent_prepare
  • 默认值:true
  • 类型:Boolean
  • 单位
  • 是否可变:是
  • 描述:是否并发准备物化视图以提高性能。
  • 引入于:v3.4.4
enable_mv_query_context_cache
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否启用查询级别的物化视图重写缓存以提高查询重写性能。
  • 引入版本:v3.3
enable_materialized_view_concurrent_prepare
  • 默认值:true
  • 类型:Boolean
  • 单位
  • 是否可变:是
  • 描述:并发准备物化视图以提高性能
  • 引入于:v3.4.4
mv_query_context_cache_max_size
  • 默认值:1000
  • 类型:-
  • 单位:-
  • 是否可变:是
  • 描述:一次查询生命周期中物化视图重写的最大缓存大小。可以使用缓存来避免重复计算,以减少物化视图重写中的优化器时间,但它可能会占用一些额外的 FE 内存。当有许多相关的物化视图(超过 10 个)或查询复杂(在多个表上进行连接)时,它可以带来更好的性能。
  • 引入版本:v3.3
allow_system_reserved_names
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否允许用户创建名称以 __op__row 开头的列。要启用此功能,请将此参数设置为 TRUE。请注意,这些名称格式在 StarRocks 中保留用于特殊目的,创建此类列可能会导致未定义的行为。因此,默认情况下禁用此功能。
  • 引入于:v3.2.0
replication_interval_ms
  • 默认值:100
  • 类型:Int
  • 单位:-
  • 是否可变:否
  • 描述:调度复制任务的最小时间间隔。
  • 引入版本:v3.3.5
replication_max_parallel_table_count
  • 默认值:100
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:允许的最大并发数据同步任务数。StarRocks 为每个表创建一个同步任务。
  • 引入版本:v3.3.5
replication_max_parallel_replica_count
  • 默认值:10240
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:允许并发同步的最大 Tablet 副本数。
  • 引入版本:v3.3.5
replication_max_parallel_data_size_mb
  • 默认值:1048576
  • 类型:Int
  • 单位:MB
  • 是否可变:是
  • 描述:允许并发同步的最大数据大小。
  • 引入版本:v3.3.5
replication_transaction_timeout_sec
  • 默认值:86400
  • 类型:Int
  • 单位:秒
  • 是否可变:是
  • 描述:同步任务的超时时间。
  • 引入版本:v3.3.5
jdbc_meta_default_cache_enable
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:JDBC Catalog 元数据缓存是否启用的默认值。设置为 True 时,新创建的 JDBC Catalog 将默认启用元数据缓存。
  • 引入版本:-
jdbc_meta_default_cache_expire_sec
  • 默认值:600
  • 类型:Long
  • 单位:秒
  • 是否可变:是
  • 描述:JDBC Catalog 元数据缓存的默认过期时间。当 jdbc_meta_default_cache_enable 设置为 true 时,新创建的 JDBC Catalog 将默认设置元数据缓存的过期时间。
  • 引入版本:-
jdbc_connection_pool_size
  • 默认值:8
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:用于访问 JDBC catalog 的 JDBC 连接池的最大容量。
  • 引入版本:-
jdbc_minimum_idle_connections
  • 默认值:1
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:用于访问 JDBC catalog 的 JDBC 连接池中的最小空闲连接数。
  • 引入版本:-
jdbc_connection_idle_timeout_ms
  • 默认值:600000
  • 类型:Int
  • 单位:毫秒
  • 是否可变:是
  • 描述:用于访问 JDBC catalog 的连接超时前的最大时间。超时的连接被认为是空闲的。
  • 引入版本:-
query_detail_explain_level
  • 默认值:COSTS
  • 类型:String
  • 单位:-
  • 是否可变:true
  • 描述:EXPLAIN 语句返回的查询计划的详细级别。有效值:COSTS、NORMAL、VERBOSE。
  • 引入版本:v3.2.12、v3.3.5
mv_refresh_fail_on_filter_data
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:如果在刷新中存在过滤的数据,则 Mv 刷新将失败,默认情况下为 true,否则通过忽略过滤的数据返回成功。
  • 引入版本:-
mv_create_partition_batch_interval_ms
  • 默认值:1000
  • 类型:Int
  • 单位:毫秒
  • 是否可变:是
  • 描述:在物化视图刷新期间,如果需要批量创建多个分区,系统会将它们分成每批 64 个分区。为了降低因频繁分区创建而导致的故障风险,在每批之间设置默认间隔(以毫秒为单位)以控制创建频率。
  • 引入版本:v3.3
max_mv_refresh_failure_retry_times
  • 默认值:1
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:物化视图刷新失败时的最大重试次数。
  • 引入版本:v3.3.0
max_mv_refresh_try_lock_failure_retry_times
  • 默认值:3
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:物化视图刷新失败时尝试锁定的最大重试次数。
  • 引入版本:v3.3.0
mv_refresh_try_lock_timeout_ms
  • 默认值:30000
  • 类型:Int
  • 单位:毫秒
  • 是否可变:是
  • 描述:物化视图刷新尝试其基本表/物化视图的数据库锁定的默认尝试锁定超时。
  • 引入版本:v3.3.0
enable_mv_refresh_collect_profile
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否默认情况下为所有物化视图在刷新物化视图时启用配置文件。
  • 引入版本:v3.3.0
max_mv_task_run_meta_message_values_length
  • 默认值:16
  • 类型:Int
  • 单位:-
  • 是否可变:是
  • 描述:物化视图任务运行中“额外消息”值(在 set 或 map 中)的最大长度。您可以设置此项以避免占用过多元内存。
  • 引入版本:v3.3.0
max_mv_check_base_table_change_retry_times
  • 默认值:10
  • 类型:-
  • 单位:-
  • 是否可变:是
  • 描述:刷新物化视图时检测基本表更改的最大重试次数。
  • 引入版本:v3.3.0
mv_refresh_default_planner_optimize_timeout
  • 默认值:30000
  • 类型:-
  • 单位:-
  • 是否可变:是
  • 描述:刷新物化视图时,优化器规划阶段的默认超时时间。
  • 引入版本:v3.3.0
enable_mv_refresh_query_rewrite
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否在物化视图刷新期间启用重写查询,以便查询可以直接使用重写的 mv,而不是基本表,从而提高查询性能。
  • 引入版本:v3.3
enable_mv_refresh_extra_prefix_logging
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否在日志中使用物化视图名称作为前缀,以便更好地进行调试。
  • 引入于:v3.4.0
enable_mv_post_image_reload_cache
  • 默认值:true
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:FE 加载映像后是否执行重新加载标志检查。如果对基本物化视图执行了检查,则不需要对与其相关的其他物化视图执行检查。
  • 引入于:v3.5.0
enable_trace_historical_node
  • 默认值:false
  • 类型:Boolean
  • 单位:-
  • 是否可变:是
  • 描述:是否允许系统跟踪历史节点。通过将此项设置为 true,您可以启用缓存共享功能,并允许系统在弹性伸缩期间选择正确的缓存节点。
  • 引入于:v3.5.1