📄️ Catalog、数据库和表
StarRocks 使用内部 Catalog 管理内部数据,使用外部 Catalog 访问数据湖中的外部数据。存储在 StarRocks 中的数据维护在内部 Catalog 中,该 Catalog 由一个或多个数据库组成。数据库管理各种对象,包括表、物化视图和视图,以存储、管理和操作数据。StarRocks 采用权限系统来控制用户对对象执行操作的权限,从而增强数据安全性。
📄️ 表概述
表是数据存储的单元。了解 StarRocks 中的表结构以及如何设计高效的表结构有助于优化数据组织并提高查询效率。此外,与传统数据库相比,StarRocks 可以以列式方式存储复杂的半结构化数据(例如 JSON、ARRAY),以提高查询性能。
🗃️ 表类型
5 项
🗃️ 数据分布
5 项
📄️ 数据压缩
StarRocks 支持表和索引存储的数据压缩。数据压缩不仅有助于节省存储空间,还可以提高 I/O 密集型任务的性能,因为 StarRocks 可以为每个请求从磁盘读取更少的页面。请注意,压缩和解压缩数据需要额外的 CPU 资源。
🗃️ 索引
7 项
📄️ 混合行-列存储
作为 OLAP 数据库,StarRocks 最初以列式存储方式存储数据,这可以提高复杂查询(例如聚合查询)的性能。自 v3.2.3 起,StarRocks 还支持以混合行-列存储方式存储数据,其中数据以逐行和逐列方式存储。这种混合行-列存储非常适合各种场景,例如基于主键的高并发、低延迟点查询和部分列更新,同时提供与列式存储相当的高效分析能力。此外,混合行-列存储支持预处理语句,从而提高查询性能和安全性。