📄️ Catalog、数据库和表
StarRocks 使用内部目录(internal catalogs)来管理内部数据,并使用外部目录(external catalogs)来访问数据湖中的外部数据。存储在 StarRocks 中的数据由一个内部目录维护,该内部目录包含一个或多个数据库。数据库管理着各种对象,包括表、物化视图和视图,用于存储、管理和操作数据。StarRocks 采用权限系统来控制用户对对象执行操作的权限,从而增强数据安全性。
📄️ 表概述
表是数据存储的基本单位。了解 StarRocks 中的表结构以及如何设计高效的表结构有助于优化数据组织并提高查询效率。此外,与传统数据库相比,StarRocks 可以将 JSON、ARRAY 等复杂的半结构化数据以列式(columnar)方式存储,以提高查询性能。
🗃️ 表类型
5 项
🗃️ 数据分布
5 项
📄️ 数据压缩
StarRocks 支持对表和索引存储进行数据压缩。数据压缩不仅有助于节省存储空间,还提高了 I/O 密集型任务的性能,因为 StarRocks 每次请求可以从磁盘读取更少的页。请注意,数据压缩和解压缩需要额外的 CPU 资源。
🗃️ 索引
7 项
📄️ 混合行-列存储
作为一款 OLAP 数据库,StarRocks 最初以列式存储来存储数据,这可以提高复杂查询(如聚合查询)的性能。从 v3.2.3 开始,StarRocks 也支持以混合行/列存储(hybrid row-column storage)方式存储数据,其中数据以逐行(row-by-row)和逐列(column-by-column)的方式存储。这种混合行/列存储非常适合主键高并发、低延迟的点查询和部分列更新等各种场景,同时提供与列式存储相当的高效分析能力。此外,混合行/列存储支持预处理语句(prepared statements),从而提高了查询性能和安全性。