版本: 最新版本-3.5

STRUCT

STRUCT 广泛用于表达复杂的数据类型。它表示具有不同数据类型的一组元素（也称为字段），例如，<a INT, b STRING>。

struct 中的字段名称必须是唯一的。字段可以是原始数据类型（如数值、字符串或日期）或复杂数据类型（如 ARRAY 或 MAP）。

struct 中的字段也可以是另一个 STRUCT、ARRAY 或 MAP，这允许您创建嵌套的数据结构，例如，STRUCT<a INT, b STRUCT<c INT, d INT>, c MAP<INT, INT>, d ARRAY<INT>>。

STRUCT 数据类型从 v3.1 开始支持。在 v3.1 中，您可以在创建 StarRocks 表时定义 STRUCT 列，将 STRUCT 数据加载到该表中，并查询 MAP 数据。

从 v2.5 开始，StarRocks 支持从数据湖查询复杂数据类型 MAP 和 STRUCT。您可以使用 StarRocks 提供的外部 Catalog 来查询来自 Apache Hive™、Apache Hudi 和 Apache Iceberg 的 MAP 和 STRUCT 数据。您只能查询 ORC 和 Parquet 文件中的数据。有关如何使用外部 Catalog 查询外部数据源的更多信息，请参阅Catalog 概览和与所需 Catalog 类型相关的主题。

语法

STRUCT<name, type>

name：字段名称，与 CREATE TABLE 语句中定义的列名相同。
type：字段类型。可以是任何支持的类型。

在 StarRocks 中定义 STRUCT 列

您可以在创建表时定义 STRUCT 列，并将 STRUCT 数据加载到此列中。

-- Define a one-dimensional struct.
CREATE TABLE t0(
  c0 INT,
  c1 STRUCT<a INT, b INT>
)
DUPLICATE KEY(c0);

-- Define a complex struct.
CREATE TABLE t1(
  c0 INT,
  c1 STRUCT<a INT, b STRUCT<c INT, d INT>, c MAP<INT, INT>, d ARRAY<INT>>
)
DUPLICATE KEY(c0);

-- Define a NOT NULL struct.
CREATE TABLE t2(
  c0 INT,
  c1 STRUCT<a INT, b INT> NOT NULL
)
DUPLICATE KEY(c0);

具有 STRUCT 类型的列具有以下限制

不能用作表中的 Key 列。它们只能用作 Value 列。
不能用作表中的分区键列（在 PARTITION BY 之后）。
不能用作表中的分桶列（在 DISTRIBUTED BY 之后）。
当用作聚合表中的 Value 列时，仅支持 replace() 函数。

在 SQL 中构造 struct

可以使用以下函数在 SQL 中构造 STRUCT：row, struct 和 named_struct。 struct() 是 row() 的别名。

row 和 struct 支持未命名的 struct。您无需指定字段名称。 StarRocks 会自动生成列名，例如 col1、col2...
named_struct 支持命名的 struct。名称和值的表达式必须成对出现。

StarRocks 根据输入值自动确定 struct 的类型。

select row(1, 2, 3, 4) as numbers; -- Return {"col1":1,"col2":2,"col3":3,"col4":4}.
select row(1, 2, null, 4) as numbers; -- Return {"col1":1,"col2":2,"col3":null,"col4":4}.
select row(null) as nulls; -- Return {"col1":null}.
select struct(1, 2, 3, 4) as numbers; -- Return {"col1":1,"col2":2,"col3":3,"col4":4}.
select named_struct('a', 1, 'b', 2, 'c', 3, 'd', 4) as numbers; -- Return {"a":1,"b":2,"c":3,"d":4}.

加载 STRUCT 数据

您可以使用两种方法将 STRUCT 数据加载到 StarRocks 中：INSERT INTO 和 ORC/Parquet 加载。

请注意，StarRocks 会自动将数据类型转换为相应的 STRUCT 类型。将数据加载到命名 struct 列时，请确保 struct 中的字段名称顺序与创建表时指定的顺序相同。

INSERT INTO

CREATE TABLE t0(
  c0 INT,
  c1 STRUCT<a INT, b INT>
)
DUPLICATE KEY(c0);

INSERT INTO t0 VALUES(1, row(1, 1));

SELECT * FROM t0;
+------+---------------+
| c0   | c1            |
+------+---------------+
|    1 | {"a":1,"b":1} |
+------+---------------+

从 ORC/Parquet 文件加载 STRUCT 数据

StarRocks 中的 STRUCT 数据类型对应于 ORC 或 Parquet 格式中的嵌套列结构。无需额外指定。您可以按照 ORC/Parquet 加载中的说明从 ORC 或 Parquet 文件加载 STRUCT 数据。

访问 STRUCT 字段

要查询 struct 的子字段，您可以使用点 (.) 运算符按字段名称查询值，或使用 [] 按索引调用值。

mysql> select named_struct('a', 1, 'b', 2, 'c', 3, 'd', 4).a;
+------------------------------------------------+
| named_struct('a', 1, 'b', 2, 'c', 3, 'd', 4).a |
+------------------------------------------------+
| 1                                              |
+------------------------------------------------+

mysql> select row(1, 2, 3, 4).col1;
+-----------------------+
| row(1, 2, 3, 4).col1  |
+-----------------------+
| 1                     |
+-----------------------+

mysql> select row(2, 4, 6, 8)[2];
+--------------------+
| row(2, 4, 6, 8)[2] |
+--------------------+
|                  4 |
+--------------------+

mysql> select row(map{'a':1}, 2, 3, 4)[1];
+-----------------------------+
| row(map{'a':1}, 2, 3, 4)[1] |
+-----------------------------+
| {"a":1}                     |
+-----------------------------+

语法​

在 StarRocks 中定义 STRUCT 列​

在 SQL 中构造 struct​

加载 STRUCT 数据​

INSERT INTO​

从 ORC/Parquet 文件加载 STRUCT 数据​

访问 STRUCT 字段​

您觉得这篇文档怎么样？

语法