📄️ base64_to_bitmap
在将 Bitmap 数据导入 StarRocks 之前,您需要序列化数据并将数据编码为 Base64 字符串。 将 Base64 字符串导入 StarRocks 时,您需要将字符串转换为 Bitmap 数据。
📄️ bitmap_agg
将列中的值(不包括 NULL)聚合为 Bitmap(多行合并为一行)。
📄️ bitmap_and
计算两个输入 Bitmap 的交集,并返回新的 Bitmap。
📄️ bitmap_andnot
返回存在于 lhs 但不存在于 rhs 中的 Bitmap 值,并返回新的 Bitmap。
📄️ bitmap_contains
计算输入值是否在 Bitmap 列中,并返回布尔值。
📄️ bitmap_count
返回输入 Bitmap 的 1 位计数。
📄️ bitmap_empty
返回一个空的 Bitmap。 它主要用于在插入或流式加载期间填充默认值。 例如
📄️ bitmap_from_binary
将具有特定格式的二进制字符串转换为 Bitmap。
📄️ bitmap_from_string
将字符串转换为 BITMAP。 该字符串由一组以逗号分隔的 UINT64 数字组成。 例如,字符串“0, 1, 2”将被转换为一个 Bitmap,其中位 0、1 和 2 被设置。 如果输入字段无效,将返回 NULL。
📄️ bitmap_has_any
计算两个 Bitmap 列之间是否存在相交元素,返回值是布尔值。
📄️ bitmap_hash
计算任何类型输入的 32 位哈希值,并返回包含该哈希值的 Bitmap。 它主要用于流式加载任务,将非整数字段导入到 StarRocks 表的 Bitmap 字段中。 例如
📄️ bitmap_intersect
聚合函数,用于计算分组后的 Bitmap 交集。 常见的用法场景,例如计算用户留存率。
📄️ bitmap_max
获取 Bitmap 的最大值。 如果 Bitmap 为 NULL,则此函数返回 NULL。 如果 Bitmap 为空,则默认情况下此函数返回 NULL。
📄️ bitmap_min
获取 Bitmap 的最小值。 如果 Bitmap 为 NULL,则此函数返回 NULL。 如果 Bitmap 为空,则默认情况下此函数返回 NULL。
📄️ bitmap_or
计算两个输入 Bitmap 的并集,并返回新的 Bitmap。
📄️ bitmap_remove
从 Bitmap 值 lhs 中删除输入,并返回结果集。
📄️ bitmap_subset_in_range
从 Bitmap 值中截取 startrange 和 endrange 范围内的元素(不包括 endrange)。 输出元素是 Bitmap 值的子集。
📄️ bitmap_subset_limit
从 BITMAP 值中截取指定数量的元素,元素值从 start range 开始。 输出元素是 src 的子集。
📄️ bitmap_to_array
将 BITMAP 转换为 BIGINT 数组。
📄️ bitmap_to_base64
将 Bitmap 转换为 Base64 编码的字符串。 此函数从 v2.5 开始支持。
📄️ bitmap_to_binary
将 Bitmap 值转换为二进制字符串。
📄️ bitmap_to_string
将输入的 Bitmap 转换为以逗号 (,) 分隔的字符串。 此字符串包含 Bitmap 中的所有位。 如果输入为 null,则返回 null。
📄️ bitmap_union
计算分组后一组值的 Bitmap 并集。 常见的用法场景包括计算 PV 和 UV。
📄️ bitmap_union_count
返回一组 Bitmap 值的并集,并返回并集的基数。 此函数从 v2.3 开始支持。
📄️ bitmap_union_int
统计 TINYINT、SMALLINT 和 INT 类型列中的不同值数量,返回与 COUNT (DISTINCT expr) 相同的总和。
📄️ bitmap_xor
计算由 lhs 和 rhs 独有的元素组成的集合。 逻辑上等价于 bitmapandnot(bitmapor(lhs, rhs), bitmap_and(lhs, rhs))(补集)。
📄️ intersect_count
一个用于查找两个 Bitmap 值的交集大小(相同元素的数量)的函数,无需数据分布是正交的。 第一个参数是 Bitmap 列,第二个参数是用于过滤的维度列,第三个参数是可变长度参数,表示过滤维度列的不同值。
📄️ sub_bitmap
从 BITMAP 值 src 中截取从 offset 指定的位置开始的 len 个元素。 输出元素是 src 的子集。
📄️ subdivide_bitmap
将大型 Bitmap 分割成多个子 Bitmap。
📄️ to_bitmap
输入是无符号 bigint,其值范围为 0 到 18446744073709551615,输出是包含此元素的 Bitmap。 此函数主要用于流式加载任务,将整数字段导入到 StarRocks 表的 Bitmap 字段中。 例如
📄️ unnest_bitmap
unnest_bitmap 是一个表函数,它接受一个 Bitmap 并将该 Bitmap 中的元素转换为表的多行。