📄️ any_value
从每个聚合组中获取任意一行。您可以使用此函数来优化具有 GROUP BY 子句的查询。
📄️ approx_count_distinct
返回聚合函数的近似值,类似于 COUNT(DISTINCT col) 的结果。
📄️ approx_top_k
返回 expr 中出现频率最高的前 k 个项目值及其近似计数。
📄️ avg
返回所选字段的平均值。
📄️ bitmap
这是一个简单的示例,说明了 Bitmap 中几个聚合函数的用法。 有关详细的函数定义或更多 Bitmap 函数,请参见 bitmap-functions。
📄️ corr
返回两个表达式之间的 Pearson 相关系数。 此函数从 v2.5.10 开始支持。 它也可以用作窗口函数。
📄️ count
返回由表达式指定的总行数。
📄️ count_if
返回满足指定条件的记录数,如果没有任何记录满足条件,则返回 0。
📄️ covar_pop
返回两个表达式的总体协方差。 此函数从 v2.5.10 开始支持。 它也可以用作窗口函数。
📄️ covar_samp
返回两个表达式的样本协方差。 此函数从 v2.5.10 开始支持。 它也可以用作窗口函数。
📄️ ds_hll_count_distinct
返回聚合函数的近似值,类似于 COUNT(DISTINCT col) 的结果。 APPROXCOUNTDISTINCT(expr) 是类似的函数。
📄️ ds_theta_count_distinct
返回聚合函数的近似值,类似于 COUNT(DISTINCT col) 的结果。 对于高基数列,dsthetacount_distinct 比 COUNT(DISTINCT col) 更快,使用的内存更少。
📄️ group_concat
将组中的非空值连接到单个字符串中,带有一个 sep 参数,如果未指定,则默认为 , 。 此函数可用于将一列中多行的值连接到一个字符串中。
📄️ grouping
指示列是否为聚合列。 如果是聚合列,则返回 0。 否则,返回 1。
📄️ grouping_id
grouping_id 用于区分同一分组标准的分组统计结果。
📄️ hll_raw_agg
此函数是一个聚合函数,用于聚合 HLL 字段。 它返回一个 HLL 值。
📄️ hll_union
返回一组 HLL 值的串联。
📄️ hll_union_agg
HLL 是基于 HyperLogLog 算法的工程实现,用于保存 HyperLogGog 计算过程的中间结果。
📄️ mann_whitney_u_test
mannwhitneyu_test 对来自两个总体的样本执行 Mann-Whitney 秩检验。 Mann-Whitney U 检验是一种非参数检验,可用于确定两个总体是否从同一分布中选择。
📄️ max
返回 expr 表达式的最大值。
📄️ max_by
返回与 y 的最大值关联的 x 值。
📄️ min
返回 expr 表达式的最小值。
📄️ min_by
返回与 y 的最小值关联的 x 值。
📄️ multi_distinct_count
返回 expr 的总行数,等效于 count(distinct expr)。
📄️ multi_distinct_sum
返回 expr 中不同值的总和,等效于 sum(distinct expr)。
📄️ percentile_approx
返回第 p 个百分位数的近似值,其中 p 的值介于 0 和 1 之间。
📄️ percentile_approx_weight
返回带有权重的第 p 个百分位数的近似值。 percentileapproxweight 是 PERCENTILE_APPROX 的加权版本,允许用户为每个输入值指定权重(常量值或数字列)。
📄️ percentile_cont
使用线性插值计算 expr 的百分位数值。
📄️ percentile_disc
返回基于输入列 expr 的离散分布的百分位数值。 如果找不到确切的百分位数值,则此函数返回两个最接近值之间的较大值。
📄️ percentile_disc_lc
返回基于输入列 expr 的离散分布的百分位数值。 与 percentiledisc 的行为相同。 但是,实现算法是不同的。 percentiledisc 需要获取所有输入数据,并且通过归并排序来获得百分位数值所消耗的内存是所有输入数据的内存。 另一方面,percentiledisclc 构建了一个 key->count 的哈希表,因此当输入基数较低时,即使输入数据量很大,也没有明显的内存增加。
📄️ retention
计算指定时间段内的用户留存率。 此函数接受 1 到 31 个条件,并评估每个条件是否为真。 如果条件评估为真,则返回 1。 否则,返回 0。 它最终返回一个由 0 和 1 组成的数组。 您可以根据这些数据计算用户留存率。
📄️ std
返回表达式的标准差。 从 v2.5.10 开始,此函数也可以用作窗口函数。
📄️ stddev,stddev_pop,std
返回 expr 表达式的总体标准差。 从 v2.5.10 开始,此函数也可以用作窗口函数。
📄️ stddev_samp
返回表达式的样本标准差。 从 v2.5.10 开始,此函数也可以用作窗口函数。
📄️ sum
返回 expr 的非空值的总和。 您可以使用 DISTINCT 关键字来计算不同非空值的总和。
📄️ var_samp,variance_samp
返回表达式的样本方差。 从 v2.5.10 开始,此函数也可以用作窗口函数。
📄️ variance,var_pop,variance_pop
返回表达式的总体方差。 从 v2.5.10 开始,此函数也可以用作窗口函数。
📄️ window_funnel
在滑动窗口中搜索事件链,并计算事件链中连续事件的最大数量。 此函数通常用于分析转化率。 它从 v2.3 开始支持。