04-02 10:47 辽宁工业大学 C++ 发布于北京

关注

SQL聚合函数与窗口函数的结合使用

聚合函数与窗口函数的结合使用

在 SQL 中，聚合函数（如 SUM、AVG、MIN、MAX、COUNT）通常用于对一组数据进行计算，返回一个单一的结果。然而，通过与窗口函数（OVER 子句）结合使用，可以在不减少结果集行数的情况下，对每一行应用聚合计算。这种方法非常适用于需要同时保留原始数据和聚合结果的场景。

聚合函数

这些函数用于在一组行上执行聚合计算，同时保留每一行的细节。

SUM(expression)：

计算指定列的总和。

语法：

SUM(expression) OVER (
    [PARTITION BY column1, column2, ...]
    ORDER BY column1 [ASC|DESC], column2 [ASC|DESC], ...
)

AVG(expression)：

计算指定列的平均值。

语法：

AVG(expression) OVER (
    [PARTITION BY column1, column2, ...]
    ORDER BY column1 [ASC|DESC], column2 [ASC|DESC], ...
)

MIN(expression)：

计算指定列的最小值。

语法：

MIN(expression) OVER (
    [PARTITION BY column1, column2, ...]
    ORDER BY column1 [ASC|DESC], column2 [ASC|DESC], ...
)

MAX(expression)：

计算指定列的最大值。

语法：

MAX(expression) OVER (
    [PARTITION BY column1, column2, ...]
    ORDER BY column1 [ASC|DESC], column2 [ASC|DESC], ...
)

COUNT(expression)：

计算指定列的非 NULL 值的数量。

语法：

COUNT(expression) OVER (
    [PARTITION BY column1, column2, ...]
    ORDER BY column1 [ASC|DESC], column2 [ASC|DESC], ...
)

示例数据

假设有一个 sales 表，包含以下数据：

sale_id product_id sale_amount sale_date

1	101	100	2024-01-01
2	101	150	2024-01-02
3	102	200	2024-01-03
4	102	250	2024-01-04
5	103	300	2024-01-05

1. 计算每个产品的总销售额

使用 SUM 函数计算每个产品的总销售额：

SELECT 
    product_id, 
    sale_amount,
    SUM(sale_amount) OVER (PARTITION BY product_id) AS total_sales
FROM 
    sales;

结果：

product_id sale_amount total_sales

101	100	250
101	150	250
102	200	450
102	250	450
103	300	300

2. 计算每个产品的平均销售额

使用 AVG 函数计算每个产品的平均销售额：

SELECT 
    product_id, 
    sale_amount,
    AVG(sale_amount) OVER (PARTITION BY product_id) AS average_sales
FROM 
    sales;

结果：

product_id sale_amount average_sales

101	100	125
101	150	125
102	200	225
102	250	225
103	300	300

3. 计算每个产品的最小销售额

使用 MIN 函数计算每个产品的最小销售额：

SELECT 
    product_id, 
    sale_amount,
    MIN(sale_amount) OVER (PARTITION BY product_id) AS min_sales
FROM 
    sales;

结果：

product_id sale_amount min_sales

101	100	100
101	150	100
102	200	200
102	250	200
103	300	300

4. 计算每个产品的最大销售额

使用 MAX 函数计算每个产品的最大销售额：

SELECT 
    product_id, 
    sale_amount,
    MAX(sale_amount) OVER (PARTITION BY product_id) AS max_sales
FROM 
    sales;

结果：

product_id sale_amount max_sales

101	100	150
101	150	150
102	200	250
102	250	250
103	300	300

5. 计算每个产品的销售记录数

使用 COUNT 函数计算每个产品的销售记录数：

SELECT 
    product_id, 
    sale_amount,
    COUNT(sale_amount) OVER (PARTITION BY product_id) AS sale_count
FROM 
    sales;

结果：

product_id sale_amount sale_count

101	100	2
101	150	2
102	200	2
102	250	2
103	300	1

其他窗口函数（真题中较少使用）

值函数

这些函数用于获取特定行的值。

LEAD(column, n, default)：

获取当前行之后第 n 行的值，如果没有足够的行，则返回默认值。

语法：

LEAD(column, n, default) OVER (
    [PARTITION BY column1, column2, ...]
    ORDER BY column1 [ASC|DESC], column2 [ASC|DESC], ...
)

LAG(column, n, default)：

获取当前行之前第 n 行的值，如果没有足够的行，则返回默认值。

语法：

LAG(column, n, default) OVER (
    [PARTITION BY column1, column2, ...]
    ORDER BY column1 [ASC|DESC], column2 [ASC|DESC], ...
)

FIRST_VALUE(column)：

获取当前分组中的第一个值。

语法：

FIRST_VALUE(column) OVER (
    [PARTITION BY column1, column2, ...]
    ORDER BY column1 [ASC|DESC], column2 [ASC|DESC], ...
)

LAST_VALUE(column)：

获取当前分组中的最后一个值。

语法：

LAST_VALUE(column) OVER (
    [PARTITION BY column1, column2, ...]
    ORDER BY column1 [ASC|DESC], column2 [ASC|DESC], ...
)

分布函数

这些函数用于计算数据的分布情况。

CUME_DIST()：

计算当前行的累积分布，即当前行的值在分组中的相对位置。

语法：

CUME_DIST() OVER (
    [PARTITION BY column1, column2, ...]
    ORDER BY column1 [ASC|DESC], column2 [ASC|DESC], ...
)

PERCENT_RANK()：

计算当前行的百分比排名，即当前行的值在分组中的相对位置。

语法：

PERCENT_RANK() OVER (
    [PARTITION BY column1, column2, ...]
    ORDER BY column1 [ASC|DESC], column2 [ASC|DESC], ...
)

全部评论

推荐最新楼层

03-26 18:34

门头沟学院 Java

SQL大厂笔试竟被这个函数霸屏

在SQL的世界里，窗口函数（Window Functions）就像是一个超级工具箱，能让你在不减少结果集行数的情况下，对数据进行分组、排序和聚合计算。无论是笔试真题还是实际工作中，窗口函数都是你不可或缺的利器。今天，我们就来聊聊这些强大的函数，以及如何在牛客题库中找到相关练习，提升你的SQL技能！ 为什么窗口函数如此重要？ 窗口函数允许你在一组行上执行计算，同时保留每一行的细节。这意味着你可以在不丢失数据的情况下，进行复杂的分析和计算。无论是排名、聚合还是获取特定行的值，窗口函数都能帮你轻松搞定。 值得关注的是，在近几年的 SQL 笔试真题中，窗口函数的出镜率持续攀升，已然成为考查的重点与热点...

投递蚂蚁集团等公司10个岗位 >

点赞评论收藏

03-27 18:38

蚌埠坦克学院大数据开发工程师

美团数开暑期oc

一面项目拷打spark数据倾斜hive udf udaf udtf区别flink水位线机制java常用集合java线程池创建线程手撕sql不难手撕最小前k个数（问能不能Arrays.sort，面试官说可以，他真的，我哭死😭）一小时后直接二面维度建模相关spark的stage划分对未来的思考手撕sql

美团开奖913人在聊

查看11道真题和解析

点赞评论收藏

04-09 19:32

海尔_集团总部HR(准入职员工)

海尔智家内推-海尔智家内推码

入职海尔智家的DAY11，终于迎来了传说中的“海尔智家创客训练营开营仪式”。 先say say这次活动的感受，一共分了四个篇章，没有想象中的“班味儿十足”。最喜欢的就是BOSS答疑环节，基本各产业的平台主都给创客进行了答疑，传闻的那些严肃、不苟言笑的领导基本都是不存在的。 培训体会✨ 虽然还没有正式进入工作岗位，但是从带我们的导师以及培训活动中可以想象到，海尔智家还是很开放的，创客可以自由提出自己的工作想法，并不是“只做听话的牛马”~导师都很nice，人生头一次遇到工作培训是玩“剧本杀”的。 公司福利✨ 海尔智家的待遇也是非常不错的，作为青岛头部的大厂，无论是五险一金，还是日常的各种补助、假期...

海尔智家公司福利 57人发布

点赞评论收藏

04-09 23:58

吉首大学测试开发

吉比特&&雷霆游戏运维工程师

有无老哥这周面吉比特运维的，都问了写啥求经验分享##运维# #吉比特##面经##牛客AI配图神器#

点赞评论收藏

04-08 18:35

淘天集团_前端开发工程师(准入职员工)

顺丰内推顺丰内推码

已经来工作一个多月啦，感觉幸福度很高，顺丰真的是很值得来的一家公司！公司里的氛围很好，同事们很nice很好沟通，和大家私下相处也贼融洽。工作很充实但是没什么压力，领导带教都不push，感觉每天来公司都很开心~💼 公司岗位数据分析💢 工作强度在整个集团里算卷的，顺丰科技大多数部门965美滋滋，但是我进的部门业务多975，双休基本可以保证，需求多的话周末也要赶一下进度。🫶️ 团队氛围进的团队好，前辈都很热心教人，有问必答。❤️ 职场感受希望我这次转正能通过吧，能过的话会来报喜😊4月还有很多HC！！！顺丰科技25届校招+实习内推启动！【🍀内推码】0H0PCC（简历来源选择校园大使...

顺丰集团工作强度 106人发布

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 参加完秋招的机械人，还参加春招吗？ #