ROW_NUMBER、RANK和DENSE_RANK区别
时间:2025-05-20
来源:互联网
在SQL中,窗口函数是一种强大的工具,用于执行复杂的数据分析任务。其中,ROW_NUMBER()、RANK() 和 DENSE_RANK() 是三种常用的窗口函数,它们在处理排名和排序问题时具有不同的特性和用途。本文将详细介绍这三种函数的区别,包括它们的基本概念、语法结构、应用场景以及实际操作示例,帮助读者更好地理解和掌握这些功能。
一、ROW_NUMBER、RANK和DENSE_RANK概述
1)定义
ROW_NUMBER(): 为每一行生成一个唯一的行号,不会出现重复的行号。
RANK(): 为每一行生成一个排名,相同值的行会得到相同的排名,但下一个排名会跳过相应的数字。
DENSE_RANK(): 为每一行生成一个排名,相同值的行会得到相同的排名,但下一个排名不会跳过数字。
2)特点
ROW_NUMBER(): 唯一性高,适用于需要唯一标识的情况。
RANK(): 排名跳跃,适用于需要精确排名的情况。
DENSE_RANK(): 排名连续,适用于需要连续排名的情况。
二、ROW_NUMBER、RANK和DENSE_RANK的基本语法
基本语法
ROW_NUMBER()ROW_NUMBER()OVER([PARTITIONBYcolumn_list]ORDERBYsort_expression[ASC|DESC])
RANK()RANK()OVER([PARTITIONBYcolumn_list]ORDERBYsort_expression[ASC|DESC])
DENSE_RANK()DENSE_RANK()OVER([PARTITIONBYcolumn_list]ORDERBYsort_expression[ASC|DESC])
参数说明
PARTITION BY: 用于将数据分成多个分区,每个分区内的行号重新开始计数。格式: PARTITION BY column_list
ORDER BY: 用于指定行号的排序规则。格式: ORDER BY sort_expression [ASC | DESC]
三、ROW_NUMBER、RANK和DENSE_RANK的应用场景
数据排名
ROW_NUMBER()
场景: 适用于需要唯一标识的情况,例如生成唯一序列号。
示例:
SELECT
employee_id,
salary,
ROW_NUMBER()OVER(ORDERBYsalaryDESC)ASrow_num
FROMemployees;
解释: 按 salary 降序排列,并生成唯一行号。
RANK()
场景: 适用于需要精确排名的情况,例如竞赛排名。
示例:
SELECT
competitor_id,
score,
RANK()OVER(ORDERBYscoreDESC)ASrank
FROMcompetition_results;
解释: 按 score 降序排列,并生成排名,相同分数的行会得到相同的排名。
DENSE_RANK()
场景: 适用于需要连续排名的情况,例如员工绩效排名。
示例:
SELECT
employee_id,
performance_score,
DENSE_RANK()OVER(ORDERBYperformance_scoreDESC)ASdense_rank
FROMemployee_performance;
解释: 按 performance_score 降序排列,并生成连续排名。
数据去重
ROW_NUMBER()场景: 适用于需要去除重复记录的情况。
示例:
WITHranked_dataAS(
SELECT
customer_id,
order_date,
ROW_NUMBER()OVER(PARTITIONBYcustomer_idORDERBYorder_dateDESC)ASrow_num
FROMorders
)
SELECT
customer_id,
order_date
FROMranked_data
WHERErow_num=1;
解释: 按 customer_id 分区,并在每个分区内按 order_date 降序排列,取出最新的订单日期。
数据分组
ROW_NUMBER()场景: 适用于需要对数据进行分组处理的情况。
示例:
SELECT
department_id,
COUNT(*)ASemployee_count,
ROW_NUMBER()OVER(ORDERBYCOUNT(*)DESC)ASrank
FROMemployees
GROUPBYdepartment_id;
解释: 按 department_id 分组,并统计每个部门的员工数量,最后按员工数量降序排列生成排名。
生成序列号
ROW_NUMBER()场景: 适用于需要为数据生成唯一序列号的情况。
示例:
SELECT
employee_id,
ROW_NUMBER()OVER(ORDERBYemployee_id)ASsequence_number
FROMemployees;
解释: 按 employee_id 升序排列,并生成序列号。
统计排名
RANK()场景: 适用于需要统计竞赛排名的情况。
示例:
SELECT
competitor_id,
score,
RANK()OVER(ORDERBYscoreDESC)ASrank
FROMcompetition_results;
解释: 按 score 降序排列,并生成排名,相同分数的行会得到相同的排名。
生成唯一标识
ROW_NUMBER()场景: 适用于需要生成唯一标识的情况。
示例:
SELECT
employee_id,
ROW_NUMBER()OVER(ORDERBYemployee_id)ASunique_id
FROMemployees;
解释: 按 employee_id 升序排列,并生成唯一标识。
统计分组
ROW_NUMBER()场景: 适用于需要统计分组的情况。
示例:
SELECT
department_id,
COUNT(*)ASemployee_count,
ROW_NUMBER()OVER(ORDERBYCOUNT(*)DESC)ASrank
FROMemployees
GROUPBYdepartment_id;
解释: 按 department_id 分组,并统计每个部门的员工数量,最后按员工数量降序排列生成排名。
四、ROW_NUMBER、RANK和DENSE_RANK的实际操作示例
基础用法
ROW_NUMBER()
场景: 最简单的用法,不带任何子句。
示例:
SELECT
employee_id,
ROW_NUMBER()OVER(ORDERBYemployee_id)ASrow_num
FROMemployees;
解释: 按 employee_id 升序排列,并生成行号。
RANK()
场景: 最简单的用法,不带任何子句。
示例:
SELECT
employee_id,
salary,
RANK()OVER(ORDERBYsalaryDESC)ASrank
FROMemployees;
解释: 按 salary 降序排列,并生成排名。
DENSE_RANK()
场景: 最简单的用法,不带任何子句。
示例:
SELECT
employee_id,
salary,
DENSE_RANK()OVER(ORDERBYsalaryDESC)ASdense_rank
FROMemployees;
解释: 按 salary 降序排列,并生成连续排名。
结合 PARTITION BY 子句
ROW_NUMBER()
场景: 按某一列进行分区,并在每个分区内生成行号。
示例:
SELECT
employee_id,
department_id,
ROW_NUMBER()OVER(PARTITIONBYdepartment_idORDERBYemployee_id)ASrow_num
FROMemployees;
解释: 按 department_id 分区,并在每个分区内按 employee_id 升序排列,生成行号。
RANK()
场景: 按某一列进行分区,并在每个分区内生成排名。
示例:
SELECT
employee_id,
department_id,
salary,
RANK()OVER(PARTITIONBYdepartment_idORDERBYsalaryDESC)ASrank
FROMemployees;
解释: 按 department_id 分区,并在每个分区内按 salary 降序排列,生成排名。
DENSE_RANK()
场景: 按某一列进行分区,并在每个分区内生成连续排名。
示例:
SELECT
employee_id,
department_id,
salary,
DENSE_RANK()OVER(PARTITIONBYdepartment_idORDERBYsalaryDESC)ASdense_rank
FROMemployees;
解释: 按 department_id 分区,并在每个分区内按 salary 降序排列,生成连续排名。
结合 ORDER BY 子句
ROW_NUMBER()
场景: 按某一列进行排序,并生成行号。
示例:
SELECT
employee_id,
salary,
ROW_NUMBER()OVER(ORDERBYsalaryDESC)ASrow_num
FROMemployees;
解释: 按 salary 降序排列,并生成行号。
RANK()
场景: 按某一列进行排序,并生成排名。
示例:
SELECT
employee_id,
salary,
RANK()OVER(ORDERBYsalaryDESC)ASrank
FROMemployees;
解释: 按 salary 降序排列,并生成排名。
DENSE_RANK()
场景: 按某一列进行排序,并生成连续排名。
示例:
SELECT
employee_id,
salary,
DENSE_RANK()OVER(ORDERBYsalaryDESC)ASdense_rank
FROMemployees;
解释: 按 salary 降序排列,并生成连续排名。
结合 PARTITION BY 和 ORDER BY 子句
ROW_NUMBER()
场景: 按某一列进行分区,并在每个分区内按另一列排序,生成行号。
示例:
SELECT
employee_id,
department_id,
salary,
ROW_NUMBER()OVER(PARTITIONBYdepartment_idORDERBYsalaryDESC)ASrow_num
FROMemployees;
解释: 按 department_id 分区,并在每个分区内按 salary 降序排列,生成行号。
RANK()
场景: 按某一列进行分区,并在每个分区内按另一列排序,生成排名。
示例:
SELECT
employee_id,
department_id,
salary,
RANK()OVER(PARTITIONBYdepartment_idORDERBYsalaryDESC)ASrank
FROMemployees;
解释: 按 department_id 分区,并在每个分区内按 salary 降序排列,生成排名。
DENSE_RANK()
场景: 按某一列进行分区,并在每个分区内按另一列排序,生成连续排名。
示例:
SELECT
employee_id,
department_id,
salary,
DENSE_RANK()OVER(PARTITIONBYdepartment_idORDERBYsalaryDESC)ASdense_rank
FROMemployees;
解释: 按 department_id 分区,并在每个分区内按 salary 降序排列,生成连续排名。
ROW_NUMBER()、RANK() 和 DENSE_RANK() 是SQL中常用的窗口函数,它们在处理排名和排序问题时具有不同的特性和用途。本文详细介绍了这三种函数的基本概念、语法结构、应用场景以及实际操作示例,涵盖了基础用法、结合 PARTITION BY 和 ORDER BY 子句的应用场景。通过本文的介绍,读者可以更好地理解并掌握这些函数的使用方法,从而在实际工作中灵活运用这些功能,提高数据处理的效率和准确性。希望本文提供的信息能够帮助读者更好地理解和应用这些函数,从而编写出更高效、更可靠的SQL查询。
以上就是php小编整理的全部内容,希望对您有所帮助,更多相关资料请查看php教程栏目。
-
PHP substr()函数说明(作用、用法、应用) 时间:2025-09-12
-
什么是Ollama Ollama是干嘛用的 Ollama本地部署DeepSeek教程 时间:2025-09-12
-
VMware虚拟机安装、创建、卸载教程 时间:2025-09-12
-
Typora破解版下载及安装教程 Typora免费和付费的区别 时间:2025-09-12
-
GreasyFork镜像下载不了的原因及解决方法 时间:2025-09-12
-
Anaconda是干嘛用的 Anaconda详细安装及使用教程 时间:2025-09-12
今日更新
-
贴吧火星救援是什么梗?揭秘这个爆笑网络热梗的由来和用法,看完秒懂!
阅读:18
-
贴吧老梗是什么梗揭秘网络经典梗的爆笑起源和流行密码
阅读:18
-
贴吧新梗爆火解密 全网热议的贴吧神梗原来是这个 速围观
阅读:18
-
闪耀暖暖福利活动黑白绘心-可免费获取全新稀有服饰
阅读:18
-
重返未来:1999刺客信条联动-联动期间萌新抽卡
阅读:18
-
龙族卡塞尔之门七大罪联动伙伴梅利奥达斯今日正式上线
阅读:18
-
无限暖暖音乐季幕间拾趣-致未来的重逢任务怎么做
阅读:18
-
崩坏星穹铁道3.6版本有什么内容-崩坏星穹铁道3.6版本前瞻
阅读:18
-
时空中的绘旅人往昔回顾-自选卡池于9月14日开放
阅读:18
-
贴吧新梗解密:全网疯传的哈哈哈真实身份竟是这个?速来围观真相!
阅读:18