网站首页 > 教程分享 正文
今天我们来看看大数据开发中row_number函数。
作为一名程序员,求职面试时时常会遇到需要编写一些基础的sql,编写sql这样做的目的主要是考验求职者的逻辑思维及编写sql基础能力。而row_number() 函数在面试中得到了不少面试官的青睐,有的面试官喜欢用这个知识点来考察应聘者。
我们来看看下面这道题目。
有张员工表tb_employee 表包含员工基本信息,每个员工有其对应的 user_id、user_name、salary和department_name
面试官:编写一个 SQL 查询,找出每个部门工资第二高的员工。
这种情况我们可以尝试用row_number() 函数实现。
语法
row_number() over(partition by [要分组的列] order by [排序列])
row_number() 函数将select语句返回的每一行,从1开始编号,赋予其连续的序号。在查询时应用了一个排序标准后,只有通过序号才能够保证其顺序是一致的,当使用row_number() 函数时,也需要专门一列用于预先排序以便于进行编号。
partition by关键字是分析性函数的一部分,它和聚合函数不同的地方在于它能返回一个分组中的多条记录,而聚合函数一般只有一条反映统计值的记录,partition by用于给结果集分组, 如果没有指定那么它把整个结果集作为一个分组,分区函数一般与排名函数一起使用。
create table if not exists test.tb_employee(
`user_id` int ,
`user_name` string ,
`salary` double ,
`department_name` string
)row format delimited fields terminated by ',' stored as textfile;
新增数据
insert into test.tb_employee(user_id,user_name,salary,department_name) values(1,'李四',4000,'运营部');
insert into test.tb_employee(user_id,user_name,salary,department_name) values(2,'王五',5000,'运营部');
insert into test.tb_employee(user_id,user_name,salary,department_name) values(3,'张工',6000,'运营部');
insert into test.tb_employee(user_id,user_name,salary,department_name) values(4,'小爱',7000,'运营部');
insert into test.tb_employee(user_id,user_name,salary,department_name) values(5,'小张',3000,'行政部');
insert into test.tb_employee(user_id,user_name,salary,department_name) values(6,'小李',4000,'行政部');
insert into test.tb_employee(user_id,user_name,salary,department_name) values(7,'小王',5000,'行政部');
insert into test.tb_employee(user_id,user_name,salary,department_name) values(8,'小洪',6000,'行政部');
insert into test.tb_employee(user_id,user_name,salary,department_name) values(9,'小刘',7000,'行政部');
能看出每个部门工资第二高的员工分别为
--运营部编号为3的张工 薪资6000
--行政部编号为8的小洪 薪资6000
那么Sql如何编写,我们可以用row_number() 这样写。
select
*
from
(select
*, row_number() over(partition by department_name order by salary desc) as rn
from
test.tb_employee )as a
where
rn = 2;
运行结果:
关于row_number()函数,在大数据开发中,更多的是用来去重。可以根据分组,取rn=1最新的一条记录。
由于笔者知识及水平有限,文中错漏之处在所难免,如有不足之处,欢迎交流。
- 上一篇: 从Excel到SQL:效率增倍,错误减半
- 下一篇: SQL优化——IN和EXISTS谁的效率更高
猜你喜欢
- 2024-09-09 SQL Server优化50法(sql server 优化)
- 2024-09-09 SQLServer-高级篇(sqlserver ag)
- 2024-09-09 2022-12-17:订单最多的客户。以下数据,结果输出3。请问sql语句
- 2024-09-09 springboot整合mybatis使用xml实现sql语句的查询配置
- 2024-09-09 Qt的数据库(Driver类、Query类、Model类、View类)
- 2024-09-09 VBA+ADO+SQL语句,小试牛刀。(vba的sql)
- 2024-09-09 MS SQL Server——SQL语句导入导出大全
- 2024-09-09 mysql根据条件执行sql(mysql根据条件查询)
- 2024-09-09 MyBatis3-动态SQL语句(navicat怎么写sql语句)
- 2024-09-09 SQL优化——IN和EXISTS谁的效率更高
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- css导航条 (66)
- sqlinsert (63)
- js提交表单 (60)
- param (62)
- parentelement (65)
- jquery分享 (62)
- check约束 (64)
- curl_init (68)
- sql if语句 (69)
- import (66)
- chmod文件夹 (71)
- clearinterval (71)
- pythonrange (62)
- 数组长度 (61)
- javafx (59)
- 全局消息钩子 (64)
- sort排序 (62)
- jdbc (69)
- php网页源码 (59)
- assert h (69)
- httpclientjar (60)
- postgresql conf (59)
- winform开发 (59)
- mysql数字类型 (71)
- drawimage (61)
本文暂时没有评论,来添加一个吧(●'◡'●)