本帖最后由 levycui 于 2020-6-9 14:44 编辑
本文通过简单易懂的业务场景,旨在提高大家的 SQL 水平。把文中所有的 SQL 全理解了,工作中遇到的各种 SQL 场景和面试中遇到的各种 SQL 问题都能灵活应对。文中所有的 SQL 都支持 Hive 语法,学会了 Hive 的 SQL,那么 MySQL 的 SQL 题也都可以 cover 住,下面的题目难度从简单到困难的都有。笔者在之前练习 SQL 过程中,发现了网上一些比较好的 SQL 题目,但是苦于好多博客提供的 SQL 可读性、规范性、执行效率并不高,因此才有了今天这篇博文,后续如果发现有可优化的的 SQL,笔者会持续更新。
数据表介绍
学生表
[mw_shl_code=sql,true]create table study.student (
student_id string -- 学生编号
,name string -- 学生姓名
,birthday string -- 学生生日
,sex string -- 学生性别
)
stored as parquet
tblproperties("orc.compress"="snappy");[/mw_shl_code]
教师表
[mw_shl_code=sql,true]create table study.teacher (
teacher_id string -- 教师编号
,name string -- 教师姓名
)
stored as parquet
tblproperties("orc.compress"="snappy");[/mw_shl_code]
课程表
[mw_shl_code=sql,true]create table study.course (
course_id string -- 课程编号
,name string -- 课程名
,teacher_id string -- 课程对应的教师编号
)
stored as parquet
tblproperties("orc.compress"="snappy");[/mw_shl_code]
成绩表
[mw_shl_code=sql,true]create table study.score (
student_id string -- 学生编号
,course_id string -- 课程编号
,score int -- 对应的成绩
)
stored as parquet
tblproperties("orc.compress"="snappy");[/mw_shl_code]
答题时请注意:
- 这里认为课程可能是选修课,学生不一定学了所有课程
- 成绩表里的课程都应该在课程表里存在,而且每门课程都应该有对应的教师,且在教师表里可以找到
- 成绩表里的学生也应该在学生表里存在
- 下面的导入数据也是随机写的,读者也可以自己随机制造生成数据导入
具体如何使用SQL解答面试题?
可下载文档:
Hive-SQL面试?看这篇足够!附答案 .pdf
(634.9 KB, 下载次数: 33)
|
|