0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

你知道如何去求解连续区间吗?

数据分析与开发 来源:大数据技术团队 作者:Lotus 2021-06-21 17:42 次阅读

求解连续区间是数据分析、数据仓库笔试面试中常考的SQL题目,今天为各位小伙伴分享笔试面试题,期待各位拿到心仪的offer或有所收获!

1、连续出现的数字

编写一个 SQL 查询,查找所有至少连续出现三次的数字。

+----+-----+| Id | Num |+----+-----+| 1 | 1 || 2 | 1 || 3 | 1 || 4 | 2 || 5 | 1 || 6 | 2 || 7 | 2 |+----+-----+例如,给定上面的Logs表,1是唯一连续出现至少三次的数字。

+-----------------+| ConsecutiveNums |+-----------------+| 1 |+-----------------+

解法一:自连接三次,筛选l1,l2,l3的id连续且Num相等的行

注:如果数字连续出现超过三次,Num就会出现重复值,所以需要使用distinct去重

该方法实现简单,但是时间复杂度较大,且如果改成连续出现4,5..10次,代码就会非常冗余,不具备可拓展性。

select distinct l1.Num as ConsecutiveNumsfrom Logs l1,Logs l2,Logs l3where l2.Id = l1.Id + 1and l3.Id = l2.Id + 1and l1.Num = l2.Numand l2.Num = l3.Num

解法二:使用自定义变量进行条件判断

速度比解法一快,且适用于任一连续次数

select distinct Num ConsecutiveNumsfrom( select Num, case when @prev = Num then @count := @count+1 --如果与之前相等则+1 else (@prev := Num) and (@count := 1) --如果不相等 重新赋值,count变1 end CNT from Logs,(select @prev := 0, @count := 0) t --变量初始化) t where t.CNT>=3

解法三:窗口函数

select distinct Num as ConsecutiveNumsfrom( select Num,Id, lag(Id,2)over(partition by Num order by Id) as prev from Logs)twhere t.Id = t.prev + 2

2、找到连续区间的开始和结束数字

表:Logs

+---------------+---------+| Column Name | Type |+---------------+---------+| log_id | int |+---------------+---------+ id 是上表的主键。上表的每一行包含日志表中的一个 ID。后来一些 ID 从 Logs 表中删除。编写一个 SQL 查询得到 Logs 表中的 连续区间的开始数字和结束数字。 将查询表按照 start_id 排序。查询结果格式如下面的例子: Logs 表:

+------------+| log_id |+------------+| 1 || 2 || 3 || 7 || 8 || 10 |+------------+结果表:

+------------+--------------+| start_id | end_id |+------------+--------------+| 1 | 3 || 7 | 8 || 10 | 10 |+------------+--------------+结果表应包含 Logs 表中的所有区间。 从 1 到 3 在表中。 从 4 到 6 不在表中。 从 7 到 8 在表中。 9 不在表中。 10 在表中。

解题思路:

(1)使用两个变量,一个@id用来记录logid,可以比较当下log_id与之前log_id的差值,判断是否连续。一个@num用来储存连续状态

select log_id, case when @id = log_id - 1 then @num := @num else @num := @num + 1 end num, @id := log_idfrom Logs,(select @num := 0,@id := null)t

上述输出结果如下所示

输入:{"headers":{"Logs":["log_id"]},"rows":{"Logs":[[1],[2],[3],[7],[8],[10]]}} 输出:{"headers": ["log_id", "num", "@prev_id := log_id"], "values": [[1, "1", 1], [2, "1", 2], [3, "1", 3], [7, "2", 7], [8, "2", 8], [10, "3", 10]]}

(2)得到上述结果后,用num字段分组,最小log_id为start_id,最大log_id为end_id。

select min(log_id) start_id, max(log_id) end_idfrom( select log_id, case when @id = log_id - 1 then @num := @num else @num := @num + 1 end num, @id := log_id from Logs,(select @num := 0,@id := null)t)t2group by num

3、报告系统状态的连续日期

Table: Failed

+--------------+---------+| Column Name | Type |+--------------+---------+| fail_date | date |+--------------+---------+该表主键为 fail_date。 该表包含失败任务的天数. Table: Succeeded

+--------------+---------+| Column Name | Type |+--------------+---------+| success_date | date |+--------------+---------+该表主键为 success_date。该表包含成功任务的天数. 系统每天运行一个任务。每个任务都独立于先前的任务。任务的状态可以是失败或是成功。编写一个 SQL 查询 2019-01-01 到 2019-12-31 期间任务连续同状态 period_state 的起止日期(start_date 和 end_date)。即如果任务失败了,就是失败状态的起止日期,如果任务成功了,就是成功状态的起止日期。 最后结果按照起始日期start_date排序查询结果样例如下所示: Failed table:

+-------------------+| fail_date |+-------------------+| 2018-12-28 || 2018-12-29 || 2019-01-04 || 2019-01-05 |+-------------------+Succeeded table:

+-------------------+| success_date |+-------------------+| 2018-12-30 || 2018-12-31 || 2019-01-01 || 2019-01-02 || 2019-01-03 || 2019-01-06 |+-------------------+Result table:

+--------------+--------------+--------------+| period_state | start_date | end_date |+--------------+--------------+--------------+| succeeded | 2019-01-01 | 2019-01-03 || failed | 2019-01-04 | 2019-01-05 || succeeded | 2019-01-06 | 2019-01-06 |+--------------+--------------+--------------+结果忽略了2018年的记录,因为我们只关心从2019-01-01到2019-12-31的记录从 2019-01-01 到 2019-01-03 所有任务成功,系统状态为 "succeeded"。从 2019-01-04 到 2019-01-05 所有任务失败,系统状态为 "failed"。从 2019-01-06 到 2019-01-06 所有任务成功,系统状态为 "succeeded"。

解题思路:核心方法与上题一样

(1)使用union all合并两个表结果(相当于比第二题多了个state列)

(2)剩下思路同第二题,但是要维护一个@state状态,只有当日期连续增加,同时@sate不变的时候才能保持num不变

select period_state, min(task_date) as start_date, max(task_date) as end_datefrom( select period_state,task_date, case when datediff(task_date,@date) = 1 and @state = period_state then @num := @num else @num := @num + 1 end num, @date := task_date, @state := period_state from ( select 'succeeded' as period_state,success_date as task_date from Succeeded where success_date between '2019-01-01' and '2019-12-31' union all select 'failed' as period_state,fail_date as task_date from Failed where fail_date between '2019-01-01' and '2019-12-31' order by task_date ) t1,(select @date := null,@num := 0,@state := null) t2)t3group by period_state,numorder by start_date

4、体育馆流量

X 市建了一个新的体育馆,每日人流量信息被记录在这三列信息中:序号 (id)、日期 (visit_date)、 人流量 (people)。

请编写一个查询语句,找出人流量的高峰期。高峰期时,至少连续三行记录中的人流量不少于100。

例如,表stadium:

+------+------------+-----------+| id | visit_date | people |+------+------------+-----------+| 1 | 2017-01-01 | 10 || 2 | 2017-01-02 | 109 || 3 | 2017-01-03 | 150 || 4 | 2017-01-04 | 99 || 5 | 2017-01-05 | 145 || 6 | 2017-01-06 | 1455 || 7 | 2017-01-07 | 199 || 8 | 2017-01-08 | 188 |+------+------------+-----------+

对于上面的示例数据,输出为:

+------+------------+-----------+| id | visit_date | people |+------+------------+-----------+| 5 | 2017-01-05 | 145 || 6 | 2017-01-06 | 1455 || 7 | 2017-01-07 | 199 || 8 | 2017-01-08 | 188 |+------+------------+-----------+

提示:每天只有一行记录,日期随着 id 的增加而增加。

利用自定义变量求解

1.定义一个变量cnt,如果people >= 100,加1,否则变为0,这样如果连续三行记录大于等于100,就会出现连续增加的序列

2.利用id是有序增加的,找出人流量的高峰期

select distinct s.*from stadium s,( select id,visit_date,people, case when people >= 100 then @cnt := @cnt + 1 else @cnt := 0 end as cnt from stadium,(select @cnt:=0)a)bwhere b.cnt >= 3 and s.id between b.id-b.cnt+1 and b.id

责任编辑:lq6

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SQL
    SQL
    +关注

    关注

    1

    文章

    775

    浏览量

    44303
  • 函数
    +关注

    关注

    3

    文章

    4350

    浏览量

    63056

原文标题:经典 SQL 笔试面试题:求解连续区间

文章出处:【微信号:DBDevs,微信公众号:数据分析与开发】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    ADS1147读取数据为什么总是跳来跳的呢?

    是11.3这样子,但是现在的问题是,数据转换后,一会是34,一会是11.3,总是跳来跳的,不知道是什么原因。程序里写的是连续读数据,但为什么他会跳来跳的呢?请解答,谢谢。还有图片说
    发表于 02-08 08:32

    什么是耦?为什么耦要选什么是耦?

    耦通过添加电容器减少电源噪声,陶瓷电容因其高频响应好、ESR和ESL低,适合作为耦电容器,提高电路稳定性和性能。
    的头像 发表于 01-03 10:29 238次阅读
    什么是<b class='flag-5'>去</b>耦?为什么<b class='flag-5'>去</b>耦要选什么是<b class='flag-5'>去</b>耦?

    DAC的高次谐波为什么都会折叠回第一奈奎斯特区间

    如题,在看到的DDS和DAC的资料上都会提到DAC内部的非线性造成的高次谐波会被折叠回第一奈奎斯特区间。不太理解的地方是DAC里并没有采样的过程啊?DAC只是一个乘以sin(x)/x和低通滤波
    发表于 12-11 07:05

    单粒子效应置信区间计算

    电子发烧友网站提供《单粒子效应置信区间计算.pdf》资料免费下载
    发表于 09-10 10:31 0次下载
    单粒子效应置信<b class='flag-5'>区间</b>计算

    巧了不是,原来也不知道啥是耦电容的“滤波半径”啊!

    高速先生成员--黄刚 现在稍有经验的layout工程师都知道在BGA里面不同封装的耦电容从小到大应该按下图这样放置:放置的顺序是从小电容到大电容采取从近到远的方式。 稍微具有SI,PI知识
    发表于 08-19 15:04

    巧了不是,原来也不知道啥是耦电容的“滤波半径”啊!

    电源设计中的网红用语:电容耦半径,大多数人都听过,但能讲出来原理的人估计不多;看完这篇文章,让你们理论知识和实际设计更上一层楼!
    的头像 发表于 08-19 14:54 502次阅读
    巧了不是,原来<b class='flag-5'>你</b>也不<b class='flag-5'>知道</b>啥是<b class='flag-5'>去</b>耦电容的“滤波半径”啊!

    知道影响贴片电感发热的因素有哪些吗?

    知道影响贴片电感发热的因素有哪些吗?
    的头像 发表于 08-17 14:24 569次阅读
    <b class='flag-5'>你</b><b class='flag-5'>知道</b>影响贴片电感发热的因素有哪些吗?

    知道贴片电感故障时可能出现的症状吗?

    知道贴片电感故障时可能出现的症状吗?
    的头像 发表于 08-17 14:20 478次阅读
    <b class='flag-5'>你</b><b class='flag-5'>知道</b>贴片电感故障时可能出现的症状吗?

    支路电流法是以什么为求解对象

    支路电流法(Node Voltage Method)是一种用于求解电路中电流分布的方法。它以支路电流为求解对象,通过建立和求解电路方程来确定电路中各个支路的电流。 支路电流法概述 1.1 支路电流法
    的头像 发表于 08-08 17:00 1380次阅读

    知道共模电感用错了会有什么影响吗

    电子发烧友网站提供《知道共模电感用错了会有什么影响吗.docx》资料免费下载
    发表于 07-30 10:42 0次下载

    关于定位系统技术知道多少?

    定位系统在如今这个没有隐私的社会,已不是稀奇的技术。 不管是在大街上走还是在商场里逛, 只要想知道的行踪就被定位系统锁定了。就像我们看的西部大片,罪犯在这边打电话,FBI在那边定位,唧唧几声
    的头像 发表于 07-12 11:16 418次阅读
    关于定位系统技术<b class='flag-5'>你</b><b class='flag-5'>知道</b>多少?

    辊压机轴承位磨损修复知道的那些事

    电子发烧友网站提供《辊压机轴承位磨损修复知道的那些事.docx》资料免费下载
    发表于 03-12 15:10 0次下载

    知道激光钻孔技术有多牛吗?看完这篇文章就明白了

    知道激光钻孔技术有多牛吗?看完这篇文章就明白了
    的头像 发表于 02-29 17:09 1118次阅读

    关于CYUSB3014芯片选用连续传输模式使用的情况求解

    CYUSB3014芯片选用连续传输模式,但由于数据量有限,平时不传输数据时候,将CYUSB3014设置为不可用,在传输数据时将芯片选择为可用,在传输数据,不知道这么使用是否正常,会不会影响CYUSB3014工作状态;
    发表于 02-28 07:29

    电容6大特性参数,知道几个?

    硬件设计好不好,电容参数知多少? 原文整理自书籍《硬件设计指南》 电容是我们电子电路设计中最常用的元件之一,除了基本的电容容值之外,电容还有其他6大参数,知道几个呢?本文章介绍MLCC陶瓷电容6
    的头像 发表于 02-21 15:10 1326次阅读
    电容6大特性参数,<b class='flag-5'>你</b><b class='flag-5'>知道</b>几个?