0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

详解一道高频算法题:数组中的第 K 个最大元素

算法与数据结构 来源:五分钟学算法 2020-06-03 17:37 次阅读

今天分享的题目来源于 LeetCode 第 215 号问题,是面试中的高频考题。

题目描述

在 未排序 的数组中找到第 k 个最大的元素。请注意,你需要找的是数组排序后的第 k 个最大的元素,而不是第 k 个不同的元素。

示例 1:

输入:[3,2,1,5,6,4]和k=2 输出:5

示例 2:

输入:[3,2,3,1,2,4,5,5,6]和k=4 输出:4

说明:

你可以假设 k 总是有效的,且 1 ≤ k ≤ 数组的长度。

题目解析

方法一:返回升序排序以后索引为 len - k 的元素

题目已经告诉你了:

你需要找的是数组排序后的第 k 个最大的元素,而不是第 k 个不同的元素。

因此,升序排序以后,返回索引为 len - k 这个元素即可。

这是最简单的思路,如果只答这个方法,可能面试官并不会满意,但是在我们平时的开发工作中,还是不能忽视这种思路简单的方法,我认为理由如下:

1、最简单同时也一定是最容易编码的,编码成功的几率最高,可以用这个最简单思路编码的结果和其它思路编码的结果进行比对,验证高级算法的正确性;

2、在数据规模小、对时间复杂度、空间复杂度要求不高的时候,真没必要上 “高大上” 的算法;

3、思路简单的算法考虑清楚了,有些时候能为实现高级算法铺路。这道题正是如此,“数组排序后的第 k 个最大的元素” ,语义是从右边往左边数第 k 个元素(从 1 开始),那么从左向右数是第几个呢,我们列出几个找找规律就好了。

一共 6 个元素,找第 2 大,索引是 4;
一共 6 个元素,找第 4 大,索引是 2。

因此,目标元素的索引是 len - k,即找最终排定以后位于 len - k 的那个元素;

4、低级算法往往容错性最好,即在输入不满足题目条件的时候,往往还能得到正确的答案,而高级算法对输入数据的要求就非常苛刻。

参考代码

importjava.util.Arrays; publicclassSolution{ publicintfindKthLargest(int[]nums,intk){ intlen=nums.length; Arrays.sort(nums); returnnums[len-k]; } }

复杂度分析

时间复杂度:O(NlogN)。这里 N 是数组的长度,算法的性能消耗主要在排序,JDK 默认使用快速排序,因此时间复杂度为O(NlogN)。

空间复杂度:O(1)。这里是原地排序,没有借助额外的辅助空间。

到这里,我们已经分析出了:

1、我们应该返回最终排定以后位于 len - k 的那个元素;
2、性能消耗主要在排序,JDK 默认使用快速排序。

学习过 “快速排序” 的朋友,一定知道一个操作叫 partition,它是 “分而治之” 思想当中 “分” 的那一步。

经过 partition 操作以后,每一次都能排定一个元素,并且这个元素左边的数都不大于它,这个元素右边的数都不小于它,并且我们还能知道排定以后的元素的索引。

于是可以应用 “减而治之”(分治思想的特例)的思想,把问题规模转化到一个更小的范围里。

于是得到方法二。

方法二:借助 partition 操作定位

方法二则是借助 partition 操作定位到最终排定以后索引为 len - k 的那个元素。

以下的描述基于 “快速排序” 算法知识的学习,如果忘记的朋友们可以翻一翻自己的《数据结构与算法》教材,复习一下,partition 过程、分治思想和 “快速排序” 算法的优化。

【图解数据结构】 一组动画彻底理解快速排序

我们在学习 “快速排序” 的时候,接触的第 1 个操作就是 partition(切分),简单介绍如下:

partition(切分)操作,使得:

对于某个索引 j,nums[j] 已经排定,即 nums[j] 经过 partition(切分)操作以后会放置在它 “最终应该放置的地方”;

nums[left] 到 nums[j - 1] 中的所有元素都不大于 nums[j];

nums[j + 1] 到 nums[right] 中的所有元素都不小于 nums[j]。

partition(切分)操作总能排定一个元素,还能够知道这个元素它最终所在的位置,这样每经过一次 partition操作就能缩小搜索的范围,这样的额思想叫做 “减而治之”(是 “分而治之” 思想的特例)。

切分过程可以不借助额外的数组空间,仅通过交换数组元素实现。下面是参考代码:

参考代码

publicclassSolution{ publicintfindKthLargest(int[]nums,intk){ intlen=nums.length; intleft=0; intright=len-1; //转换一下,第k大元素的索引是len-k inttarget=len-k; while(true){ intindex=partition(nums,left,right); if(index==target){ returnnums[index]; }elseif(index< target) {                 left = index + 1;             } else {                 assert index >target; right=index-1; } } } /** *在nums数组的[left,right]部分执行partition操作,返回nums[i]排序以后应该在的位置 *在遍历过程中保持循环不变量的语义 *1、(left,k]< nums[left]      * 2、(k, i] >=nums[left] * *@paramnums *@paramleft *@paramright *@return */ publicintpartition(int[]nums,intleft,intright){ intpivot=nums[left]; intj=left; for(inti=left+1;i<= right; i++) {             if (nums[i] < pivot) {                 // 小于 pivot 的元素都被交换到前面                 j++;                 swap(nums, j, i);             }         }         // 最后这一步不要忘记了         swap(nums, j, left);         return j;     }     private void swap(int[] nums, int index1, int index2) {         if (index1 == index2) {             return;         }         int temp = nums[index1];         nums[index1] = nums[index2];         nums[index2] = temp;     } }

复杂度分析

时间复杂度:O(N)。这里 N 是数组的长度。

空间复杂度:O(1)。这里是原地排序,没有借助额外的辅助空间。

方法三:优先队列

优先队列的写法就很多了,这里例举一下我能想到的。

假设数组有 len 个元素。

思路 1 :把 len 个元素都放入一个最小堆中,然后再 pop() 出 len - k 个元素,此时最小堆只剩下 k 个元素,堆顶元素就是数组中的第 k 个最大元素。

思路 2 :把 len 个元素都放入一个最大堆中,然后再 pop() 出 k - 1 个元素,因为前 k - 1 大的元素都被弹出了,此时最大堆的堆顶元素就是数组中的第 k 个最大元素。

思路 3 :只用 k 个容量的优先队列,而不用全部 len 个容量。

思路 4:用 k + 1 个容量的优先队列,使得上面的过程更“连贯”一些,到了 k 个以后的元素,就进来一个,出去一个,让优先队列自己去维护大小关系。

思路 5:综合考虑以上两种情况,总之都是为了节约空间复杂度。即 k 较小的时候使用最小堆,k 较大的时候使用最大堆。

根据以上思路,分别写出下面的代码:

思路 1 参考代码

//思路 1 :把`len`个元素都放入一个最小堆中,然后再 pop()出 len - k 个元素,此时最小堆只剩下`k`个元素,堆顶元素就是数组中的第`k`个最大元素。 importjava.util.PriorityQueue; publicclassSolution{ publicintfindKthLargest(int[]nums,intk){ intlen=nums.length; //使用一个含有 len 个元素的最小堆,默认是最小堆,可以不写 lambda 表达式:(a, b)-> a - b PriorityQueueminHeap=newPriorityQueue<>(len,(a,b)->a-b); for(inti=0;i< len; i++) {             minHeap.add(nums[i]);         }         for (int i = 0; i < len - k; i++) {             minHeap.poll();         }         return minHeap.peek();     } }

思路 2 参考代码

//思路 2 :把`len`个元素都放入一个最大堆中,然后再 pop()出 k - 1 个元素,因为前 k - 1 大的元素都被弹出了,此时最大堆的堆顶元素就是数组中的第`k`个最大元素。 importjava.util.PriorityQueue; publicclassSolution{ publicintfindKthLargest(int[]nums,intk){ intlen=nums.length; //使用一个含有 len 个元素的最大堆,lambda 表达式应写成:(a, b)-> b - a PriorityQueuemaxHeap=newPriorityQueue<>(len,(a,b)->b-a); for(inti=0;i< len; i++) {             maxHeap.add(nums[i]);         }         for (int i = 0; i < k - 1; i++) {             maxHeap.poll();         }         return maxHeap.peek();     } }

思路 3 参考代码

//思路 3 :只用`k`个容量的优先队列,而不用全部`len`个容量。 importjava.util.PriorityQueue; publicclassSolution{ publicintfindKthLargest(int[]nums,intk){ intlen=nums.length; //使用一个含有k个元素的最小堆 PriorityQueueminHeap=newPriorityQueue<>(k,(a,b)->a-b); for(inti=0;i< k; i++) {             minHeap.add(nums[i]);         }         for (int i = k; i < len; i++) {             // 看一眼,不拿出,因为有可能没有必要替换             Integer topEle = minHeap.peek();             // 只要当前遍历的元素比堆顶元素大,堆顶弹出,遍历的元素进去             if (nums[i] >topEle){ minHeap.poll(); minHeap.add(nums[i]); } } returnminHeap.peek(); } }

思路 4 参考代码

//思路 4:用`k + 1`个容量的优先队列,使得上面的过程更“连贯”一些,到了`k`个以后的元素,就进来一个,出去一个,让优先队列自己去维护大小关系。 importjava.util.PriorityQueue; publicclassSolution{ publicintfindKthLargest(int[]nums,intk){ intlen=nums.length; //最小堆 PriorityQueuepriorityQueue=newPriorityQueue<>(k+1,(a,b)->(a-b)); for(inti=0;i< k; i++) {             priorityQueue.add(nums[i]);         }         for (int i = k; i < len; i++) {             priorityQueue.add(nums[i]);             priorityQueue.poll();         }         return priorityQueue.peek();     } }

思路 5 参考代码

//思路 5:综合考虑以上两种情况,总之都是为了节约空间复杂度。即`k`较小的时候使用最小堆,`k`较大的时候使用最大堆。 importjava.util.PriorityQueue; publicclassSolution{ //根据k的不同,选最大堆和最小堆,目的是让堆中的元素更小 //思路 1:k 要是更靠近0的话,此时 k 是一个较大的数,用最大堆 //例如在一个有6个元素的数组里找第5大的元素 //思路 2:k 要是更靠近 len 的话,用最小堆 //所以分界点就是k=len-k publicintfindKthLargest(int[]nums,intk){ intlen=nums.length; if(k<= len - k) {             // System.out.println("使用最小堆");             // 特例:k = 1,用容量为 k 的最小堆             // 使用一个含有 k 个元素的最小堆             PriorityQueueminHeap=newPriorityQueue<>(k,(a,b)->a-b); for(inti=0;i< k; i++) {                 minHeap.add(nums[i]);             }             for (int i = k; i < len; i++) {                 // 看一眼,不拿出,因为有可能没有必要替换                 Integer topEle = minHeap.peek();                 // 只要当前遍历的元素比堆顶元素大,堆顶弹出,遍历的元素进去                 if (nums[i] >topEle){ minHeap.poll(); minHeap.add(nums[i]); } } returnminHeap.peek(); }else{ //System.out.println("使用最大堆"); assertk>len-k; //特例:k = 100,用容量为 len - k + 1 的最大堆 intcapacity=len-k+1; PriorityQueuemaxHeap=newPriorityQueue<>(capacity,(a,b)->b-a); for(inti=0;i< capacity; i++) {                 maxHeap.add(nums[i]);             }             for (int i = capacity; i < len; i++) {                 // 看一眼,不拿出,因为有可能没有必要替换                 Integer topEle = maxHeap.peek();                 // 只要当前遍历的元素比堆顶元素大,堆顶弹出,遍历的元素进去                 if (nums[i] < topEle) {                     maxHeap.poll();                     maxHeap.add(nums[i]);                 }             }             return maxHeap.peek();         }     } }

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4622

    浏览量

    93055
  • 数组
    +关注

    关注

    1

    文章

    417

    浏览量

    25979

原文标题:超详细!详解一道高频算法题:数组中的第 K 个最大元素

文章出处:【微信号:TheAlgorithm,微信公众号:算法与数据结构】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Labivew 实现鼠标在数组中选中元素时,精准的显示所在位置的行、列值方法

    在项目开发,遇到布尔的二维数组输入控件,选中数组元素并索引出行列的操作,试过其他大佬的方法
    发表于 12-21 18:07

    ADS1256两通道之间进行切换,必须需要至少5ms的延时2通才能正常读出数据,为什么?

    :SPIBRR=250 K, DRATE=2K SPS 3. 问题:两通道之间进行切换,必须需要至少5ms的延时,2通才能正常读出数
    发表于 12-20 14:21

    数组的下标为什么可以是负数

    最近有同学发来这样段代码,并提出问题,数组的下标为什么可以是负数?     #include int main(){ const char *s = "helloworld";
    的头像 发表于 12-20 11:18 120次阅读

    指针数组和二维数组有没有区别

    。 首先是指针数组 s1。 s1 本身是数组数组有三
    的头像 发表于 11-24 11:12 188次阅读

    C语言数组应用计算机导论A6讲:数组

    C语言数组应用计算机导论A6讲:数组
    发表于 11-20 15:33 0次下载

    C语言指针运算符详解

    在C语言中,当你有指向数组某个元素的指针时,你可以对该指针执行某些算术运算,例如加法或减法。这些运算可以用来遍历
    的头像 发表于 10-30 11:16 268次阅读

    从具有高频可控精度的半桥获得最大功率

    电子发烧友网站提供《从具有高频可控精度的半桥获得最大功率.pdf》资料免费下载
    发表于 10-14 10:09 0次下载
    从具有<b class='flag-5'>高频</b>可控精度的半桥<b class='flag-5'>中</b>获得<b class='flag-5'>最大</b>功率

    labview字符串数组转化为数值数组

    常重要的。LabVIEW支持多种数据类型,包括数值、字符串、数组、簇等。在本例,我们将关注字符串数组和数值数组。 字符串数组 :由
    的头像 发表于 09-04 17:47 2528次阅读

    .c文件定义个数组遇到的疑问求解

    的时候没有指定数组的大小,只是做了初始化,而且这个初始化可以看到,而且自己可以定义初始化的值,并且初始化不同元素个数也可以,那么在其他文件求该数组长度可以办到吗,比如下面
    发表于 05-14 07:03

    嵌入式零长度数组基本操作方法

    就是长度为0的数组,也就是说不包含任何元素数组。零长度数组在C99标准
    的头像 发表于 05-11 08:49 991次阅读
    嵌入式<b class='flag-5'>中</b>零长度<b class='flag-5'>数组</b>基本操作方法

    深入探索KUKA KRL数组应用

    如果 CHAR 类型数组的所有数组元素都拥有相同的字符串,则不必单独初始化每个数组元素。忽略右侧的数组
    的头像 发表于 04-18 10:37 1285次阅读
    深入探索KUKA KRL<b class='flag-5'>中</b>的<b class='flag-5'>数组</b>应用

    鸿蒙TypeScript入门学习11天【Array(数组)】

    数组对象是使用单独的变量名来存储系列的值。 数组非常常用。
    的头像 发表于 04-09 14:38 1194次阅读
    鸿蒙TypeScript入门学习<b class='flag-5'>第</b>11天【Array(<b class='flag-5'>数组</b>)】

    随机抽取SV数组元素方法实现

    如果想从关联数组随机选取元素,需要逐个访问
    的头像 发表于 03-21 10:11 1053次阅读
    随机抽取SV<b class='flag-5'>数组</b><b class='flag-5'>中</b>的<b class='flag-5'>一</b><b class='flag-5'>个</b><b class='flag-5'>元素</b>方法实现

    数组和链表在内存的区别 数组和链表的优缺点

    内存的存储方式: 数组种连续存储的数据结构,它将元素存储在相邻的内存位置。这使得数组
    的头像 发表于 02-21 11:30 1062次阅读

    PHP数组的使用方法!

    如何创建数组、添加/删除元素、访问数组元素、遍历数组以及使用数组方法和函数等等。 首先,我们来看
    的头像 发表于 01-12 15:11 568次阅读