C语言堆排序经典算法TopK问题解析
作者:Yocn
这篇文章主要为大家介绍了C语言堆排序经典算法TopK问题解析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
问题描述:
从arr[1, n]这n个数中,找出最大的k个数,这就是经典的TopK问题
什么是TopK,就是找到一个无序队列中的k个最大数。 TopK的经典算法是堆排序,这里用快排的思想解决。 先上一个快排的代码:
快速排序
private void quickSort1(int[] src, int left, int right) { if (left == right) return; int index = sort1(src, left, right); quickSort1(src, left, index - 1); quickSort1(src, index + 1, right); } private int sort1(int[] src, int start, int end) { int left = start; int right = end; int pivot = start; while (left < right) { if (src[right] < src[pivot]) { if (src[left] > src[pivot]) { swap(src, left, right); } else { left++; } } else { right--; } } swap(src, pivot, left); return left; }
TopK
利用快排的框架实现一个TopK,排序跟快排一样,从大到小排列。 那一次排序结束有三种情况:
- 得到的
index==k-1
,直接结束,返回数组的前k个元素。 - 得到的
index<k-1
,这时候说明需要的足够大的数据还不够,需要继续找再小一点的。比如我们需要 [7,6,5],现在只有 [7,6],所以还需要找到 [5] 才可以。 - 得到的
inedx>k-1
,这时候说明大数虽然找到了,但是不知道哪些个是最大k个。比如我们需要 [7,6,5] ,但这时候前面是**[7,4,3,5,6]**,如果直接取前三个,就会取错,所以还要对这些大数进行排序。
看不懂正常,我们拿一个具体的例子来说,可以准备纸笔画一下: 原数组: [4, 6, 1, 3, 2, 7, 9, 5]
第一次遍历,取index=0为哨兵,也就是pivot=4,结束: [7 6 5 9 4 2 3 1] index为 4.
分三种情况:
- k=5,
index=k-1
,直接返回 [7 6 5 9 4] - k=2,也就是k<4的情况。
我们发现index>k-1
,所以需要继续对index=4
左边的进行排序也就是对 [7, 6, 5, 9] 进行排序。 第二次继续取第0个为哨兵,也就是7,排序结束为 [9 7 5 6 4 2 3 1] ,index=1
,这个时候index=k-1
,结束,得到结果 [9, 7]
- k=6,也就是
k>4
的情况。
第一遍结束发现index<k-1
,需要对index=4
右边继续排序。
第二遍结束:[7 6 5 9 4 3 2 1],index=6
,还是大于k-1=5
第三遍:遍历[left, index - 1],这个时候left=5
,index-1=5
,左右重合结束,取前6个数字为: [7 6 5 9 4 3]
三种情况分析结束,看代码实现:
//返回topK private int[] topKort(int[] src, int left, int right, int k) { if (k == src.length) { return src; } if (left == right) { //排序结束,取前k个数字得到result int[] result = new int[k]; System.arraycopy(src, 0, result, 0, k); return result; } //获取一次排序哨兵的位置 int index = sortBig(src, left, right); if (index > k - 1) {//继续排序左边的大数 topKort(src, left, index - 1, k); } else if (index < k - 1) {//继续排序右边的小数,继续找比较大的数 topKort(src, index + 1, right, k); } else {//结束 int[] result = new int[k]; System.arraycopy(src, 0, result, 0, k); return result; } return new int[k]; } //从大到小排序 快排思想 private int sortBig(int[] src, int left, int right) { int pivotIndex = left; int pivot = src[pivotIndex]; left++; while (left < right) { if (src[right] > pivot) { if (src[left] < pivot) { swap(src, left, right); } else { left++; } } else { right--; } } swap(src, pivotIndex, left); return left; }
以上就是C语言堆排序经典算法TopK问题解析的详细内容,更多关于C语言堆排序TopK算法的资料请关注脚本之家其它相关文章!