文章目录
- 1. 前言
- 2. 算法题
- 1046.最后一块石头的重量
- 703.数据流中的第K大元素
- 2.5 如何选择大根堆 与 小根堆? + 为什么选择大根堆(小根堆)?
- 692.前K个高频单词
- 295.数据流的中位数
1. 前言
我们知道:优先级队列是一种常用的数据结构,用于解决许多算法问题。基于堆(Heap)实现,在每次操作中能够快速找到最大或最小值。
使用优先级队列的典型算法问题包括:
- Top K 问题:查找列表中前 K 个最大或最小的元素。
- 合并 K 个排序数组:将 K 个已排序的数组合并为一个有序数组。
- Dijkstra 算法:在加权图中找到从起点到目标节点的最短路径。
- Huffman 编码:使用最小堆构建前缀编码树来压缩数据。
下面会挑选一些算法题并使用优先级队列进行解题。
2. 算法题
1046.最后一块石头的重量
思路
- 解法:大根堆
- 大根堆:每个节点都大于等于其子节点,则堆顶节点为最大的
- 将数组中所有元素加入堆中,并进行循环,直至堆为空
- 循环每次 取两次堆顶元素,即当前最重的两石头
- 将两元素差继续入堆,重复过程直至循环结束
- 如果堆中还剩一个元素,返回该元素
- 如果已经没有元素,返回0
代码
int lastStoneWeight(vector<int>& stones) {priority_queue<int> heap; // 创建大根堆// 将数组所有元素添加到堆中for(int stone : stones) heap.push(stone);while(heap.size() > 1){// 每次取最大的两个数int a = heap.top(); heap.pop();int b = heap.top(); heap.pop();if(a > b) heap.push(a - b);}return heap.size() ? heap.top() : 0;
}
703.数据流中的第K大元素
思路
- 题意分析:根据题目,可以看出来该题是一道topK类型题
- 解法:全局变量 + 小根堆
- 使用全局变量可以省去函数之间传参的过程,也方便编写代码
- 创建全局变量标记k和创建全局小根堆
- 关于为什么选择小根堆,可以看后面的解释。
- 由于add函数要求添加数字后返回第k大的元素,对于构造函数KthLargest,我们直接将数组中前k大的元素插入
- 对于add函数,直接将val插入到堆中并判断是否堆内元素超出k个
- 如果超出,则pop掉,后直接返回堆顶元素(即为第K大)
2.5 如何选择大根堆 与 小根堆? + 为什么选择大根堆(小根堆)?
代码
class KthLargest {
public:// 小根堆priority_queue<int, vector<int>, greater<int>> heap;int _k;KthLargest(int k, vector<int>& nums) {_k = k;for(int num : nums){heap.push(num);if(heap.size() > _k) heap.pop();} }int add(int val) {heap.push(val);if(heap.size() > _k) heap.pop();return heap.top();}
};
692.前K个高频单词
思路
- 题意分析:即返回数组中出现次数最多的字符串(单词)
- 解法:哈希表 + 优先级队列
- 哈希表统计每个单词的出现次数
- 根据题目要求,当单词的频率相同时,按照字典序排列,则我们自定义优先级队列的比较函数。则:
- 当单词频率不同时,用小堆的比较方式
- 当单词频率相同时,按照字典序,用大堆的比较方式
- 将哈希表中统计的前k高的 字母以及频率 加入到队列
- 最后返回结果,遍历堆,每次加入到结果集result中并pop即可。
代码
vector<string> topKFrequent(vector<string>& words, int k) {// 统计单词出现频率unordered_map<string, int> freq;for (const string& word : words) {freq[word]++;}// 自定义优先队列的比较函数auto cmp = [](const pair<string, int>& a, const pair<string, int>& b) {// 比较出现次数,如果相同则按照字母顺序return a.second > b.second || (a.second == b.second && a.first < b.first);};// 优先队列,默认是大顶堆,用于存储频率最高的 k 个单词priority_queue<pair<string, int>, vector<pair<string, int>>, decltype(cmp)> pq(cmp);// 遍历统计好的频率,将单词加入优先队列for (const auto& entry : freq) {pq.push(entry);if (pq.size() > k) {pq.pop(); // 如果队列大小超过 k,则弹出频率最小的单词}}// 从优先队列中取出结果vector<string> result(k);for (int i = k - 1; i >= 0; --i) {result[i] = pq.top().first; // 逆序存储结果pq.pop();}return result;
}
295.数据流的中位数
思路
-
题意分析:题目要求实现一个类,类中包含一个构造函数、一个add函数用于添加元素、以及一个find函数
-
解法一:排序 sort
- 对于本题,使用该排序法是会超时的
-
解法二:插入排序的思想
- 插入排序思想解本题是有可能超时的,但依然需要了解这种解题思想。
-
解法三:大小堆维护
- 上图解释了方法思路,具体细节看下面代码即可。
代码
class MedianFinder {
public:// 大小堆,左大堆,右小堆// 且当共有奇数个元素时,左存多一个元素priority_queue<int, vector<int>> left;priority_queue<int, vector<int>, greater<int>> right;MedianFinder() {} // 构造void addNum(int num) {if(left.size() == right.size()){ if(left.empty() || num <= left.top()){left.push(num);}else{right.push(num);left.push(right.top());right.pop();}}else{if(num <= left.top()){left.push(num);right.push(left.top());left.pop();}else{right.push(num);}}}double findMedian() {return (left.size() == right.size()) ? (left.top() + right.top()) / 2.0 : left.top();}
};