1. 关联式容器
在初阶阶段,我们已经接触过STL
中的部分容器,比如:vector、list、deque
等,这些容器统称为序列式容器,因为其底层为线性序列的数据结构,里面存储的是元素本身。
那什么是关联式容器?它与序列式容器有什么区别?
关联式容器也是用来存储数据的,与序列式容器不同的是,其里面存储的是<key, value>
结构的键值对,在数据检索时比序列式容器效率更高
2. 键值对
用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key
和value
,key
代表键值,value
表示与key
对应的信息。比如:现在要建立一个英汉互译的字典,那该字典中必然有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该单词,在词典中就可以找到与其对应的中文含义。
SGI-STL
中关于键值对的定义:
// 键值对的类类型
template <class T1, class T2>
struct pair
{// 将模板类型T1和T2定义为first_type和second_typetypedef T1 first_type;typedef T2 second_type;// 创建键值对的对象T1 first;T2 second;// 键值对的无参构造函数pair(): first(T1()), second(T2()){}// 键值对的构造函数,需要传入键值对的对象pair(const T1& a, const T2& b): first(a), second(b){}
};
3. 树形结构的关联式容器
根据应用场景的不同,STL
总共实现了两种不同结构的管理式容器:树型结构与哈希结构。树型结构的关联式容器主要有四种:map
、set
、multimap
、multiset
。这四种容器的共同点是:使用平衡搜索树(即红黑树)作为其底层结果,容器中的元素是一个有序的序列。下面一依次介绍每一个容器。
3.1 set的介绍和使用
// set的类域
std::set// set的类模板如下:
template < class T, // set::key_type/value_typeclass Compare = less<T>, // set::key_compare/value_compareclass Alloc = allocator<T> // set::allocator_type>
class set{}
-
在set中,元素的value也标识它(value就是key,类型为T),并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是
const
),但是可以从容器中插入或删除它们。与map/multimap
不同,map/multimap
中存储的是真正的键值对<key, value>,set中只放value
,但在底层实际存放的是由<value, value>
构成的键值对。 -
set
中插入元素时,只需要插入value
即可,不需要构造键值对。 -
set
中的元素不可以重复(因此可以使用set
进行去重)。 -
使用
set
的迭代器遍历set中的元素,可以得到有序序列 -
set
中的元素默认按照小于来比较 -
set
中查找某个元素,时间复杂度为:log_2 n
-
set
中的元素不允许修改(为什么?) -
set中的底层使用二叉搜索树(红黑树)来实现。
std::set
#include<iostream>
#include<set>
using namespace std;void test_set1()
{set<int> s;s.insert(3);s.insert(1);s.insert(4);s.insert(7);s.insert(2);s.insert(1);// set的底层是一个搜索二叉树因此会进行 ==> 排序+去重// set<int>::iterator it = s.begin();auto it = s.begin();while (it != s.end()){cout << *it << " ";++it;}// 打印结果为:1 2 3 4 7cout << endl;// 算法库中的find函数的时间复杂度为 O(N)// set内置的find函数的时间复杂度为(logN)// auto pos = s.find(3); auto pos = find(s.begin(), s.end(), 3); // 这里使用的是算法库的find函数if (pos != s.end()){s.erase(pos);}cout << s.erase(1) << endl;cout << s.erase(3) << endl; // 已经删除,则直接返回,不会进行任何操作for (auto e : s){cout << e << " ";}cout << endl;
}int main()
{test_set1();return 0;
}
std::multiset
multiset
是按照特定顺序存储元素的容器,其中元素是可以重复的。- 在
multiset
中,元素的value
也会识别它(因为multiset
中本身存储的就是<value, value>
组成的键值对,因此value
本身就是key
,key
就是value
,类型为T).multiset
元素的值不能在容器中进行修改(因为元素总是const
的),但可以从容器中插入或删除。
// 演示:
#include<iostream>
#include<set>
using namespace std;void test_set2()
{// multiset不会进行去重multiset<int> s;s.insert(3);s.insert(1);s.insert(4);s.insert(7);s.insert(2);s.insert(1);s.insert(1);s.insert(3);s.insert(1);s.insert(3);s.insert(2);s.insert(1);s.insert(1);// 排序// multiset<int>::iterator it = s.begin();auto it = s.begin();while (it != s.end()){cout << *it << " ";++it;}cout << endl;// 支持范围forfor (auto e : s){cout << e << " ";}cout << endl;// 找到的是中序遍历的第一个3,并返回它的iteratorauto pos = s.find(3); // 时间复杂度为O(logN)while (pos != s.end()){cout << *pos << " ";++pos;}cout << endl;
}
// 打印结果如下:
// 1 1 1 1 1 1 2 2 3 3 3 4 7
// 1 1 1 1 1 1 2 2 3 3 3 4 7
// 3 3 3 4 7int main()
{test_set2();return 0;
}
3.2 map的介绍和使用
std::map// 类模板
template < class Key, // map::key_typeclass T, // map::mapped_typeclass Compare = less<Key>, // map::key_compareclass Alloc = allocator<pair<const Key,T> > // map::allocator_type> class map{}
-
map
是关联容器,它按照特定的次序(按照key
来比较)存储由键值key
和值value
组合而成的元素。 -
在
map
中,键值key
通常用于排序和惟一地标识元素,而值value
中存储与此键值key
关联的内容。键值key
和值value
的类型可能不同,并且在map
的内部,key
与value
通过成员类型value_type
绑定在一起,为其取别名称为pair:
typedef pair<const key, T> value_type
; -
在内部,map中的元素总是按照键值key进行比较排序的。
-
map中通过键值访问单个元素的速度通常比unordered_map容器慢,但map允许根据顺序对元素进行直接迭代(即对map中的元素进行迭代时,可以得到一个有序的序列)。
-
map支持下标访问符,即在[]中放入key,就可以找到与key对应的value。
-
map通常被实现为二叉搜索树(更准确的说:平衡二叉搜索树(红黑树))。
make::pair
The behavior of this function template is the same as if defined as:
// 这个函数模板的行为与定义的一样:// make_pair的函数模板
// 返回值类型为pair<T1,T2>
// 需要两个参数T1 x, T2 y 分别是键值key,和值value
template <class T1,class T2>
pair<T1,T2> make_pair (T1 x, T2 y)
{return ( pair<T1,T2>(x,y) );
}
// 注:pair<T1,T2>(x,y) 是一个匿名对象
map
- 演示1:
int main()
{map<string, string> dict;// 注:pair<string, string>("排序", "sort")是一个匿名对象dict.insert(pair<string, string>("排序", "sort"));dict.insert(pair<string, string>("左边", "left"));dict.insert(pair<string, string>("右边", "right"));dict.insert(make_pair("字符串", "string"));// map<string, string>::iterator it = dict.begin();auto it = dict.begin();while (it != dict.end()){// 下面这两种打印方式都可以// cout << (*it).first<<":"<<(*it).second << endl;cout << it->first << ":" << it->second << endl;++it;}cout << endl;// for循环for (const auto& kv : dict){cout << kv.first << ":" << kv.second << endl;}return 0;
}
- 演示2:统计水果出现的次数
#include<iostream>
#include<set>
#include<map>
#include<string>
using namespace std;int main()
{string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };/* // 方法1:map<string, int> countmap;for (auto& e : arr){// map<string, int>::iterator it = countmap;auto it = countmap.find(e);if (it == countmap.end()){// 代码运行到这里说明没有相对应的水果,那么我们就进行插入countmap.insert(make_pair(e, 1));}else{// 运行到这里说明,存在相对应的结果,则对水果的个数进行++it->second++;}}
*/// 方法二:map<string, int> countmap;// 使用for循环将数组arr中的数据拿出,传引用给efor (auto& e : arr){// countmap[e] // 1.将e插入到map对象中// 2.返回值是value的传引用返回countmap[e]++;}for (const auto& kv : countmap){cout << kv.first << ":" << kv.second << endl;}return 0;
}// 打印结果为:
// 草莓:1
// 苹果:6
// 西瓜:3
// 香蕉:3
注:
std::map::operator[]
A call to this function is equivalent to:
// 对该函数的调用相当于:
(*((this->insert(make_pair(k, mapped_type()))).first)).second// 1.this->insert(make_pair(k, mapped_type()) 使用A代替// 2.(*(A.first)).secend// 3.详细解释如下所示
std::map::insert
pair<iterator,bool> insert (const value_type& val);// insert函数的返回值:Return value
The single element versions (1) return a pair, with its member pair::first set to an iterator pointing to either the newly inserted element or to the element with an equivalent key in the map. The pair::second element in the pair is set to true if a new element was inserted or false if an equivalent key already existed.单元素版本(1)返回一个 pair 对象,其中 pair::first 成员设置为指向新插入元素或具有等效键的元素的迭代器。如果插入了一个新元素,pair 对象中的 pair::second 元素设置为 true,如果已经存在一个等效键,则设置为 false。
// map<string, int> countmap;
// countmap[e];
// e就是将要插入的key也就是键值// 重载[]的内部我们可以理解为:
V& operator[](const K& K)
{// 如果K已经存在,则pair::first 指向k,pair::second 为false// V() 是V类型的匿名对象pair<iteraor, bool> ret = insert( make_pair(k, V())); // ret的类型为pair<iteraor, bool>,// ret.first 就是迭代器// 迭代器内指向对应的节点,节点存储的键值对的类型为pair<T1,T2>(k, V())// 所以ret.first->second 就是这个V()匿名对象// 注:因为是传引用返回,所以对返回值进行修改,就可以将相应节点的value值修改return ret.first->second;// 也可以写为// return (*(ret.first)).second
}
演示3:
// 明白了opertaor[]的用法之后,还有如下的应用:
int main()
{map<string, string> dict;dict.insert(pair<string, string>("左边", "left"));// pair<iteraor, bool> ret = insert( make_pair(k, V())); // operator[] 的返回值为Value的引用返回,Value的值原本为默认构造的值,也就是V()// 如果Value为指针,则默认构造为nullptr// 如果Value为字符串,则默认构造为\0// 如果Value为整型,则默认构造为0// 下面这行代码修改了key对应的value值dict["迭代器"] = "iterator"; // 插入+修改// 根据二叉树的原理,key值不可以重复,因此如果key已经存在,那么就不会进行插入dict["insert"]; // 插入失败,此时key值已经存在了(在二叉树中已经有"左边"这个key值了dict.insert(pair<string, string>("左边", "xxx")); // 修改 // pair<iteraor, bool> ret = insert( make_pair(k, V())); // dict["insert"] 的返回值是value的引用,对其进行赋值,就可以修改对应节点的value值dict["insert"] = "插入"; // dict["左边"]的返回值是value的引用cout << dict["左边"] << endl; // map<string, string>::iterator it = dict.begin();auto it = dict.begin();while (it != dict.end()){// 下面两种打印方式都是可以的// cout << (*it).first<<":"<<(*it).second << endl;cout << it->first << ":" << it->second << endl;++it;}cout << endl;return 0;
}
multimap
-
注:
-
multimap中的key是可以重复的。
-
multimap中的元素默认将key按照小于来比较
-
multimap
中没有重载operator[]
操作(同学们可思考下为什么?)。 -
使用时与map包含的头文件相同:
-
#include<iostream>
#include<set>
#include<map>
#include<string>
using namespace std;int main()
{multimap<string, string> dict;// 向multimap插入键值对dict.insert(make_pair("left", "左边"));dict.insert(make_pair("left", "剩余"));dict.insert(make_pair("string", "字符串"));dict.insert(make_pair("left", "xxx"));// 使用for循环进行打印for (const auto& kv : dict){cout << kv.first << ":" << kv.second << endl;}// 初始化存放水果的数组string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };// 创建一个multimap对象multimap<string, int> countMap;for (auto& e : arr){// iterator find (const key_type& k);// map<string, int>::iterator it = countMapauto it = countMap.find(e); if (it == countMap.end()){countMap.insert(make_pair(e, 1));}else{it->second++;}}for (const auto& kv : countMap){cout << kv.first << ":" << kv.second << endl;}return 0;
}
在OJ中得应用
前k个高频单词
解题思路:
-
首先我们要统计出每个单词的个数
-
按照单词出现的频率,也就是单词个数的大小来对单词进行排序
-
我们考虑使用算法库中的sort函数或者stable_sort函数来对单词个数进行排序
-
最终选择用stable_sort,这是因为stable_sort是一个稳定排序
-
sort是不稳定排序,即经过排序之后,相同值的元素在序列中的相对位置可能发生改变。
-
stable_sort是稳定排序,即经过排序之后,相同值的元素在序列中的相对位置不会发生改变。
比如:原始数组 1 2 3 2
用sort和stable_sort虽然都可以将其排序为 1 2 2 3
但是sort可能会打乱两个相同的数的相对位置,例如原始数组中的2
-
-
将排序好的前k个单词放入一个vector容器中,并返回
class Solution {
public:vector<string> topKFrequent(vector<string>& words, int k) {// 1.首先我们要统计出每个单词的个数map<string, int> Countmap;for(string& e : words){Countmap[e]++;}// 2.按照单词出现的频率,也就是单词个数的大小来对单词进行排序// 将map中的数据放入vector方便我们后续的遍历vector<pair<string, int>> v;for(const pair<string, int>& KV : Countmap){v.push_back(KV);}// compare() 是一个仿函数的匿名对象// pair的比较规则并不适合,因此需要我们自己来写仿函数stable_sort(v.begin(), v.end(), compare());// 3.将排序好的前k个单词放入一个vector容器中,并返回vector<string> ret;for(size_t i = 0; i < k; ++i){ret.push_back(v[i].first);}return ret;}private:struct compare{// 仿函数bool operator()(const pair<string, int>& l, const pair<string, int>& r){// 我们比较的是单词出现的个数,也就是pair类中的 secondreturn l.second > r.second;}};
};
// 如果想使用sort来进行排序,我们只需要改变仿函数即可
class Solution {
public:
struct compare{// 仿函数bool operator()(const pair<string, int>& l, const pair<string, int>& r){// 我们比较的是单词出现的个数,也就是pair类中的 second// 如果出现的次数相等,还需要比较单词的大小(也就是比较字符串的大小)return l.second > r.second || (l.first < r.first && l.second == r.second);}
};vector<string> topKFrequent(vector<string>& words, int k) {// 1.首先我们要统计出每个单词的个数map<string, int> Countmap;for(string& e : words){Countmap[e]++;}// 2.按照单词出现的频率,也就是单词个数的大小来对单词进行排序// 将map中的数据放入vector方便我们后续的遍历vector<pair<string, int>> v;for(const pair<string, int>& KV : Countmap){v.push_back(KV);}// compare() 是一个仿函数的匿名对象// pair的比较规则并不适合,因此需要我们自己来写仿函数sort(v.begin(), v.end(), compare());// 3.将排序好的前k个单词放入一个vector容器中,并返回vector<string> ret;for(size_t i = 0; i < k; ++i){ret.push_back(v[i].first);}return ret;}
};
两个数组的交集
解题思路:
- 将两个数组都放入
set
中,这样两个数组会有序 - 再创建一个容器
vector
,- 当
*it1
等于*it2
时,插入vector
中,且两个迭代器同时++
- 如果不相等,数组元素小的这一方迭代器
++
- 当
class Solution {
public:vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {// 1.将两个数组都放入set中,这样两个数组会有序(set底层是搜索二叉树,会进行排序)// template <class InputIterator> set (InputIterator first, InputIterator last, const key_compare& comp = key_compare(), const allocator_type& alloc = allocator_type());set<int> s1(nums1.begin(), nums1.end());set<int> s2(nums2.begin(), nums2.end());// 2.再创建一个容器vector,// 当 *it1 等于 *it2 时,插入vector中,且两个迭代器同时++// 如果不相等,数组元素小的这一方迭代器++vector<int> v;set<int>::iterator it1 = s1.begin();set<int>::iterator it2 = s2.begin();while(it1 != s1.end() && it2 != s2.end()){if(*it1 == *it2){v.push_back(*it1);it1++;it2++;}else if(*it1 < *it2){it1++;}else{it2++;}}return v;}
};