17. map和set的基本使用-编程知识

1. 关联式容器

在初阶阶段，我们已经接触过STL中的部分容器，比如：vector、list、deque等，这些容器统称为序列式容器，因为其底层为线性序列的数据结构，里面存储的是元素本身。

那什么是关联式容器？它与序列式容器有什么区别？

关联式容器也是用来存储数据的，与序列式容器不同的是，其里面存储的是<key, value>结构的键值对，在数据检索时比序列式容器效率更高

2. 键值对

用来表示具有一一对应关系的一种结构，该结构中一般只包含两个成员变量key和value，key代表键值，value表示与key对应的信息。比如：现在要建立一个英汉互译的字典，那该字典中必然有英文单词与其对应的中文含义，而且，英文单词与其中文含义是一一对应的关系，即通过该单词，在词典中就可以找到与其对应的中文含义。

SGI-STL中关于键值对的定义：

// 键值对的类类型
template <class T1, class T2>
struct pair
{// 将模板类型T1和T2定义为first_type和second_typetypedef T1 first_type;typedef T2 second_type;// 创建键值对的对象T1 first;T2 second;// 键值对的无参构造函数pair(): first(T1()), second(T2()){}// 键值对的构造函数，需要传入键值对的对象pair(const T1& a, const T2& b): first(a), second(b){}
};

3. 树形结构的关联式容器

根据应用场景的不同，STL总共实现了两种不同结构的管理式容器：树型结构与哈希结构。树型结构的关联式容器主要有四种：map、set、multimap、multiset。这四种容器的共同点是：使用平衡搜索树(即红黑树)作为其底层结果，容器中的元素是一个有序的序列。下面一依次介绍每一个容器。

3.1 set的介绍和使用

// set的类域
std::set// set的类模板如下：  
template < class T,                        // set::key_type/value_typeclass Compare = less<T>,        // set::key_compare/value_compareclass Alloc = allocator<T>      // set::allocator_type> 
class set{}

在set中，元素的value也标识它(value就是key，类型为T)，并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const)，但是可以从容器中插入或删除它们。与map/multimap不同，map/multimap中存储的是真正的键值对<key, value>，set中只放value，但在底层实际存放的是由<value, value>构成的键值对。
set中插入元素时，只需要插入value即可，不需要构造键值对。
set中的元素不可以重复(因此可以使用set进行去重)。
使用set的迭代器遍历set中的元素，可以得到有序序列
set中的元素默认按照小于来比较
set中查找某个元素，时间复杂度为：log_2 n
set中的元素不允许修改(为什么?)
set中的底层使用二叉搜索树(红黑树)来实现。

std::set

#include<iostream>
#include<set>
using namespace std;void test_set1()
{set<int> s;s.insert(3);s.insert(1);s.insert(4);s.insert(7);s.insert(2);s.insert(1);// set的底层是一个搜索二叉树因此会进行 ==> 排序+去重// set<int>::iterator it = s.begin();auto it = s.begin();while (it != s.end()){cout << *it << " ";++it;}// 打印结果为：1 2 3 4 7cout << endl;// 算法库中的find函数的时间复杂度为 O(N)// set内置的find函数的时间复杂度为(logN)// auto pos = s.find(3);       auto pos = find(s.begin(), s.end(), 3);  // 这里使用的是算法库的find函数if (pos != s.end()){s.erase(pos);}cout << s.erase(1) << endl;cout << s.erase(3) << endl;  // 已经删除，则直接返回，不会进行任何操作for (auto e : s){cout << e << " ";}cout << endl;
}int main()
{test_set1();return 0;
}

std::multiset

multiset是按照特定顺序存储元素的容器，其中元素是可以重复的。
在multiset中，元素的value也会识别它(因为multiset中本身存储的就是<value, value>组成的键值对，因此value本身就是key，key就是value，类型为T). multiset元素的值不能在容器中进行修改(因为元素总是const的)，但可以从容器中插入或删除。

 // 演示：
#include<iostream>
#include<set>
using namespace std;void test_set2()
{// multiset不会进行去重multiset<int> s;s.insert(3);s.insert(1);s.insert(4);s.insert(7);s.insert(2);s.insert(1);s.insert(1);s.insert(3);s.insert(1);s.insert(3);s.insert(2);s.insert(1);s.insert(1);// 排序// multiset<int>::iterator it = s.begin();auto it = s.begin();while (it != s.end()){cout << *it << " ";++it;}cout << endl;// 支持范围forfor (auto e : s){cout << e << " ";}cout << endl;// 找到的是中序遍历的第一个3，并返回它的iteratorauto pos = s.find(3);                    // 时间复杂度为O(logN)while (pos != s.end()){cout << *pos << " ";++pos;}cout << endl;
}
// 打印结果如下：
// 1 1 1 1 1 1 2 2 3 3 3 4 7
// 1 1 1 1 1 1 2 2 3 3 3 4 7
// 3 3 3 4 7int main()
{test_set2();return 0;
}

3.2 map的介绍和使用

std::map// 类模板
template < class Key,                                     // map::key_typeclass T,                                       // map::mapped_typeclass Compare = less<Key>,                     // map::key_compareclass Alloc = allocator<pair<const Key,T> >    // map::allocator_type> class map{}

map是关联容器，它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。
在map中，键值key通常用于排序和惟一地标识元素，而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同，并且在map的内部，key与value通过成员类型value_type绑定在一起，为其取别名称为pair:

typedef pair<const key, T> value_type;
在内部，map中的元素总是按照键值key进行比较排序的。
map中通过键值访问单个元素的速度通常比unordered_map容器慢，但map允许根据顺序对元素进行直接迭代(即对map中的元素进行迭代时，可以得到一个有序的序列)。
map支持下标访问符，即在[]中放入key，就可以找到与key对应的value。
map通常被实现为二叉搜索树(更准确的说：平衡二叉搜索树(红黑树))。

make::pair

The behavior of this function template is the same as if defined as:
// 这个函数模板的行为与定义的一样:// make_pair的函数模板
// 返回值类型为pair<T1,T2>
// 需要两个参数T1 x, T2 y 分别是键值key，和值value
template <class T1,class T2>
pair<T1,T2>   make_pair (T1 x, T2 y)
{return  ( pair<T1,T2>(x,y) ); 
}
// 注：pair<T1,T2>(x,y)  是一个匿名对象

map

演示1：

int main()
{map<string, string> dict;// 注：pair<string, string>("排序", "sort")是一个匿名对象dict.insert(pair<string, string>("排序", "sort"));dict.insert(pair<string, string>("左边", "left"));dict.insert(pair<string, string>("右边", "right"));dict.insert(make_pair("字符串", "string"));// map<string, string>::iterator it = dict.begin();auto it = dict.begin();while (it != dict.end()){// 下面这两种打印方式都可以// cout << (*it).first<<":"<<(*it).second << endl;cout << it->first << ":" << it->second << endl;++it;}cout << endl;// for循环for (const auto& kv : dict){cout << kv.first << ":" << kv.second << endl;}return 0;
}

演示2：统计水果出现的次数

#include<iostream>
#include<set>
#include<map>
#include<string>
using namespace std;int main()
{string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };/*  // 方法1：map<string, int> countmap;for (auto& e : arr){// map<string, int>::iterator it = countmap;auto it = countmap.find(e);if (it == countmap.end()){// 代码运行到这里说明没有相对应的水果，那么我们就进行插入countmap.insert(make_pair(e, 1));}else{// 运行到这里说明，存在相对应的结果，则对水果的个数进行++it->second++;}}
*/// 方法二：map<string, int> countmap;// 使用for循环将数组arr中的数据拿出，传引用给efor (auto& e : arr){// countmap[e] // 1.将e插入到map对象中// 2.返回值是value的传引用返回countmap[e]++;}for (const auto& kv : countmap){cout << kv.first << ":" << kv.second << endl;}return 0;
}// 打印结果为：
// 草莓:1
// 苹果:6
// 西瓜:3
// 香蕉:3

注：
std::map::operator[]
A call to this function is equivalent to:
// 对该函数的调用相当于:
(*((this->insert(make_pair(k, mapped_type()))).first)).second// 1.this->insert(make_pair(k, mapped_type())    使用A代替// 2.(*(A.first)).secend// 3.详细解释如下所示

std::map::insert
pair<iterator,bool>  insert (const value_type& val);// insert函数的返回值：Return value
The single element versions (1) return a pair, with its member pair::first set to an iterator pointing to either the newly inserted element or to the element with an equivalent key in the map. The pair::second element in the pair is set to true if a new element was inserted or false if an equivalent key already existed.单元素版本（1）返回一个 pair 对象，其中 pair::first 成员设置为指向新插入元素或具有等效键的元素的迭代器。如果插入了一个新元素，pair 对象中的 pair::second 元素设置为 true，如果已经存在一个等效键,则设置为 false。

// map<string, int> countmap;
// countmap[e];
// e就是将要插入的key也就是键值// 重载[]的内部我们可以理解为：
V& operator[](const K& K)
{// 如果K已经存在，则pair::first 指向k，pair::second 为false// V() 是V类型的匿名对象pair<iteraor, bool> ret = insert( make_pair(k, V())); // ret的类型为pair<iteraor, bool>，// ret.first 就是迭代器// 迭代器内指向对应的节点，节点存储的键值对的类型为pair<T1,T2>(k, V())// 所以ret.first->second 就是这个V()匿名对象// 注：因为是传引用返回，所以对返回值进行修改，就可以将相应节点的value值修改return ret.first->second;// 也可以写为// return (*(ret.first)).second
}

演示3：

// 明白了opertaor[]的用法之后，还有如下的应用：
int main()
{map<string, string> dict;dict.insert(pair<string, string>("左边", "left"));// pair<iteraor, bool> ret = insert( make_pair(k, V())); // operator[] 的返回值为Value的引用返回，Value的值原本为默认构造的值,也就是V()// 如果Value为指针，则默认构造为nullptr// 如果Value为字符串，则默认构造为\0// 如果Value为整型，则默认构造为0// 下面这行代码修改了key对应的value值dict["迭代器"] = "iterator"; // 插入+修改// 根据二叉树的原理，key值不可以重复，因此如果key已经存在，那么就不会进行插入dict["insert"]; // 插入失败，此时key值已经存在了(在二叉树中已经有"左边"这个key值了dict.insert(pair<string, string>("左边", "xxx")); // 修改  // pair<iteraor, bool> ret = insert( make_pair(k, V())); // dict["insert"] 的返回值是value的引用，对其进行赋值，就可以修改对应节点的value值dict["insert"] = "插入"; // dict["左边"]的返回值是value的引用cout << dict["左边"] << endl; // map<string, string>::iterator it = dict.begin();auto it = dict.begin();while (it != dict.end()){// 下面两种打印方式都是可以的// cout << (*it).first<<":"<<(*it).second << endl;cout << it->first << ":" << it->second << endl;++it;}cout << endl;return 0;
}

multimap

注：
1. multimap中的key是可以重复的。
2. multimap中的元素默认将key按照小于来比较
3. multimap中没有重载operator[]操作(同学们可思考下为什么?)。
4. 使用时与map包含的头文件相同：

#include<iostream>
#include<set>
#include<map>
#include<string>
using namespace std;int main()
{multimap<string, string> dict;// 向multimap插入键值对dict.insert(make_pair("left", "左边"));dict.insert(make_pair("left", "剩余"));dict.insert(make_pair("string", "字符串"));dict.insert(make_pair("left", "xxx"));// 使用for循环进行打印for (const auto& kv : dict){cout << kv.first << ":" << kv.second << endl;}// 初始化存放水果的数组string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "苹果", "西瓜", "苹果", "苹果", "西瓜", "苹果", "香蕉", "苹果", "香蕉" };// 创建一个multimap对象multimap<string, int> countMap;for (auto& e : arr){// iterator find (const key_type& k);// map<string, int>::iterator it = countMapauto it = countMap.find(e); if (it == countMap.end()){countMap.insert(make_pair(e, 1));}else{it->second++;}}for (const auto& kv : countMap){cout << kv.first << ":" << kv.second << endl;}return 0;
}

在OJ中得应用

前k个高频单词

解题思路：

首先我们要统计出每个单词的个数
按照单词出现的频率，也就是单词个数的大小来对单词进行排序
- 我们考虑使用算法库中的sort函数或者stable_sort函数来对单词个数进行排序
- 最终选择用stable_sort,这是因为stable_sort是一个稳定排序
- sort是不稳定排序，即经过排序之后，相同值的元素在序列中的相对位置可能发生改变。
- stable_sort是稳定排序，即经过排序之后，相同值的元素在序列中的相对位置不会发生改变。
  
  比如：原始数组 1 2 3 2
  用sort和stable_sort虽然都可以将其排序为 1 2 2 3
  但是sort可能会打乱两个相同的数的相对位置，例如原始数组中的2
将排序好的前k个单词放入一个vector容器中，并返回

class Solution {
public:vector<string> topKFrequent(vector<string>& words, int k) {// 1.首先我们要统计出每个单词的个数map<string, int> Countmap;for(string& e : words){Countmap[e]++;}// 2.按照单词出现的频率，也就是单词个数的大小来对单词进行排序// 将map中的数据放入vector方便我们后续的遍历vector<pair<string, int>> v;for(const pair<string, int>& KV : Countmap){v.push_back(KV);}// compare() 是一个仿函数的匿名对象// pair的比较规则并不适合，因此需要我们自己来写仿函数stable_sort(v.begin(), v.end(), compare());// 3.将排序好的前k个单词放入一个vector容器中，并返回vector<string> ret;for(size_t i = 0; i < k; ++i){ret.push_back(v[i].first);}return ret;}private:struct compare{// 仿函数bool operator()(const pair<string, int>& l, const pair<string, int>& r){// 我们比较的是单词出现的个数，也就是pair类中的 secondreturn l.second > r.second;}};
};

// 如果想使用sort来进行排序，我们只需要改变仿函数即可
class Solution {
public:
struct compare{// 仿函数bool operator()(const pair<string, int>& l, const pair<string, int>& r){// 我们比较的是单词出现的个数，也就是pair类中的 second// 如果出现的次数相等，还需要比较单词的大小(也就是比较字符串的大小)return l.second > r.second || (l.first < r.first && l.second == r.second);}
};vector<string> topKFrequent(vector<string>& words, int k) {// 1.首先我们要统计出每个单词的个数map<string, int> Countmap;for(string& e : words){Countmap[e]++;}// 2.按照单词出现的频率，也就是单词个数的大小来对单词进行排序// 将map中的数据放入vector方便我们后续的遍历vector<pair<string, int>> v;for(const pair<string, int>& KV : Countmap){v.push_back(KV);}// compare() 是一个仿函数的匿名对象// pair的比较规则并不适合，因此需要我们自己来写仿函数sort(v.begin(), v.end(), compare());// 3.将排序好的前k个单词放入一个vector容器中，并返回vector<string> ret;for(size_t i = 0; i < k; ++i){ret.push_back(v[i].first);}return ret;}
};

两个数组的交集

解题思路：

将两个数组都放入set中，这样两个数组会有序
再创建一个容器vector，
- 当 *it1 等于*it2时，插入vector中,且两个迭代器同时++
- 如果不相等，数组元素小的这一方迭代器++

class Solution {
public:vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {// 1.将两个数组都放入set中，这样两个数组会有序（set底层是搜索二叉树，会进行排序）// template <class InputIterator> set (InputIterator first, InputIterator last, const key_compare& comp = key_compare(), const allocator_type& alloc = allocator_type());set<int> s1(nums1.begin(), nums1.end());set<int> s2(nums2.begin(), nums2.end());// 2.再创建一个容器vector，// 当 *it1 等于 *it2 时，插入vector中,且两个迭代器同时++// 如果不相等，数组元素小的这一方迭代器++vector<int> v;set<int>::iterator it1 = s1.begin();set<int>::iterator it2 = s2.begin();while(it1 != s1.end() && it2 != s2.end()){if(*it1 == *it2){v.push_back(*it1);it1++;it2++;}else if(*it1 < *it2){it1++;}else{it2++;}}return v;}
};