STL容器之vector类-编程知识

文章目录

STL容器之vector类
- 1、vector的介绍
- 2、vector的使用
- - 2.1、vector的常见构造
  - 2.2、vector的iterator的使用
  - 2.3、vector空间增长问题
  - 2.4、vector的增删查改
  - 2.5、vector迭代器失效问题
- 3.vector的模拟实现

STL容器之vector类

1、vector的介绍

vector是表示可变大小数组的序列容器。

就像数组一样，vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问，和数组一样高效。但是又不像数组，它的大小是可以动态改变的，而且它的大小会被容器自动处理。

本质讲，vector使用动态分配数组来存储它的元素。当新元素插入时候，这个数组需要被重新分配大小为了增加存储空间。其做法是，分配一个新的数组，然后将全部元素移到这个数组。就时间而言，这是一个相对代价高的任务，因为每当一个新的元素加入到容器的时候，vector并不会每次都重新分配大小。

vector分配空间策略：vector会分配一些额外的空间以适应可能的增长，因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何，重新分配都应该是对数增长的间隔大小，以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。

因此，vector占用了更多的存储空间，为了获得管理存储空间的能力，并且以一种有效的方式动态增长。

与其它动态序列容器相比（deque, list and forward_list）， vector在访问元素的时候更加高效，在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作，效率更低。比起list和forward_list统一的迭代器和引用更好。

使用STL的三个境界：能用，明理，能扩展。

2、vector的使用

2.1、vector的常见构造

(constructor)函数名称	接口说明
vector ()（重点）	无参构造
vector (size_type n, const value_type& val = value_type())	构造并初始化n个val
vector (InputIterator first, InputIterator last)（重点）	使用迭代器进行初始化构造
vector (const vector& x)（重点）	拷贝构造

#include <iostream>
#include <vector>
#include <list>using namespace std;void test_vector1() {vector<int> v;v.push_back(1);v.push_back(2);v.push_back(3);v.push_back(4);for (int e: v) {cout << e << " ";}cout << endl;
}void test_vector2() {vector<int> v1;v1.push_back(1);v1.push_back(2);v1.push_back(3);v1.push_back(4);for (int e: v1) {cout << e << " ";}cout << endl;//用顺序表v1构造v2vector<int> v2(v1);for (int e: v2) {cout << e << " ";}cout << endl;//用顺序表v1的迭代区间构造v3vector<int> v3(v1.begin(), v1.end());for (int e: v3) {cout << e << " ";}cout << endl;//构造长度为10并且各元素为1的顺序表vector<int> v4(10, 1);for (int e: v4) {cout << e << " ";}cout << endl;
}void test_vector3() {vector<int> v1;v1.push_back(1);v1.push_back(2);v1.push_back(3);v1.push_back(4);v1.insert(v1.begin(), 10);for (int e: v1) {cout << e << " ";}cout << endl;vector<int>::iterator pos = find(v1.begin(), v1.end(), 4);//find是函数模版v1.insert(pos, 40);for (int e: v1) {cout << e << " ";}cout << endl;list<int> lt;lt.push_back(5);lt.push_back(6);lt.push_back(7);lt.push_back(8);for (int e: lt) {cout << e << " ";}cout << endl;vector<int> v3(lt.begin(), lt.end());for (int e: v3) {cout << e << " ";}cout << endl;}//vector使用
int main() {
//    test_vector1();
//    test_vector2();test_vector3();return 0;
}

2.2、vector的iterator的使用

函数名称接口说明
begin()+end()（重点）获取第一个元素位置的iterator/const_iterator和获取最后一个元素的后一个位置的iterator/const_iterator
rbegin()+rend() 获取最后一个元素位置的reverse_iterator/const_reverse_iterator和获取第一个元素的后一个位置的reverse_iterator/const_reverse_iterator
void test_vector5() {vector<int> v1;v1.push_back(1);v1.push_back(2);v1.push_back(3);v1.push_back(4);vector<int>::iterator it1 = v1.begin();while (it1 != v1.end()) {cout << *it1 << " ";++it1;}cout << endl;vector<int>::const_iterator it2 = v1.begin();while (it2 != v1.end()) {cout << *it2 << " ";++it2;}cout << endl;}void test_vector6() {vector<int> v1;v1.push_back(1);v1.push_back(2);v1.push_back(3);v1.push_back(4);vector<int>::reverse_iterator it1 = v1.rbegin();while (it1 != v1.rend()) {cout << *it1 << " ";++it1;}cout << endl;
}int main() {test_vector5();test_vector6();return 0;
}

函数名称	接口说明
begin()+end()（重点）	获取第一个元素位置的iterator/const_iterator和获取最后一个元素的后一个位置的iterator/const_iterator
rbegin()+rend()	获取最后一个元素位置的reverse_iterator/const_reverse_iterator和获取第一个元素的后一个位置的reverse_iterator/const_reverse_iterator

2.3、vector空间增长问题

函数名称	接口说明
size	获取数据个数
resize（重点）	改变vector的size
capacity	获取数据的容量大小
empty	判断vector是否为空
reserve（重点）	改变vector的capacity

void test_vector7() {vector<int> v1;cout << v1.size() << " " << v1.capacity() << endl;v1.push_back(1);v1.push_back(2);v1.push_back(3);v1.push_back(4);cout << v1.size() << " " << v1.capacity() << endl;v1.resize(10);cout << v1.size() << " " << v1.capacity() << endl;v1.reserve(11);cout << v1.size() << " " << v1.capacity() << endl;v1.resize(5);cout << v1.size() << " " << v1.capacity() << endl;cout << v1.empty() << endl;v1.resize(0);cout << v1.empty() << endl;}int main() {test_vector7();return 0;
}

capacity的代码在vs和g++下分别运行会发现，vs下capacity是按1.5倍增长的，CLion和g++是按2倍增长的。这个问题经常会考察，不要固化的认为，vector增容都是2倍，具体增长多少是根据具体的需求定义的。vs是PJ版本STL，g++是SGI版本STL。
reserve只负责开辟空间，如果确定知道需要用多少空间，reserve可以缓解vector增容的代价缺陷问题。
resize在开空间的同时还会进行初始化，影响size。

// 测试vector的默认扩容机制 -- 这里CLion是2倍扩容，VS是1.5倍扩容
void TestVectorExpand() {size_t sz;vector<int> v;sz = v.capacity();cout << "making v grow:\n";for (int i = 0; i < 100; ++i) {v.push_back(i);if (sz != v.capacity()) {sz = v.capacity();cout << "capacity changed: " << sz << '\n';}}
}/*vs：运行结果：vs下使用的STL基本是按照1.5倍方式扩容making foo grow:capacity changed: 1capacity changed: 2capacity changed: 3capacity changed: 4capacity changed: 6capacity changed: 9capacity changed: 13capacity changed: 19capacity changed: 28capacity changed: 42capacity changed: 63capacity changed: 94capacity changed: 141g++运行结果：linux下使用的STL基本是按照2倍方式扩容making foo grow:capacity changed: 1capacity changed: 2capacity changed: 4capacity changed: 8capacity changed: 16capacity changed: 32capacity changed: 64capacity changed: 128
*/

// 如果已经确定vector中要存储元素大概个数，可以提前将空间设置足够
// 就可以避免边插入边扩容导致效率低下的问题了
void TestVectorExpand() {size_t sz;vector<int> v;sz = v.capacity();v.reserve(100); // 提前将容量设置好，可以避免一遍插入一遍扩容cout << "making v grow:\n";for (int i = 0; i < 100; ++i) {v.push_back(i);if (sz != v.capacity()) {sz = v.capacity();cout << "capacity changed: " << sz << '\n';}}
}

2.4、vector的增删查改

函数名称	接口说明
push_back（重点）	尾插
pop_back（重点）	尾删
insert	在position之前插入val
erase	删除position位置的数据
swap	交换两个vector的数据
operator[]（重点）	返回position位置的数据
find	查找迭代区间在first到last之间的val，注意，这是函数模版

void test_vector8() {vector<int> v1;v1.push_back(1);v1.push_back(2);v1.push_back(3);v1.push_back(4);for (int e: v1) {cout << e << " ";}cout << endl;v1.pop_back();for (int e: v1) {cout << e << " ";}cout << endl;cout << v1[0] << endl;v1.insert(v1.begin(), 10);for (int e: v1) {cout << e << " ";}cout << endl;vector<int>::iterator it = find(v1.begin(), v1.end(), 3);v1.erase(it);for (int e: v1) {cout << e << " ";}cout << endl;cout << "-----------------------" << endl;vector<int> v2;v2.push_back(10);v2.push_back(20);v2.push_back(30);v2.push_back(40);v2.push_back(50);v2.push_back(60);for (int e: v2) {cout << e << " ";}cout << endl;cout << "-----------------------" << endl;swap(v1, v2);for (int e: v1) {cout << e << " ";}cout << endl;for (int e: v2) {cout << e << " ";}cout << endl;}int main() {test_vector8();return 0;
}

2.5、vector迭代器失效问题

迭代器的主要作用就是让算法能够不用关心底层数据结构，其底层实际就是一个指针，或者是对指针进行了封装（如list，后面会讲）。

比如：vector的迭代器就是原生态指针T* 。因此迭代器失效，实际就是迭代器底层对应指针所指向的空间被销毁了，而使用一块已经被释放的空间，造成的后果是程序崩溃(即如果继续使用已经失效的迭代器，程序可能会崩溃)。解决办法是不使用insert和erase等后的原迭代器，或者使用insert和erase等后返回的迭代器。

对于vector可能会导致其迭代器失效的操作有：

会引起其底层空间改变的操作，都有可能是迭代器失效，比如：resize、reserve、insert、assign、push_back等。

#include <iostream>using namespace std;#include <vector>int main() {vector<int> v{1, 2, 3, 4, 5, 6};auto it = v.begin();// 将有效元素个数增加到100个，多出的位置使用8填充，操作期间底层会扩容v.resize(100, 8);// reserve的作用就是改变扩容大小但不改变有效元素个数，操作期间可能会引起底层容量改变// v.reserve(100);// 插入元素期间，可能会引起扩容，而导致原空间被释放// v.insert(v.begin(), 0);// v.push_back(8);// 给vector重新赋值，可能会引起底层容量改变
//    v.assign(100, 8);/*出错原因：以上操作，都有可能会导致vector扩容，也就是说vector底层原理旧空间被释放掉，而在打印时，it还使用的是释放之间的旧空间，在对it迭代器操作时，实际操作的是一块已经被释放的空间，而引起代码运行时崩溃。解决方式：在以上操作完成之后，如果想要继续通过迭代器操作vector中的元素，只需给it重新赋值即可。*/it = v.begin();//解决办法while (it != v.end()) {cout << *it << " ";++it;}cout << endl;return 0;
}

指定位置元素的删除操作(erase)

#include <iostream>using namespace std;#include <vector>int main() {int a[] = {1, 2, 3, 4};vector<int> v(a, a + sizeof(a) / sizeof(int));// 使用find查找3所在位置的iteratorvector<int>::iterator pos = find(v.begin(), v.end(), 3);// 删除pos位置的数据，导致pos迭代器失效。v.erase(pos);cout << *pos << endl; // 此处会导致非法访问，解决办法：不再访问posv.push_back(5);v.push_back(6);v.push_back(6);v.push_back(5);v.push_back(8);for (auto e: v) {cout << e << " ";}cout << endl;//删除v里所有偶数vector<int>::iterator it = v.begin();while (it != v.end()) {if (*it % 2 == 0) {
//            v.erase(it);//这里最好不再用itit = v.erase(it);//解决办法} else {++it;}}for (auto e: v) {cout << e << " ";}cout << endl;return 0;
}

与vector类似，string在插入+扩容操作+erase之后，迭代器也会失效。

#include <string>using namespace std;int main() {string s("hello");string::iterator sit = s.begin();// 这里resize过后，会扩容，之前等sit的位置会改变s.resize(100, 'w');// 解决办法，给sit重新赋值sit = s.begin();while (sit != s.end()) {cout << *sit << " ";++sit;}cout << endl;sit = s.begin();while (sit != s.end()) {sit = s.erase(sit);//这里s.erase(sit)后的sit位置是之前sit的后一个位置++sit;//说明是隔一个元素删除}for (char e: s) {cout << e << " ";}cout << endl;return 0;
}

3.vector的模拟实现

vector核心框架接口的模拟实现

vector.h文件

  //// Created by 徐鹏 on 2023/12/10.//#include <cstdio>#include <cstring>#include <list>using namespace std;#ifndef DEMO_01_VECTOR_H#define DEMO_01_VECTOR_H#endif //DEMO_01_VECTOR_Hnamespace xp {template<typename T>class vector {public:typedef T *iterator;typedef const T *const_iterator;vector() : _start(nullptr), _finish(nullptr), _end_of_storage(nullptr) {}//        vector(const vector<T> &v) {//            _start = new T[v.capacity()];//            memcpy(_start, v._start, v.size() * sizeof(T));//            _finish = _start + v.size();//            _end_of_storage = _start + capacity();//        }//拷贝构造函数vector(const vector<T> &v) {reserve(v.capacity());for (const auto &e: v) {push_back(e);}}template<class InputIterator>//构造迭代器区间vector(InputIterator first, InputIterator last) {while (first != last) {push_back(*first);++first;}}vector(size_t n, const T &val = T()) {resize(n, val);}//防止和上面迭代器区间搞混vector(int n, const T &val = T()) {resize(n, val);}//赋值 ,这里vector<T> v在传值的时候就已经有拷贝构造了vector<T> &operator=(vector<T> v) {swap(v);return *this;}T &operator[](size_t n) {return *(_start + n);}const T &operator[](size_t n) const {return *(_start + n);}~vector() {if (_start) {delete[] _start;_start = _finish = _end_of_storage = nullptr;}}void swap(vector<T> v) {std::swap(_start, v._start);std::swap(_finish, v._finish);std::swap(_end_of_storage, v._end_of_storage);}void reserve(size_t n) {if (n > capacity()) {//开辟新空间size_t old_size = size();iterator tmp = new T[n];//start不为空，在复制完内容需要释放空间if (_start) {//                    //对于自定义类型，在进行delete[] _start 之后（自定义类型里面存在指针开辟空间问题的时候），会把原来的_start里面内容进行析构和空间释放//                    memcpy(tmp, _start, old_size * sizeof(T));//  解决方案，进行深拷贝for (size_t i = 0; i < old_size; ++i) {tmp[i] = _start[i];}delete[] _start;}_start = tmp;//这里要注意，得用之前的size，不然新size使用内联进来就是_finish = _start + _finish - _start_finish = _start + old_size;_end_of_storage = _start + n;}}void resize(size_t n, T val = T()) {if (n > capacity()) {size_t fill = _start + n - _finish;reserve(n);//填补之前finish后面fill个数据while (fill != 0) {*_finish = val;_finish++;fill--;}}}void push_back(const T &val) {if (_finish == _end_of_storage) {size_t newCapacity = capacity() == 0 ? 4 : 2 * capacity();reserve(newCapacity);}*_finish = val;++_finish;}void pop_back() {--_finish;}void insert(iterator pos, const T &val) {assert(pos >= _start);assert(pos <= _finish);if (_finish == _end_of_storage) {size_t len = pos - _start;size_t newCapacity = capacity() == 0 ? 4 : 2 * capacity();reserve(newCapacity);pos = _start + len;//防止增容量后，pos位置还是之前被释放的空间}//memmove(pos + 1, pos, sizeof(T) * (_finish - pos)); //浅拷贝，扩容可能存在迭代器失效问题iterator end = _finish - 1;while (pos <= end) {*(end + 1) = *end;--end;}*pos = val;++_finish;}iterator begin() {return _start;}const_iterator begin() const {return _start;}iterator end() {return _finish;}const_iterator end() const {return _finish;}size_t size() const {return _finish - _start;}size_t capacity() const {return _end_of_storage - _start;}private:iterator _start = nullptr;iterator _finish = nullptr;iterator _end_of_storage = nullptr;};void test_vector1() {vector<char> v;v.reserve(10);cout << v.size() << " " << v.capacity() << endl;
//        v.resize(100);v.resize(100, 'x');cout << v.size() << " " << v.capacity() << endl;}void test_vector2() {vector<int> v;v.push_back(1);v.push_back(2);v.push_back(3);v.push_back(4);v.push_back(5);for (auto e: v) {cout << e << " ";}cout << endl;}void test_vector3() {vector<string> v;v.push_back("hh");v.insert(v.begin(), "2");v.insert(v.begin(), "2");v.insert(v.begin(), "2");v.insert(v.begin(), "2");v.insert(v.begin(), "2");v.insert(v.begin(), "2");v.insert(v.begin(), "2");v.insert(v.begin(), "2");for (auto e: v) {cout << e << " ";}cout << endl;}void test_vector4() {vector<string> v1;v1.push_back("hhh");v1.push_back("www");for (auto e: v1) {cout << e << " ";}cout << endl;vector<string> v2;v2.push_back("lllll");v2.push_back("nnnnn");for (auto e: v2) {cout << e << " ";}cout << endl;cout << "----------------------" << endl;v1 = v2;for (auto e: v1) {cout << e << " ";}cout << endl;for (auto e: v2) {cout << e << " ";}cout << endl;}void test_vector5() {vector<string> v;v.push_back("w");v.push_back("s");v.push_back("x");v.push_back("p");cout << v[1] << endl;}void test_vector6() {vector<string> v;v.push_back("w");v.push_back("s");v.push_back("x");v.push_back("p");v.push_back("p");v.push_back("p");v.push_back("p");v.push_back("p");v.push_back("psdf");v.push_back("pdsf");v.push_back("pfd");v.push_back("pdsf");v.insert(v.begin(), "sdas");for (auto e: v) {cout << e << " ";}cout << endl;}void test_vector7() {vector<string> v;v.push_back("w");v.push_back("s");v.push_back("x");v.push_back("p");v.push_back("p");v.push_back("p");vector<string> v2(v.begin(), v.end());for (auto e: v2) {cout << e << " ";}cout << endl;int a[] = {1111, 222, 222, 3};vector<int> v3(a, a + 4);for (auto e: v3) {cout << e << " ";}cout << endl;list<string> lt;lt.push_back("hjakds");lt.push_back("wq");lt.push_back("qw");lt.push_back("w");vector<string> v4(lt.begin(), lt.end());for (auto e: v4) {cout << e << " ";}cout << endl;vector<int> v5(5, 5);for (auto e: v5) {cout << e << " ";}cout << endl;}}

main.h文件

#include <iostream>
#include "vector.h"//vector 模拟实现
int main() {
//    xp::test_vector1();
//    xp::test_vector2();
//    xp::test_vector3();
//    xp::test_vector4();
//    xp::test_vector5();
//    xp::test_vector6();xp::test_vector7();return 0;
}

使用memcpy拷贝问题

在reserve接口中存在扩容情况，对于内置类型，使用memcpy函数对数据进行拷贝不存在什么问题，但是对于自定义类型，如string类，在使用memcpy进行拷贝的时候，虽然将原数据拷贝到了新空间上，但是string类的成员变量存在指针_str，如果直接将该数据直接拷贝过来，那么新空间里的_str和旧空间的_str会指向同一块空间，在旧空间释放后，新空间的_str指针就变成了野指针。其实就是memcpy的浅拷贝问题，解决办法就是使用深拷贝，即直接把旧空间的数据采用赋值的方式（string赋值是深拷贝）放到新空间中。
使用memcpy的代码
void reserve(size_t n) {if (n > capacity()) {//开辟新空间size_t old_size = size();iterator tmp = new T[n];//start不为空，在复制完内容需要释放空间if (_start) {memcpy(tmp, _start, old_size * sizeof(T));delete[] _start;}_start = tmp;//这里要注意，得用之前的size，不然新size使用内联进来就是_finish = _start + _finish - _start_finish = _start + old_size;_end_of_storage = _start + n;}
}
这里就导致在释放完_start后，_tmp中的_str变成野指针。
解决办法：使用string的赋值进行深拷贝
void reserve(size_t n) {if (n > capacity()) {//开辟新空间size_t old_size = size();iterator tmp = new T[n];//start不为空，在复制完内容需要释放空间if (_start) {
//                    //对于自定义类型，在进行delete[] _start 之后（自定义类型里面存在指针开辟空间问题的时候），会把原来的_start里面内容进行析构和空间释放
//                    memcpy(tmp, _start, old_size * sizeof(T));//  解决方案，进行深拷贝for (size_t i = 0; i < old_size; ++i) {tmp[i] = _start[i];}delete[] _start;}_start = tmp;//这里要注意，得用之前的size，不然新size使用内联进来就是_finish = _start + _finish - _start_finish = _start + old_size;_end_of_storage = _start + n;}
}
结论：如果对象中涉及到资源管理时，千万不能使用memcpy进行对象之间的拷贝，因为memcpy是浅拷贝，否则可能会引起内存泄漏甚至程序崩溃。