C 语言

关注公众号 jb51net

关闭
首页 > 软件编程 > C 语言 > C++ vector的实现

C++中vector的实现方法示例详解

作者:丢掉幻想准备斗争

这篇文章主要介绍了C++中vector实现的相关资料,vector是C++中重要的容器之一,底层通过三个迭代器实现,分别是_start, _finish, 和_end_of_storage,文中通过代码介绍的非常详细,需要的朋友可以参考下

1. vector介绍

vector本质其实就是和我们数据结构中的顺序表类似,都是对一个数组进行增删查改等操作,但是这里vector的实现和顺序表的实现有所不同,vector的底层源码的实现是通过三个迭代器实现的,一个是指向开始的位置_start,一个是指向有效数据末尾的迭代器_finish还有一个是指向有效空间的迭代器_end_of_storage;而顺序表则是一个指针指向一块空间,和两个计数器int size计算有效空间内有效的元素个数和int capacity 记录有效空间大小的整形变量;

2. vector的实现

2.1 vector的类的基本结构

如上所述,vector的实现是通过三个成员即三个迭代器实现的;但库内的vector的使用通常有可以使用不同的类型例如vector<int>, vector<char>,vector<double>等等,所以我们就需要实现一个vector的模板,然后还要实现他们的迭代器,我们同源码的迭代器实现不同,但迭代器其实就跟指针的用法几乎一样,所以我们这里通过指针来实现迭代器;如下代码所示:

template<class T>
class vector
{
public:
	typedef T* iterator;
	typedef const T* const_iterator;
private:
	//有三个迭代器
	iterator _start = nullptr; //指向开头
	iterator _finish = nullptr;   //指向有效元素末尾后一个位置
	iterator _end_of_storage = nullptr;  //指向有效空间末尾
};

2.2 vector构造和析构函数的实现

如上三个迭代器成员可见,我们已经给了缺省参数nullptr,那么在实例化的过程中我们只需要有一个构造函数,他们就会自动走初始化列表使用缺省参数进行初始化;而这里我们有了个创建一个构造函数的新的用法,这是在C++11才加进的;如下代码所示:

vector() = default;

然后是拷贝构造,拷贝构造其实就是实例化出一个新的对象,而新的对象的值和传入拷贝的对象的值相同,那我们就可以直接通过一个范围for让把被拷贝的对象的值依次插入实例化出的新的对象里面即可,这里先提前使用下面会讲到的内容,我们只需要知道push_back就是往里插入数据;

	vector(const vector<T>& v)
	{
		for (auto e : v)
		{
			push_back(e);
		}
	}

再者就是传入一段迭代器进行构造实例化出新的对象;但我们这里要重新写一个模板,这样我们就可以把一些不同类型的不同结构的对象存到vector里面来;

	template<class InterIterator>
	vector(InterIterator first, InterIterator last)
	{
		while (first != last)
		{
			push_back(*(first));
			++first;
		}
	}

最后是析构函数就不过多介绍;

	~vector()
	{
		if (_start)
			delete[]_start;
		_start = nullptr;
		_finish = nullptr;
		_end_of_storage = nullptr;
	}

2.3 赋值运算符重载、swap、begin()、end()、capacity()、size()

swap的实现:由于和string类的实现一样,如果说我们调用库的swap并且是大量的数据进行交换的话效率会降低效率;如下图:

至于为什么会降低效率是因为红色方框那里会调用一次拷贝构造;然后绿色方框那也说了会降低效率,所以我们自主实现一个在类内且不会调用拷贝构造的swap;如下代码所示: 

	void swap(vector<T>& v)
	{
		std::swap(_start, v._start);
		std::swap(_finish, v._finish);
		std::swap(_end_of_storage, v._end_of_storage);
	}

赋值运算符重载的实现:如下图

赋值运算符重载其实只需要调用swap就可以,而且我们的参数是传值 不是传引用,所以不会对v的原数据造成影响,最后再返回*this即可;如下代码所示:

	void swap(vector<T>& v)
	{
		std::swap(_start, v._start);
		std::swap(_finish, v._finish);
		std::swap(_end_of_storage, v._end_of_storage);
	}
	vector& operator=(vector<T> v)
	{
		swap(v);
		return *this;
	}

然后是begin()传回首元素的迭代器、end()传回尾部元素的迭代器、capacity()传回有效空间大小、size()传回有效元素个数以及empty()判断vector容器是否为空的实现如下;

begin()和end()其实就是直接返回_start和_finish即可,但是他们还有一个const_iterator就是指向不可被修改的所以实现了两种;如下代码所示:

	iterator begin()
	{
		return _start;
	}
	iterator end()
	{
		return _finish;
	}
	const_iterator begin() const
	{
		return _start;
	}
	const_iterator end() const
	{
		return _finish;
	}

capacity()和size()这里返回他们的大小,应该是整型才对,但是我们的底层是迭代器,那该怎么办呢? 其实这里涉及到我们指针的一个知识点,那就是指针减指针返回的是两个指针之间的元素个数,那我们就用用到这里来;如下代码所示:

	size_t capacity()const
	{
		return _end_of_storage - _start;
	}
	size_t size()const
	{
		return _finish - _start;
	}

最后一个是判空empt(),这个其实只需要看他的_start指向的空间和_finish指向的空间是否是同一块空间即可如下代码所示:

	bool empty()
	{
		return _start == _finish;
	}

2.4 reserve的实现(重点)

reserve就是预先开空间,如果说开的空间比原有的空间小的话capacity 和size不会变化,但是比原有的空间大的话就会给他们开足n个空间;如下测试可知:

#include<vector>
#include<iostream>
using namespace std;

int main()
{
	vector<int>v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);
	v.push_back(5);
	v.push_back(6);
	v.push_back(7);

	cout << "capcaity is:> " << v.capacity() << endl;
	cout << "size is:> " << v.size() << endl;

	v.reserve(3);
	cout << "After reserve(3) capcaity is:> " << v.capacity() << endl;
	cout << "After reserve(3) size is:> " << v.size() << endl;

	v.reserve(20);
	cout << "After reserve(20) capcaity is:> " << v.capacity() << endl;
	cout << "After reserve(20) size is:> " << v.size() << endl;
	return 0;

}

👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇

运行结果为:

那我们的实现也要和源码的功能一样,如果n比capacity小则不出现变化,如果比capacity大的话就需要进行扩容,而这里也涉及了深浅拷贝问题,我们需要自己new一段n一样大的空间然后把数据往里放,我先直接上代码,里面有些需要注意的地方在下面进行讲解:

	void reserve(size_t n)
	{
		if (n > capacity())
		{

			size_t old_size = size();
			T* temp = new T[n];
			//memcpy(temp, _start, size() * sizeof(T));
			for (size_t i = 0; i < old_size; i++)
			{
				temp[i] = _start[i];
			}
			delete[]_start;
			_start = temp;

			//_finish = temp + size();//这个是错误的示范,因为delete掉_start了,
			//那temp = _strt +size()(_finish-_start) 就为_finish,但是finish为NULL
			//因为已经被释放了
			_finish = temp + old_size;

			_end_of_storage = temp + n;
		}
	}

重点!重点!重点!重点!重点!重点!重点!重点!重点!重点!重点!重点!重点!

(内心所言:换个颜色的字体会不会让眼睛看的舒服点哈哈哈哈)

首先需要注意的第一点是:上面代码加了一个old_size进行记录size()并不是多余,如果说上面不加的话会出现错误,因为前面已经释放了_start,而size() = _finish - _start, 而_finish还指向原来已经被释放的空间,_finish = temp + _finish - _start;而_start = temp,_finish被释放了为NULL, 所以最后的结果会为NULL,所以我们需要预先把size()保存下来;

然后先说一下赋值运算符重载vv = v的实现实质上是把vv原有的空间释放掉,然后开一片和v一样大的空间,上面做到了开一样的空间,而只需要把v的值复制到vv就可以,但为什么我把memcpy注释掉了呢? 因为memcpy只是进行单纯的值和值赋值操作,如果说我用一个vector容器储存string类呢? 只进行值的拷贝就会导致浅拷贝而出现错误;下面举出了例子:

template<class T>
class vector
{
public:
	typedef T* iterator;
	typedef const T* const_iterator;


	void reserve(size_t n)
	{
		if (n > capacity())
		{

			size_t old_size = size();
			T* temp = new T[n];
			memcpy(temp, _start, size() * sizeof(T));
			delete[]_start;
			_start = temp;
			_finish = temp + old_size;

			_end_of_storage = temp + n;
		}
	}

private:
	//有三个迭代器
	iterator _start = nullptr; //指向开头
	iterator _finish = nullptr;   //指向有效元素末尾后一个位置
	iterator _end_of_storage = nullptr;  //指向有效空间末尾
};

void test2()
{
	vector<string> v;
	v.push_back("11111111111111111111");
	v.push_back("11111111111111111111");
	v.push_back("11111111111111111111");
	v.push_back("11111111111111111111");
	Print_Container(v);
    v.push_back("11111111111111111111");
	Print_Container(v);
}

int main()
{
	test2();
	return 0;
}

这里就是把memcpy解开了,那让我们来看看结果如何

👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇

运行结果为:

出现很多随机值,正如我们所说,单纯的memcpy只会把值进行浅拷贝如下图所示:

但为什么我们只进行单纯的赋值操作就可以实现深拷贝了呢?那是因为我们传了string类型即vector<string>,而

改段赋值其实就是调用了string里的赋值运算符,库内的已经重载过了,所以会进行深拷贝操作;

2.5 push_back和pop_back()操作实现

其实也没有什么可讲的,因为和string类实现的非常相似,我们只需要注意当容器满的时候就需要进行扩容,然后把值放到*_finish里,然后finish还要往后走;而尾删pop_back更简单,因为她不需要考虑空间是否充足,只需要看空间是否为空即可;如下代码所示:

		void push_back(const T& x)
		{
			if (_finish == _end_of_storage)
			{
				reserve(capacity() == 0 ? 4 : capacity() * 2);
			}
			(*_finish) = x;
			_finish++;
		}

		void pop_back()
		{
			assert(!empty());
			--_finish;
		}

2.6 resize的实现

resize顾名思义就是改变size的,实现他的话有两种需要注意的情况,第一种如果说改变的大小n如果size < n < capacity的话则需要改变_finish的位置,但是capacity不会变;第二种如果说n>capacity的话则需要扩容,如果有给值则初始化新开的空间的值,如果没有则给匿名对象实例化出的值进行初始化如下代码所示:

		void resize(size_t n, T val = T())
		{
			if (n < size())
			{
				_finish = _start + n;
			}
			//这里包括两种情况,一种是 size < n < capacity;
			//还有一种是capacity < n 那就需要拿n来进行扩容操作,而这步操作在reserve(n)
			//会实现
			else
			{
				reserve(n);
				while (_finish < _start + n)
				{
					*_finish = val;
					_finish++;
				}
			}
		}

这里第二个参数是T val = T(),T()其实就是匿名对象(这也看出匿名对象的作用,就是给不知道给什么类型缺省值的参数用的);

2.7 insert和erase的实现

insert不单纯只是说插入数据,这里面还涉及到一个迭代器失效的知识点,就是当如果调用v.insert(p,10) 想在p的位置插入10的,但出现了空间不足需要扩容的情况后,p迭代器需要被更新,因为扩容后是新开的一块空间,但p还指向原来的空间,所以会出现野迭代器的情况;而解决方案是,我们先记录相对位置,即len = _start到pos位置的距离,最后再让pos走到相对位置处即pos = _start +len最后再返回pos即可;

上面标色的是特殊的迭代器失效的情况;下面是实现insert的思路:

1. 首先判断空间是否充足,因为你要插入数据;

2. 插入数据前需要把数据往后挪,然后再在pos位置插入数据;

3. 最后记得让_finish++, 因为插入数据后容量发生变化;如下代码所示:

		iterator insert(iterator pos, const T& v)
		{
			if (_finish == _end_of_storage)
			{
				//记下相对位置,因为扩容会让迭代器失效,成为野迭代器
				size_t len = pos - _start;
				reserve(capacity() == 0 ? 4 : capacity() * 2);
				pos = _start + len;
			}
			iterator end = _finish - 1;
			while (end >= pos)
			{
				*(end + 1) = *end;
				--end;
			}

			*pos = v;
			++_finish;
			return pos;
		}

erase的实现:

erase也会出现迭代器失效的问题,如果说编译器出现缩容的情况下也会出现和上面insert的一样,而且还有一种情况就是如果说erase了某个迭代器,那么我们就不能对这个迭代器进行访问,因为编译器会强行检察报错,他们不允许再使用一个调用了erase且未更新的迭代器;如下代码所示:

	void testErase()
	{
		std:: vector<int>v;
		v.push_back(1);
		v.push_back(2);
		v.push_back(3);
		v.push_back(4);
		v.push_back(5); 

		auto it = v.begin();
		while (it != v.end())
		{
			if (*it % 2 == 0)
			{
				 v.erase(it);
			}
			else
			{
				++it;
			}
		}
	}

👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇

调试结果为:

直接崩掉了,但我们加上it = v.erase更新他的话就可以过;如下代码所示:

	void testErase()
	{
		std:: vector<int>v;
		v.push_back(1);
		v.push_back(2);
		v.push_back(3);
		v.push_back(4);
		v.push_back(5); 

		auto it = v.begin();
		while (it != v.end())
		{
			if (*it % 2 == 0)
			{
				 it = v.erase(it);
			}
			else
			{
				++it;
			}
		}
	}

👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇  👇

运行结果为:

所以由此可见erase的返回值应该是个迭代器,那么我们就可以来实现自己的erase;

实现思路:

1、首先要判断pos的位置不能不在有效数据内

2、删除操作和顺序表一样,直接让后面的数覆盖需要删除的数即可;

3、最后需要--finish 因为删掉了数据,然后还要返回pos;如下代码所示:

		iterator erase(iterator pos)
		{
			assert(pos >= _start);
			assert(pos < _finish);

			auto it = pos + 1;
			while (it != end())
			{
				*(it - 1) = *it;
				++it;
			}
			--_finish;
			return pos;
		}

2.8 方括号重载即下标访问

直接返回对应下标的值即可直接上代码:

		T& operator[](size_t i)
		{
			assert(i < size());
			return _start[i];
		}
		const T& operator[](size_t i)const
		{
			assert(i < size());
			return _start[i];
		}

2.9 实现Print_vector操作

打印值其实很简单,但是里面有一点需要注意的是:在没有实例化的类模板里,编译器不能区分const_iterator是类型还是静态成员变量所以需要在前面加个typename,还有另外的解决方案如下代码所示:

	template<class T>
	void Print_vector(const vector<T>& v)
	{
		// 规定,没有实例化的类模板里面取东西,编译器不能区分这里const_iterator
		// 是类型还是静态成员变量,需要在前面加个typename
		vector<T>::const_iterator it = v.begin();

		//或者换一种
		//auto it = v.begin();
		//第一种遍历vector容器
		while (it != v.end())
		{
			cout << *it << " ";
			++it;
		}
		cout << endl;
		//第二种遍历vector容器
		//for (auto e : v)
		//{
		//	cout << e << " ";
		//}
		//cout << endl;
	}

2.10 实现打印所有容器(加餐)

	template <class Container>
	void Print_Container(const Container& v)
	{
		for (auto e : v)
		{
			cout << e << " ";
		}
		cout << endl;
	}

3. 完整的vector实现代码如下

vector.h

#pragma once
#include<iostream>
#include<assert.h>
#include <vector>
namespace Tao
{
	using namespace std;

	template<class T>
	class vector
	{
	public:
		typedef T* iterator;
		typedef const T* const_iterator;
		//构造函数
		//这个是前置构造函数
		vector() = default;
		vector(const vector<T>& v)
		{
			for (auto e : v)
			{
				push_back(e);
			}
		}

		template<class InterIterator>
		vector(InterIterator first, InterIterator last)
		{
			while (first != last)
			{
				push_back(*(first));
				++first;
			}
		}

		~vector()
		{
			if (_start)
				delete[]_start;
			_start = nullptr;
			_finish = nullptr;
			_end_of_storage = nullptr;
		}


		void swap(vector<T>& v)
		{
			std::swap(_start, v._start);
			std::swap(_finish, v._finish);
			std::swap(_end_of_storage, v._end_of_storage);
		}

		vector& operator=(vector<T> v)
		{
			swap(v);
			return *this;
		}

		iterator begin()
		{
			return _start;
		}
		iterator end()
		{
			return _finish;
		}
		const_iterator begin() const
		{
			return _start;
		}
		const_iterator end() const
		{
			return _finish;
		}

		size_t capacity()const
		{
			return _end_of_storage - _start;
		}
		size_t size()const
		{
			return _finish - _start;
		}
		bool empty()
		{
			return _start == _finish;
		}



		//reserve开空间
		void reserve(size_t n)
		{
			if (n > capacity())
			{
				
				size_t old_size = size();
				T* temp = new T[n];
				//memcpy(temp, _start, size() * sizeof(T));
				for (size_t i = 0; i < old_size; i++)
				{
					temp[i] = _start[i];
				}
				delete[]_start;
				_start = temp;

				//_finish = temp + size();//这个是错误的示范,因为delete掉_start了,
				//那temp = _strt +size()(_finish-_start) 就为_finish,但是finish为NULL
				//因为已经被释放了
				_finish = temp + old_size;

				_end_of_storage = temp + n;
			}
		}

		void push_back(const T& x)
		{
			if (_finish == _end_of_storage)
			{
				reserve(capacity() == 0 ? 4 : capacity() * 2);
			}
			(*_finish) = x;
			_finish++;
		}

		void pop_back()
		{
			assert(!empty());
			--_finish;
		}

		void resize(size_t n, T val = T())
		{
			if (n < size())
			{
				_finish = _start + n;
			}
			//这里包括两种情况,一种是 size < n < capacity;
			//还有一种是capacity < n 那就需要拿n来进行扩容操作,而这步操作在reserve(n)
			//会实现
			else
			{
				reserve(n);
				while (_finish < _start + n)
				{
					*_finish = val;
					_finish++;
				}
			}
		}


		iterator insert(iterator pos, const T& v)
		{
			if (_finish == _end_of_storage)
			{
				//记下相对位置,因为扩容会让迭代器失效,成为野迭代器
				size_t len = pos - _start;
				reserve(capacity() == 0 ? 4 : capacity() * 2);
				pos = _start + len;
			}
			iterator end = _finish - 1;
			while (end >= pos)
			{
				*(end + 1) = *end;
				--end;
			}

			*pos = v;
			++_finish;
			return pos;
		}

		iterator erase(iterator pos)
		{
			assert(pos >= _start);
			assert(pos < _finish);

			auto it = pos + 1;
			while (it != end())
			{
				*(it - 1) = *it;
				++it;
			}
			--_finish;
			return pos;
		}

		T& operator[](size_t i)
		{
			assert(i < size());
			return _start[i];
		}
		const T& operator[](size_t i)const
		{
			assert(i < size());
			return _start[i];
		}


	private:
		//有三个迭代器
		iterator _start = nullptr; //指向开头
		iterator _finish = nullptr;   //指向有效元素末尾后一个位置
		iterator _end_of_storage = nullptr;  //指向有效空间末尾
	};



	template<class T>
	void Print_vector(const vector<T>& v)
	{
		// 规定,没有实例化的类模板里面取东西,编译器不能区分这里const_iterator
		// 是类型还是静态成员变量,需要在前面加个typename
		vector<T>::const_iterator it = v.begin();

		//或者换一种
		//auto it = v.begin();
		//第一种遍历vector容器
		while (it != v.end())
		{
			cout << *it << " ";
			++it;
		}
		cout << endl;
		//第二种遍历vector容器
		//for (auto e : v)
		//{
		//	cout << e << " ";
		//}
		//cout << endl;
	}

	template <class Container>
	void Print_Container(const Container& v)
	{
		for (auto e : v)
		{
			cout << e << " ";
		}
		cout << endl;
	}

总结 

到此这篇关于C++中vector实现的文章就介绍到这了,更多相关C++ vector的实现内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文