前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >【C++】vector模拟实现、迭代器失效问题(超详解)

【C++】vector模拟实现、迭代器失效问题(超详解)

作者头像
羚羊角
发布2024-11-15 08:25:07
发布2024-11-15 08:25:07
7600
代码可运行
举报
文章被收录于专栏:羚羊角的特别专栏
运行总次数:0
代码可运行

vector会使用之后我们来模拟实现一下,通过对vector的模拟实现,我们来说一下迭代器失效问题。

1.准备工作

在头文件vector.h里声明和实现函数,然后在test.cpp里测试代码的正确性。

vector.h中用命名空间分隔一下,因为c++库里面也有vector,避免冲突。vector.h里面写一些会用到的头文件,vector的成员变量类型都是T*,为了和vector源码保持一致,我们也把T*换个名字,换成iterator,然后定义成员变量。

代码语言:javascript
代码运行次数:0
复制
namespace lyj
{
	template<class T> 
	class vector
	{
	public:
		typedef T* iterator;

	private:
		iterator _start = nullptr; 
        iterator _finish = nullptr; 
        iterator _end_of_storage = nullptr; 
	};
}

2.size、capacity、reserve

全都在vector.hvector类里面声明和实现,目前不做声明和定义分离。

代码语言:javascript
代码运行次数:0
复制
size_t size() const
{
	return _finish - _start;
}
代码语言:javascript
代码运行次数:0
复制
size_t capacity() const
{
	return _end_of_storage - _start;
}
代码语言:javascript
代码运行次数:0
复制
void reserve(size_t n)
{
	if (n > capacity()) //n大于capacity扩容
	{
		T* t = new T[n];//开辟新空间
		memcpy(t, _start, size * sizeof(T));//拷贝旧空间的数据到新空间
		delet[] _start; //释放旧空间
		_start = t; //指向新空间
		_finish = _start + size();//更新数据
		_end_of_storage = _start + n;//更新数据
	}
	//其他不变
}

3.operator[]、push_back、pop_back、empty

全都在vector.hvector类里面声明和实现,目前不做声明和定义分离。

代码语言:javascript
代码运行次数:0
复制
//普通版本
T& operator[](size_t i)
{
	assert(i < size());
	return _start[i];
}
//const版本
const T& operator[](size_t i) const
{
	assert(i < size());
	return _start[i];
}
代码语言:javascript
代码运行次数:0
复制
//尾插
void push_back(const T& x)
{
	if (_finish == _end_of_storage)//空间不够
	{
		reserve(capacity() == 0 ? 4 : capacity() * 2);//2倍扩
	}
	*_finish = x;
	++_finish;
}
代码语言:javascript
代码运行次数:0
复制
//判空
bool empty() const
{
	return _start == _finish;
}
代码语言:javascript
代码运行次数:0
复制
//尾删
void pop_back()
{
	assert(!empty());
	--_finish;
}

test.cpp中对前面的所有代码进行测试。

代码语言:javascript
代码运行次数:0
复制
#include "vector.h"
namespace lyj
{
	void test1()
	{
		vector<int> v;
		v.push_back(1);
		v.push_back(2);
		v.push_back(3);
		v.push_back(4);
		v.push_back(5);
		for (size_t i = 0; i < v.size(); i++)
		{
			cout << v[i] << " ";
		}
		cout << endl;
	}
}

int main()
{
	lyj::test1();
	return 0;
}

运行发现程序崩溃了。

因为我们前面的reserve逻辑有问题。

所以_finish 不是我们想要的值。

解决方法1:先更新_finish。

代码语言:javascript
代码运行次数:0
复制
void reserve(size_t n)
{
	if (n > capacity()) //n大于capacity扩容
	{
		T* t = new T[n];//开辟新空间
		memcpy(t, _start, size() * sizeof(T));//拷贝旧空间的数据到新空间
		delete[] _start; //释放旧空间

		_finish = t + size();//先更新_finish的数据
		_start = t; //再指向新空间
		_end_of_storage = _start + n;//更新数据
	}
	//其他不变
}

解决方法2:用old_size存值。

代码语言:javascript
代码运行次数:0
复制
void reserve(size_t n)
{
	if (n > capacity()) //n大于capacity扩容
	{
		size_t old_size = size();//存值
		T* t = new T[n];//开辟新空间
		memcpy(t, _start, size() * sizeof(T));//拷贝旧空间的数据到新空间
		delete[] _start; //释放旧空间

		_start = t; //指向新空间
		_finish = t + old_size;//用old_size更新数据
		_end_of_storage = _start + n;//更新数据
	}
	//其他不变
}

再运行代码,就可以通过了。

4.迭代器和范围for

4.1 普通正向迭代器

全都在vector.hvector类里面声明和实现,目前不做声明和定义分离。

代码语言:javascript
代码运行次数:0
复制
iterator begin()
{
	return _start;
}
代码语言:javascript
代码运行次数:0
复制
iterator end()
{
	return _finish;
}

test.cpp中进行测试。

代码语言:javascript
代码运行次数:0
复制
void test1()
{
	vector<int> v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);
	v.push_back(5);
	
	vector<int>::iterator it = v.begin();
	while (it != v.end())
	{
		cout << *it << " ";
		it++;
	}
}

4.2 普通范围for

支持迭代器就支持了范围for。

代码语言:javascript
代码运行次数:0
复制
for (auto e : v)
{
	cout << e << " ";
}
cout << endl;

4.3 const迭代器

const迭代器就要用const的iterator,所以我们typedef一个const_iterator,原类型是const T*。

代码语言:javascript
代码运行次数:0
复制
typedef const T* const_iterator;

const迭代器的实现就是把普通正向迭代器返回值类型换一下。

代码语言:javascript
代码运行次数:0
复制
const_iterator begin() const
{
	return _start;
}

const_iterator end() const
{
	return _finish;
}

当迭代器换成const迭代器后,范围for也要是const的。

test.cpp中进行测试。

代码语言:javascript
代码运行次数:0
复制
void test1()
{
	vector<int> v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);
	v.push_back(5);
	
	vector<int>::const_iterator it = v.begin();
	while (it != v.end())
	{
		cout << *it << " ";
		it++;
	}
	cout << endl;

	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
}

5.拓展知识

我们把迭代器和范围for打印数据单独写成一个函数。

代码语言:javascript
代码运行次数:0
复制
void vector_print(const vector<int>& v)
{
	vector<int>::const_iterator it = v.begin();
	while (it != v.end())
	{
		cout << *it << " ";
		it++;
	}
	cout << endl;

	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
}

但是我们写的这个函数只能打印vector<int>类型的数据,我如果想打印vector<double>呢?

有人肯定想到了,写成函数模板。

代码语言:javascript
代码运行次数:0
复制
template<class T>
void vector_print(const vector<T>& v)
{
	vector<T>::const_iterator it = v.begin();
	while (it != v.end())
	{
		cout << *it << " ";
		it++;
	}
	cout << endl;

	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
}

这样想打印什么就打印什么。

但是这样写,编译器会编译报错,因为:没有实例化的类模板里面取东西,编译器不能区分这里的const_iterator是类型还是静态成员变量。

解决方法1:在vector<T>::const_iterator it = v.begin();这句代码前面加上typename,就是我们告诉编译器,这里是类型。

解决方法2:类型直接写成auto。

6.insert和迭代器失效问题

vector.hvector类里面声明和实现,insert代码如下。

代码语言:javascript
代码运行次数:0
复制
void insert(iterator pos, const T& x)
{
    assert(pos >= _start);
    assert(pos <= _finish);
	if (_finish == _end_of_storage)
	{
		size_t len = pos - _start; //记录距离
		reserve(capacity() == 0 ? 4 : capacity() * 2);
		pos = _start + len;//更新pos
	}
	iterator end = _finish - 1;
	while (end >= pos)
	{
		*(end + 1) = *end;
		end--;
	}
	*pos = x;
	++_finish;
}

6.1 失效情况1

按照我们写string的insert的思路写vector的insert。

代码语言:javascript
代码运行次数:0
复制
void insert(iterator pos, const T& x)
{
	if (_finish == _end_of_storage)
	{
		reserve(capacity() == 0 ? 4 : capacity() * 2);
	}
	iterator end = _finish - 1;
	while (end >= pos)
	{
		*(end + 1) = *end;
		end--;
	}
	*pos = x;
	++_finish;
}

test.cpp中进行测试。

代码语言:javascript
代码运行次数:0
复制
void test2()
{
	vector<int> v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);
	v.push_back(5);
	v.vector_print(v);
	v.insert(v.begin() + 2, 30);
	v.vector_print(v);
}

当我们已经扩容好的时候,这个程序是没问题的。但是如果空间不够,我们插入数据时正好要扩容呢?程序会出现崩溃

原因如下。

此时的pos已经找不到了类似野指针。这就是一个最基础的迭代器失效问题。

解决方法就是我们先记录pos到start的位置距离,在扩容的时候更新pos,代码如下。

代码语言:javascript
代码运行次数:0
复制
void insert(iterator pos, const T& x)
{
	if (_finish == _end_of_storage)
	{
		size_t len = pos - _start; //记录距离
		reserve(capacity() == 0 ? 4 : capacity() * 2);
		pos = _start + len;//更新pos
	}
	iterator end = _finish - 1;
	while (end >= pos)
	{
		*(end + 1) = *end;
		end--;
	}
	*pos = x;
	++_finish;
}

6.2 find

其实vector并没有像string那样实现find接口,如果我们想在vector用find,就要用算法库里面的find。

这个find是个模板,所有的容器都可以使用,这也体现了封装的特点。这个函数在first和last-1的区间找,找到了就返回下标,没找到就返回last。

比如说我们要找2,用法如下。

代码语言:javascript
代码运行次数:0
复制
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
auto pos = find(v.begin(), v.end(), 2);

然后呢在2的前面插入一个40.

代码语言:javascript
代码运行次数:0
复制
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
auto pos = find(v.begin(), v.end(), 2);
if (pos != v.end())
{
	v.insert(pos, 40);
}
v.vector_print(v);

6.3 失效情况2

访问pos,让pos位置的值加1。

代码语言:javascript
代码运行次数:0
复制
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
auto pos = find(v.begin(), v.end(), 2);
if (pos != v.end())
{
	v.insert(pos, 40);
	*pos += 1; //pos位置的值加1
}
v.vector_print(v);

pos地方的值毫无变化。 虽然pos在insert内部更新了,但是这种在外部访问的情况下,pos是局部变量,出了作用域就被销毁了,其实就是形参的改变不影响实参。参数pos加&是行不通的,因为这样就不支持别的迭代器了。

insert之后,pos已经失效了,前面画过图,所以,insert之后pos失效,不要访问。

insert改写

如果我们非要访问,insert的写法就要发生变化。如下。

代码语言:javascript
代码运行次数:0
复制
iterator insert(iterator pos, const T& x)
{
	assert(pos >= _start);
	assert(pos <= _finish);
	if (_finish == _end_of_storage)
	{
		size_t len = pos - _start; //记录距离
		reserve(capacity() == 0 ? 4 : capacity() * 2);
		pos = _start + len;//更新pos
	}
	iterator end = _finish - 1;
	while (end >= pos)
	{
		*(end + 1) = *end;
		end--;
	}
	*pos = x;
	++_finish;
	return pos; //返回插入的位置
}
解决方法

然后我们记录pos的位置,再访问pos。

代码语言:javascript
代码运行次数:0
复制
void test3()
{
	vector<int> v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);
	auto pos = find(v.begin(), v.end(), 2);
	if (pos != v.end())
	{
		pos = v.insert(pos, 40);
		*pos += 1; //pos位置的值加1
	}
	v.vector_print(v);

}

所以insert之后pos失效,不要直接访问,要访问就要更新这个失效的迭代器。

6.4 失效情况3

以前面的pos为例,pos原本指向的是2,我们插入一个数据之后,pos指向了新插入的那个数据。

这也是一种迭代器失效的情况。前两种失效情况我们可以理解为类似野指针,这种失效情况就是位置的意义已经变了。 所以insert后我们认为迭代器也失效了,所以不要访问

如果使用vector,在vs下上述情况去访问pos,是会直接报错的,Linux下不会,这要看编译器。

7.erase和迭代器失效问题

7.1 erase

vector.hvector类里面声明和实现。

代码语言:javascript
代码运行次数:0
复制
void erase(iterator pos)
{
	assert(pos >= _start);
	assert(pos < _finish);
	iterator it = pos + 1;
	while (it != end())
	{
		*(it - 1) = *it;
		++it;
	}
	_finish--;
}

test.cpp中进行测试。比如我们要删除所有偶数。

代码语言:javascript
代码运行次数:0
复制
void test4()
{
	vector<int> v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);
	v.push_back(5);

	v.vector_print(v);
	vector<int>::iterator i = v.begin();
	while (i != v.end())
	{
		if (*i % 2 == 0)
		{
			v.erase(i);
		}
		++i;
	}
	v.vector_print(v);
}

看起来成功了,我们换一个测试样例,换成123445。

没删干净。 再换一个样例1234。

程序崩溃。

7.2迭代器失效问题

erase这里的迭代器失效和前面的失效情况一样,此时的i已经不是原来的数据了,就是失效了。如果一定要访问,更新一下在访问。

erase改写

所以我们这里的erase要有返回值,返回被删除元素的下一个元素。

代码语言:javascript
代码运行次数:0
复制
iterator erase(iterator pos)
{
	assert(pos >= _start);
	assert(pos < _finish);
	iterator it = pos + 1;
	while (it != end())
	{
		*(it - 1) = *it;
		++it;
	}
	_finish--;
	return pos;
}

test.cpp中进行测试。

代码语言:javascript
代码运行次数:0
复制
void test4()
{
	vector<int> v;
	v.push_back(1);
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);

	v.vector_print(v);
	vector<int>::iterator i = v.begin();
	while (i != v.end())
	{
		if (*i % 2 == 0)
		{
			i = v.erase(i);//erase返回的是被删除数据的下一个数据
		}
		else
			++i;
	}
	v.vector_print(v);
}

都能正确处理。

8.resize

先回顾一下std里面中resize的结构。

vector.hvector类里面声明和实现。

这里的value_type其实就是模板参数T。所以我们在模拟实现resize的时候参数如下。

代码语言:javascript
代码运行次数:0
复制
void resize(size_t n, T val = T())
{

}

这里T val = T()就是先通过后面的T的默认构造去构造一个匿名对象,然后再拷贝构造给前面的val,自定义类型要缺省的话,就是像这样,给相应的默认构造。当然这里默认构造+拷贝构造我们说过编译器可能会做优化,直接就是一个构造。

拓展

但是,但是,如果T不是自定义类型呢?我们说过,内置类型没有构造这样的概念。针对这一情况,内置类型也有了构造函数的概念。

代码语言:javascript
代码运行次数:0
复制
int i = int();//初始化为0
iny j = int(1);//初始化为1
int k(2); //初始化为2

通过前面对resize的了解,我们知道,resize会出现三种情况。如下。

如果忘记了,请看【C++】vector使用详解_vector c++ 用法-CSDN博客 5.resize 。

我们模拟实现的时候也分两个情况就可以了,n<size和其他情况。

代码语言:javascript
代码运行次数:0
复制
void resize(size_t n, T val = T())
{
	if (n < size())
	{
		_finish = _start + n;
	}
	else
	{
		reserve(n);//reserve内部会对n判断
		while (_finish < _start + n)
		{
			_finish = val;
			++_finish;
		}
	}
}

test.cpp中进行测试。

代码语言:javascript
代码运行次数:0
复制
void test5()
{
	vector<int> v;
	v.resize(6, 5);
	v.vector_print(v);
}

9.构造函数和析构函数

9.1 析构函数

代码语言:javascript
代码运行次数:0
复制
~vector()
{
	if (_start)
	{
		delete[] _start;
		_start = _finish = _end_of_storage = nullptr;
	}
}

9.2 构造函数

代码语言:javascript
代码运行次数:0
复制
//vector() //默认构造
//{}

//C++11支持,强制生成默认构造
vector() = default; //默认构造
vector(const vector<T>& v)//拷贝构造
{
    reserve(v.size());
	for (auto& e : v)
	{
		push_back(e);
	}
}

10.swap、clear和operator=

vector.hvector类里面声明和实现。

10.1 传统写法

代码语言:javascript
代码运行次数:0
复制
void swap(vector<T>& v)
{
	std::swap(_start, v._start);
	std::swap(_finish, v._finish);
	std::swap(_end_of_storage, v._end_of_storage);
}
代码语言:javascript
代码运行次数:0
复制
void clear()
{
	_finish = _start;
}
代码语言:javascript
代码运行次数:0
复制
vector<T>& operator=(const vector<T>& v)
{
	if (this != &v)
	{
		clear();
		reserve(v.size());
		for (auto& e : v)
		{
			push_back(e);
		}
	}
	return *this;
}

上面写的是传统写法。

test.cpp中进行测试一下传统写法。

代码语言:javascript
代码运行次数:0
复制
vector<int> v1, v2;
v1.resize(5, 1);
v1.vector_print(v1);
v2.resize(5, 2);
v2.vector_print(v2);
v2 = v1;
v2.vector_print(v2);

10.2 现代写法

现代写法的具体内容在【C++拓展】深拷贝的传统写法vs现代写法,你更喜欢哪个?-CSDN博客

代码语言:javascript
代码运行次数:0
复制
vector<T>& operator=(vector<T> v)
{
	swap(v);
	return *this;
}

测试用例和上面一样。

vector模拟实现大概结构以及迭代器失效问题就介绍完了,拜拜~

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-11-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.准备工作
  • 2.size、capacity、reserve
  • 3.operator[]、push_back、pop_back、empty
  • 4.迭代器和范围for
    • 4.1 普通正向迭代器
    • 4.2 普通范围for
    • 4.3 const迭代器
  • 5.拓展知识
  • 6.insert和迭代器失效问题
    • 6.1 失效情况1
    • 6.2 find
    • 6.3 失效情况2
      • insert改写
      • 解决方法
    • 6.4 失效情况3
  • 7.erase和迭代器失效问题
    • 7.1 erase
    • 7.2迭代器失效问题
      • erase改写
  • 8.resize
  • 9.构造函数和析构函数
    • 9.1 析构函数
    • 9.2 构造函数
  • 10.swap、clear和operator=
    • 10.1 传统写法
    • 10.2 现代写法
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档