前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【C++修炼之路】18.map和set

【C++修炼之路】18.map和set

作者头像
每天都要进步呀
发布2023-03-28 12:42:56
7170
发布2023-03-28 12:42:56
举报
文章被收录于专栏:C++/Linux

map和set

map和set

本节目标:

    1. 关联式容器
    1. 键值对
    1. 树形结构的关联式容器

一.关联式容器

在初阶阶段,我们已经接触过STL中的部分容器,比如:vector、list、deque、forward_list(C++11)等,这些容器统称为序列式容器,因为其底层为线性序列的数据结构,里面存储的是元素本身。那什么是关联式容器?它与序列式容器有什么区别? 关联式容器也是用来存储数据的,与序列式容器不同的是,其里面存储的是<key, value>结构的键值对,在数据检索时比序列式容器效率更高。

键值对:

用来表示具有一一对应关系的一种结构,该结构中一般只包含两个成员变量key和value,key代表键值,value表示与key对应的信息。比如:现在要建立一个英汉互译的字典,那该字典中必然有英文单词与其对应的中文含义,而且,英文单词与其中文含义是一一对应的关系,即通过该应该单词,在词典中就可以找到与其对应的中文含义。

树形结构的关联式容器:

根据应用场景的不桶,STL总共实现了两种不同结构的管理式容器:树型结构与哈希结构。**树型结构的关联式容器主要有四种:map、set、multimap、multiset。**这四种容器的共同点是:使用平衡搜索树(即红黑树)作为其底层结果,容器中的元素是一个有序的序列。下面一依次介绍每一个容器。

二.set

2.1 set的介绍

set的底层为二叉搜索树,也就是上一节中所实现的,不过在此之上,set作为容器来说,封装了和以前的vector、list、deque相关的迭代器、运算符重载等,方便我们去进行一系列的操作。

仍然是需要看文档:

set - C++ Reference (cplusplus.com)

可以发现,这与之前我们所学的容器的方法几乎差不多。只不过有了些许特征:

  1. set是按照一定次序存储元素的容器
  2. 在set中,元素的value也标识它(value就是key,类型为T),并且每个value必须是唯一的。set中的元素不能在容器中修改(元素总是const),但是可以从容器中插入或删除它们。
  3. 在内部,set中的元素总是按照其内部比较对象(类型比较)所指示的特定严格弱排序准则进行排序。
  4. set容器通过key访问单个元素的速度通常比unordered_set容器慢,但它们允许根据顺序对子集进行直接迭代。
  5. set在底层是用二叉搜索树(红黑树)实现的。
  6. set没有[]重载。

注意:

  1. 与map/multimap不同,map/multimap中存储的是真正的键值对<key, value>,set中只放value,但在底层实际存放的是由<value, value>构成的键值对。
  2. set中插入元素时,只需要插入value即可,不需要构造键值对。
  3. et中的元素不可以重复(二叉搜索树中重复则不会插入,并且返回false因此可以使用set进行去重)。
  4. 使用set的迭代器遍历set中的元素,可以得到有序序列
  5. set中的元素默认按照小于来比较
  6. set中查找某个元素,时间复杂度为:
log_2 n

(实际上是二叉搜索树的高度次)

  1. set中的元素不允许修改(为什么?)
  2. set中的底层使用二叉搜索树(红黑树)来实现。

2.2 set的使用

头文件当然是:#include<set>

1.set的模板参数列表

image-20230209173116553
image-20230209173116553

T: set中存放元素的类型,实际在底层存储<value, value>的键值对。 **Compare:**set中元素默认按照小于来比较 **Alloc:**set中元素空间的管理方式,使用STL提供的空间配置器管理

对于Compare来说,利用仿函数默认小于,就是默认按照升序去处理的,即上一讲中的二叉搜索树中序从小到大。

2.set的构造

函数声明

功能介绍

set (const Compare& comp = Compare(), const Allocator&= Allocator() );

构造空的set

set (InputIterator first, InputIterator last, const Compare& comp = Compare(), const Allocator& =Allocator() );

用[first, last)区间中的元素构造set

set ( const set<Key,Compare,Allocator>& x);

set的拷贝构造

3.set的迭代器

对于set的迭代器,和之前的vector、list相同,有正向迭代器、反向迭代器、const迭代器。名称都是一样的。

容量的函数也是如此,就不一一展示了,看上面文档就行,如果知道vector、list的容量函数,也可以不看。

4.set修改操作

pair<iterator,bool> insert (const value_type& x )

在set中插入元素x,实际插入的是<x, x>构成的键值对,如果插入成功,返回<该元素在set中的位置,true>,如果插入失败,说明x在set中已经存在,返回<x在set中的位置,false>

void erase ( iterator position )

删除set中position位置上的元素

size_type erase ( constkey_type& x )

删除set中值为x的元素,返回删除的元素的个数

void erase ( iterator first,iterator last )

删除set中[first, last)区间中的元素

void swap (set<Key,Compare,Allocator>&st );

交换set中的元素,实际上只需交换搜索树根节点的指针

iterator find ( constkey_type& x ) const

返回set中值为x的元素的位置

size_type count ( constkey_type& x ) const

返回set中值为x的元素的个数

对于第一个pair,实际上就是KV模型,下面会展示。erase的重载也没什么,交换函数值得一提的是由于底层是二叉搜索树,因此swap只需交换根节点的指针。对于find,count, 由于set是去重的元素,因此上面提到的返回位置以及元素个数并不需要在意,因为每一个元素都是唯一的。而也有不唯一的容器:multiset,multiset只排序不去重,下面讲这个的时候会知道返回位置是中序遍历的第一个。

演示1:

代码语言:javascript
复制
#include<iostream>
#include<set>//底层是二叉搜索树:自动进行排序去重
using namespace std;

void test_set1()
{
	set<int> s;//排序+去重
	s.insert(3);
	s.insert(1);
	s.insert(4);
	s.insert(7);
	s.insert(2);
	s.insert(1);

	set<int>::iterator it = s.begin();
	//auto it = s.begin();
	while (it != s.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;

	for (auto e : s)//范围for底层就是迭代器
	{
		cout << e << " ";
	}
	cout << endl;

	auto pos = s.find(3); //这个更快,因为借用搜索树的特性
	//auto pos = find(s.begin(), s.end(), 3);//底层实现不一样,这个是暴力查找
	if (pos != s.end())
	{
		s.erase(pos);
	}
	cout << s.erase(1) << endl;
	cout << s.erase(3) << endl;
	s.erase(1);
	s.erase(1);
	for (auto e : s)//范围for底层就是迭代器
	{
		cout << e << " ";
	}
	cout << endl;
}
int main()
{
	test_set1();
	return 0;
}
image-20230209181206177
image-20230209181206177

演示2:

代码语言:javascript
复制

5.bound函数

在文档中发现,有两个函数:lower_boundupper_bound,这两个实际上也是迭代器类型,传入的只有一个参数,同样是左闭右开,传值之后可以标记对应的位置:

代码语言:javascript
复制
int main()
{
	set<int> myset;
	set<int>::iterator itlow, itup;
	for (int i = 1; i < 10; i++)
	{
		myset.insert(i * 10);//10 20 30 40 50 60 70 80 90 
	}
	itlow = myset.lower_bound(35);
	itup = myset.upper_bound(70);

	myset.erase(itlow, itup);
	for (set<int>::iterator it = myset.begin(); it != myset.end(); it++)
	{
		cout << " " << *it;
	}
	cout << endl;
	return 0;
}
image-20230209174746490
image-20230209174746490

可见,对于erase也有迭代器为参数的重载函数,此外,通过bound类型的迭代器可以保存位置。即便没有该元素,同样可以标记,因为元素是有序。

如果把70变成75,itup同样会得到80的位置,所以upper_bound返回的是大于该位置的边界,可以对标end(),而lower_bound对标begin,返回的是大于等于的边界。这就非常方便获得一个左闭右开的范围。但这个东西实际上用的不多。

三.multiset

与set不同的是,multiset虽然会排序,但并不会进行去重,因此是由重复值的存在的。底层仍然是二叉搜索树。

代码语言:javascript
复制
#include<iostream>
#include<set>
#include<string>
using namespace std;
void test_set2()
{
	multiset<int> s;//单纯排序,没有去重
	s.insert(3);
	s.insert(1);
	s.insert(4);
	s.insert(7);
	s.insert(2);
	s.insert(1);
	s.insert(1);
	s.insert(1);
	s.insert(3);
	cout << s.count(1) << endl;//1的数量
	for (auto e : s)//范围for底层就是迭代器
	{
		cout << e << " ";
	}
	cout << endl;
}
int main()
{
	test_set2();

	return 0;
}
image-20230209211519444
image-20230209211519444

需要注意的是查找的返回值是中序遍历的第一个。

四.map

3.1 map的介绍

map的底层当然也是二叉搜索树,但就好比set是K模型一样,map就是上篇二叉搜索树提到的KV模型,即一一对应的方式。

文档说明:

www.cplusplus.com

  1. . map是关联容器,它按照特定的次序(按照key来比较)存储由键值key和值value组合而成的元素。
  2. 在map中,键值key通常用于排序和惟一地标识元素,而值value中存储与此键值key关联的内容。键值key和值value的类型可能不同,并且在map的内部,key与value通过成员类型value_type绑定在一起,为其取别名称为pair: typedef pair<const key, T value_type>;
  3. 在内部,map中的元素总是按照键值key进行比较排序的
  4. map中通过键值访问单个元素的速度通常比unordered_map容器慢,但map允许根据顺序对元素进行直接迭代(即对map中的元素进行迭代时,可以得到一个有序的序列)。
  5. map支持下标访问符,即在[]中放入key,就可以找到与key对应的value。
  6. map通常被实现为二叉搜索树(更准确的说:平衡二叉搜索树(红黑树))。

3.2 map的使用

头文件当然是:#include<map>

1.map的模板参数说明

image-20230209182014571
image-20230209182014571

key: 键值对中key的类型 T: 键值对中value的类型 Compare: 比较器的类型,map中的元素是按照key来比较的,缺省情况下按照小于来比较,一般情况下(内置类型元素)该参数不需要传递,如果无法比较时(自定义类型),需要用户自己显式传递比较规则(一般情况下按照函数指针或者仿函数来传递) **Alloc:**通过空间配置器来申请底层空间,不需要用户传递,除非用户不想使用标准库提供的空间配置器

而对于map的构造,迭代器的一些,与之前的容器使用方式相同,就不展示了,需要可以自行查看文档。

2.pair的介绍

我们需要知道pair:

image-20230209182555053
image-20230209182555053

first就是Key,second是Value。就是KV模型的结构。在搜索树定义的时候,我们是直接定义了两个变量类型:K,V。那为什么需要pair这个东西将两个值放在一起呢?实际上是为了map能够更方便的操作,举个例子,对于map,如果是迭代器访问,返回的时候不可能返回两个参数,这时候以pair为参数的函数就派上用场了,直接返回pair类型就好了。

image-20230209183231464
image-20230209183231464

但pair类型也不支持流插入,所以就需要一个一个的访问

代码语言:javascript
复制
int main()
{
	map<string, string> dict;
	dict.insert(pair<string, string>("排序", "sort"));//匿名对象
	dict.insert(pair<string, string>("左边", "left"));
	dict.insert(pair<string, string>("右边", "right"));
	dict.insert(make_pair("字符串", "string"));//make_pair是一个函数模板

	//map<string, string>::iterator it = dict.begin();
	auto it = dict.begin();//这样方便
	while (it != dict.end())
	{
		//cout << *it << endl;//pair不支持流插入,因此这样不行
		//cout << (*it).first << ":" << (*it).second << endl; //这样可以
		cout << it->first << ":" << it->second << endl;//返回的是数据的地址/指针
		++it;
	}
	cout << endl;
	for (const auto& kv : dict)//注意加引用,不加就是拷贝构造,代价大
	{
		cout << kv.first << ":" << kv.second << endl;
	}
	return 0;
}
image-20230209192002746
image-20230209192002746

3.map的[]重载

如果想通过map统计水果出现的次数,可以这样:

代码语言:javascript
复制
int main()
{
	//map统计水果操作的次数
	string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "西瓜",
		"苹果", "苹果","西瓜","苹果",  "香蕉", "苹果", "香蕉" };

	map<string, int> countMap;
	for (auto& e : arr)
	{
		auto it = countMap.find(e);
		if (it == countMap.end())//没有就插入
		{
			countMap.insert(make_pair(e, 1));
		}
		else
		{
			it->second++;
		}
	}

	for (const auto& kv : countMap)//注意加引用,不给就是拷贝构造,代价大
	{
		cout << kv.first << ":" << kv.second << endl;
	}

	return 0;
}
image-20230209194401586
image-20230209194401586

但这样看起来麻烦很多,实际上可以通过这种方式:

代码语言:javascript
复制
int main()
{
	
	//map统计水果操作的次数
	string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "西瓜",
		"苹果", "苹果","西瓜","苹果",  "香蕉", "苹果", "香蕉" };

	map<string, int> countMap;
	for (auto& e : arr)
	{
		countMap[e]++;
	}
	for (const auto& kv : countMap)//注意加引用,不加就是拷贝构造,代价大
	{
		cout << kv.first << ":" << kv.second << endl;
	}
	return 0;
}
image-20230209195234968
image-20230209195234968

方括号支持的是随机访问,而对于这个括号来说,括号里的实际上是key,countMap[e]就是value。

image-20230209202858039
image-20230209202858039

上面所标注的就是map[]重载的返回值,发现还有insert的操作,所以我们应该先知道insert的返回值:

image-20230209202446853
image-20230209202446853

发现insert返回类型为pair<iterator, bool>类型,看看文档是如何说明的:

image-20230209202558711
image-20230209202558711

因此,我们可以将最上面的map重载的返回值进行解释了,可以转化成这样了:

代码语言:javascript
复制
V& operator[](const K& k)
{
    pair<iterator, bool> ret = insert(make_pair(k, V()));
    return ret.first->second;
}

这样,我们就知道,operator返回的就是map<string, int>的第二个参数,并且是引用返回,所以map的映射关系就是这样的。

可以看出,C++map的[]有很多功能:

  1. 插入
  2. 修改
  3. 查找

因此,了解底层之后我们也可以直接这样写:

代码语言:javascript
复制
int main()
{
	map<string, string> dict;
	dict.insert(pair<string, string>("排序", "sort"));//匿名对象
	dict.insert(pair<string, string>("左边", "left"));
	dict.insert(pair<string, string>("右边", "right"));
	dict.insert(make_pair("字符串", "string"));//make_pair是一个函数模板
	dict["迭代器"] = "iterator"; // 插入+修改
	dict["insert"];//单纯的插入,默认构造的va为""
	//dict.insert(pair<string, string>("左边", "XXX"));//这样会插入失败,因为已经有了"左边"
	dict["insert"] = "插入";//修改
	cout << dict["左边"] << endl;// 查找

	//key在就是查找,不在就是插入
    return 0;
}
image-20230209205833862
image-20230209205833862
image-20230209205905366
image-20230209205905366

因此,用[]代替insert很方便,而且对于已有的key,如果想再插入相同的key,无论对应的value是否相同,都不能成功,因为pair<iterator, bool>对应的bool会返回false。如果想修改指定key的value,就用[]。

对于词典来说,由于一词多义,key和value也可能不是一一映射的关系,有可能是一个key对应多个value,这个时候,可以这样map<string, vector<string>>,除此之外,也可以利用multimap,下面将会提到。

再次说明:map中用pair保存值。

五.multimap

和multset一样,multimap与map相比也是不会进行去重,只是有序。

那继续看一下,用multimap完成上面说的”一词多义“:

代码语言:javascript
复制
#include<iostream>
#include<map>
#include<string>
using namespace std;
int main()
{
	multimap<string, string> dict;
	dict.insert(pair<string, string>("left", "左边"));
	dict.insert(pair<string, string>("left", "剩余"));
	dict.insert(pair<string, string>("string", "字符串"));
	dict.insert(pair<string, string>("left", "xxx"));
	for (const auto& kv : dict)
	{
		cout << kv.first << ":" << kv.second << endl;
	}
	return 0;
}
image-20230209214342546
image-20230209214342546

multimap是不支持[]重载的,文档里面也没有:

multimap - C++ Reference (cplusplus.com)

但multimap同样可以统计次数,因为下面的方式是先find,再加入或者值++。

代码语言:javascript
复制
#include<iostream>
#include<map>
#include<string>
using namespace std;
int main()
{
	string arr[] = { "苹果", "西瓜", "香蕉", "草莓", "西瓜",
		"苹果", "苹果","西瓜","苹果",  "香蕉", "苹果", "香蕉" };

	multimap<string, int> countMap;
	for (auto& e : arr)
	{
		auto it = countMap.find(e);
		if (it == countMap.end())//没有就插入
		{
			countMap.insert(make_pair(e, 1));
		}
		else
		{
			it->second++;
		}
	}

	for (const auto& kv : countMap)//注意加引用,不给就是拷贝构造,代价大
	{
		cout << kv.first << ":" << kv.second << endl;
	}
	return 0;
}
image-20230209215950465
image-20230209215950465

这样也可以统计次数。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-02-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • map和set
  • map和set
  • 一.关联式容器
  • 二.set
    • 2.1 set的介绍
      • 2.2 set的使用
        • 1.set的模板参数列表
        • 2.set的构造
        • 3.set的迭代器
        • 4.set修改操作
        • 5.bound函数
    • 三.multiset
    • 四.map
      • 3.1 map的介绍
        • 3.2 map的使用
          • 1.map的模板参数说明
          • 2.pair的介绍
          • 3.map的[]重载
      • 五.multimap
      相关产品与服务
      容器服务
      腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档