文章/答案/技术大牛

发布

首页视频120_尚硅谷_Scala_集合（七）_集合常用函数（五）_应用案例（一）_合并Map

120_尚硅谷_Scala_集合（七）_集合常用函数（五）_应用案例（一）_合并Map

2022-12-022022-12-02 16:02:21播放33

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之Scala（新版）/视频/120_尚硅谷_Scala_集合（七）_集合常用函数（五）_应用案例（一）_合并Map.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
我们已经了解了scla集合当中的高级计算函数，那接下来呢，我们就来举一个具体的事例，让大家对高级计算函数有更深刻的理解，那我们首先重新来考虑一下。之前我们介绍过的map里边的合并操作，之前我们在讲到map合并的时候呢，是直接调用了加加或者加加等于方法，这样就把两个map里边的内容合并在一起了，但是我们会发现这里边是有一些瑕疵的，就比如说我们MAP2加加MAP1，如果MAP1里边的元素是MAP2里边没有的话，那是直接添加进去，这个是我们能考虑到的，但是如果说MAP1和MAP2里边有相同的K的话，那这个操作其实是把MAP1里边的值覆盖掉MAP2里面的值了，最后得到的结果是以MAP1为准。所以如果说我们MAP1加加MAP2和MAP2加加MAP1，得到的结果其实是有可能不同的，我们总是用后边的这个map里边的值覆盖之前map里面的值啊，这种行为在有一些场景下是呃合理的，但是有更多的场景我们会觉得这种不合理，我们要做的是map的合并，而不是覆盖。
01:23
诶，所以接下来我们就另外给大家讲解一种真正意义上的合并两个map的操作，那这就要用到我们刚刚学习过的高级计算函数里的规约，我们首先还是新建一个测试的GALA object，现在是TEST16。我们现在要测试的是方法写出来。那首先我们还是要先定义两个map，我们直接用半生对象把当前的map定义出来，呃，我们可以给一个字符串类型的key，然后给一个int类型的值，然后给一个。
02:13
对应的可以给一个C数据的话，我们可以随便几个就可以了，有一个MAP1，另外再来一个MAP2。同样我们拥有ABC3个K，那里面的值呢？不太相同，一是六，一是二。C是哦，哎，那对应的我们还可以再多增加一个对应的值，三有了对应，呃，当前map的定义之后，接下来我们就考虑到按照之前我们想啊，直接用加加操作的话，那这个非常明显得到的结果会以MAP2里边的为准，因为MAP1里边所有的k map2里边都有，所以我们得到最后合并的结果其实就是MAP2的值啊，这个并不是我们想要的，我们本来想的像这种。
03:19
这种类型的合并的话，那应该很有可能，它就是我们要统计每一个字母或者每一个单词出现的频率，我们做大数据处理的时候，往往是一个分布式计算，那一部分数据我们算出来A里出现的个数是一，那么另外一部分呢，A出现的是六，那么当前如果我们要合并，那应该是把一和六相加才是整体来看A。所有出现的频次，哎，那所以当前我们应该是判断，如果是相同K的话，应该做一个把它们对应的value相加的操作，而不是直接覆盖。那怎么样能够实现这样的一个功能呢？那我们自然就想到了，我们可以以某一个map作为。
04:09
一个起始的基准，然后再把另外一个map里边的每一个k value做一个便利，每一个k value去判断一下当前的K在不在我们基准的那个map里，如果不在的话，直接添加，如果在的话，那就需要把当前的value都取出来，叠加之后再做一个更新操作。所以整体来看的话，那我们其实就是把作为基准的那个map，这不就可以作为状态的初始值，然后遍历另外一个map里边的k value，对，去更新这个状态吗？哎，所以这样看的话，我们其实就可以用到集合里边的一个高级计算函数，就是reduce或者fo的这样的一个规约操作了，当前我们既然是涉及到了有初始值，那自然就应该是fold了啊，那这里边还涉及到一个我们想要用其中的某一个map作为一个状态不停的改变，那如果我们直接用不可变的map的话，显然是做不到这个效果的。
05:16
比方说我们想要用MAP2作为一个基准的，就是以它为标准进行去更改，那把它作为一个状态不停的更新，那么我们就把它定义成可变的map map multipleable引入，这样的话，MAP1不需要是可变的啊，我们只要遍历MAP1里边的每一个元素，去判断K是否在MAP2中，然后更新MAP2的值就可以了，最后把MAP2返回。啊，那这是我们当前能够想到的这种操作，那具体的实现呢，从这里边第一个那么三作为我们返回的，他们合并之后返回的结果。首先我们是以MAP2作为初始值，那自然就是要遍利MAP1里面的元素了，所以是MAP1去调用一个规约方法要用for，这里大家还需要注意，就是for里边我们传的这个操作，Top里边对应的这两个，一个参数是当前的聚合状态，另外一个是我们要遍历的元素的。
06:26
当下一个新的元素，那么他们定义的这个类型呢，必须是一样的，必须是相同的。我们现在其实不相同，因为我们的状态是一个map，而当前我们做便利的元素呢，是一个k value，对，是一个元组，二元组。那怎么解决这个问题呢？我们就回忆起来之前你曾调用的Ford left，它是允许它俩不同的。所当前，哎，这也是提到了fold和fold left的一个不同，我们这里不能用fold，只能用forld left啊，那接下来我们就是要先给一个初始值F图二，然后接下来自然就是一个操作了，要解一个拉姆达表达式，这里的拉姆达表达式同样是两个参数，传入两个参数，一个是表示我们当前的聚合结果，第一个参数表示的是当前已经聚合起来的map。
07:25
那初始是MAP2，那之后呢，要更新里边对应的值，所以我们把这个叫做for map，然后另外一个参数呢，即使是本立MAP1里边的所有元素依次去做处理，那所以这里边其实就是一个K，对嘛，我们直接就把它叫做KV下来我们就可以直接取出KV里边的K和value_一是K，那么。Value自然就是KV里边的下划线。二、先把这个拿出来，接下来我们自然就是要判断当前的K是否在mer map当中，呃，这个判断的话，我们也可以直接把它合并在一起，就直接用mer map去call else当前的K值。
08:18
那大家会想到，如果我获取到的话，那就直接用当前的值去加上value对应的这个值就可以了吗？啊，因为当前这是我们MAP1里边对应的那个已经统计出来的个数，而。MAP2里边的个数呢，那自然就是从默map里边取出来的，那如果要有的话直接叠加起来，没有的话，那MAP1里边，呃，MAP2里边，我们这个状态里边的值以零做计算，叠加不就可以了吗？啊，那得到的值呢，最后再付给medu map对应的对应的那个value，所以我们再做一个对应的赋值操作，当然我们也可以调破的方法啊，我们这里用了那个简简写的形式，那最后我们要返回的，大家看这里边当前返回的还是unit类型的，我们得返回一个map嘛，所以就直接把当前的merged map返回就可以了。
09:20
哎，这个就是我们定义的这个过程。以整体来看的话，还是非常的清晰的，把这个处理的流程就是每一个MAP1里边的k value对都合并到当前的MAP2里边来，那这个合并的过程呢，是要判断它是否在里边，把它的value值要做一个叠加，而不是简单的覆盖。啊，那当然对于当前MAP3的类型，我们也可以看一下，其实是一个multipleable的map，因为最终返回的值不就是MAP2做更新之后的那个mer map吗？哎，所以当前自然就是一个multipleable.map然后我们可以把当前MAP3的值做一个打印。
10:08
我们可以看到最后得到的结果，首先D是只出现在MAP2里的，当然就这个值只是三，那另外其他的三个值呢，三个K2个map里边都出现了，A一个是一，一个是六，合并起来是七，B一个是三，一个是二，合并起来是五，那C的话一个是六，一个是九，合并起来是15，这就起到了我们真正能够合并两个map里边数值的这样一个目的。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之Scala（新版）

（120/143）

9分26秒

001_尚硅谷_Scala_课程简介

480

9分25秒

002_尚硅谷_Scala_Scala概述（一）_Scala发展历史

390

6分57秒

003_尚硅谷_Scala_Scala概述（二）_Scala和Java的关系

400

5分40秒

004_尚硅谷_Scala_Scala概述（三）_Scala特点总结

330

9分44秒

005_尚硅谷_Scala_Scala环境搭建（一）_Scala安装和交互式命令行测试

360

10分20秒

006_尚硅谷_Scala_Scala环境搭建（二）_Scala源文件编写和运行

420

15分46秒

007_尚硅谷_Scala_Scala环境搭建（三）_Scala编译结果的反编译深入分析

410

6分49秒

008_尚硅谷_Scala_在IDE中编写HelloWorld（一）_项目创建和环境配置

340

4分33秒

009_尚硅谷_Scala_在IDE中编写HelloWorld（二）_编写代码

390

5分23秒

010_尚硅谷_Scala_在IDE中编写HelloWorld（三）_代码中语法的简单说明

330

22分58秒

011_尚硅谷_Scala_在IDE中编写HelloWorld（四）_伴生对象的扩展说明

320

2分41秒

012_尚硅谷_Scala_在IDE中编写HelloWorld（五）_关联源码和查看官方指南

410

6分56秒

013_尚硅谷_Scala_变量和数据类型（一）_注释和基本编程习惯

320

16分47秒

014_尚硅谷_Scala_变量和数据类型（二）_变量和常量

410

10分5秒

015_尚硅谷_Scala_变量和数据类型（三）_标识符

310

21分4秒

016_尚硅谷_Scala_变量和数据类型（四）_字符串

390

3分51秒

017_尚硅谷_Scala_变量和数据类型（五）_控制台标准输入

350

7分3秒

018_尚硅谷_Scala_变量和数据类型（六）_读写文件

320

13分44秒

019_尚硅谷_Scala_变量和数据类型（七）_数据类型系统

370

18分43秒

020_尚硅谷_Scala_变量和数据类型（八）_整型和浮点类型

360

10分19秒

021_尚硅谷_Scala_变量和数据类型（九）_字符和布尔类型

410

14分33秒

022_尚硅谷_Scala_变量和数据类型（十）_空类型

310

4分52秒

023_尚硅谷_Scala_变量和数据类型（十一）_Unit类型的源码实现

330

7分20秒

024_尚硅谷_Scala_变量和数据类型（十二）_类型转换（一）_Java类型转换复习

420

13分7秒

025_尚硅谷_Scala_变量和数据类型（十二）_类型转换（三）_Scala自动类型转换

310

12分2秒

026_尚硅谷_Scala_变量和数据类型（十二）_类型转换（四）_Scala强制类型转换

410

9分22秒

027_尚硅谷_Scala_变量和数据类型（十二）_类型转换（五）_强转溢出面试题

240

9分4秒

028_尚硅谷_Scala_运算符（一）_算术运算符

370

9分25秒

029_尚硅谷_Scala_运算符（二）_比较运算符

310

14分36秒

030_尚硅谷_Scala_运算符（三）_逻辑运算符

400

15分13秒

031_尚硅谷_Scala_运算符（四）_赋值运算符

330

18分3秒

032_尚硅谷_Scala_运算符（五）_位运算符

340

9分3秒

033_尚硅谷_Scala_运算符（六）_运算符的本质

380

12分6秒

034_尚硅谷_Scala_流程控制（一）_条件分支（一）_If-Else常规用法

350

13分48秒

035_尚硅谷_Scala_流程控制（一）_条件分支（二）_If-Else的返回值

390

4分45秒

036_尚硅谷_Scala_流程控制（一）_条件分支（三）_嵌套分支

330

12分27秒

037_尚硅谷_Scala_流程控制（二）_For循环（一）_范围遍历

340

7分38秒

038_尚硅谷_Scala_流程控制（二）_For循环（二）_不包含边界的范围遍历

410

3分17秒

039_尚硅谷_Scala_流程控制（二）_For循环（三）_集合遍历

390

4分41秒

040_尚硅谷_Scala_流程控制（二）_For循环（四）_循环守卫

420

14分9秒

041_尚硅谷_Scala_流程控制（二）_For循环（五）_循环步长

390

10分34秒

042_尚硅谷_Scala_流程控制（二）_For循环（六）_循环嵌套

360

4分57秒

043_尚硅谷_Scala_流程控制（二）_For循环（七）_循环引入变量

420

11分3秒

044_尚硅谷_Scala_流程控制（二）_For循环（八）_练习_输出九层妖塔

450

10分20秒

045_尚硅谷_Scala_流程控制（二）_For循环（九）_for循环返回值

380

6分6秒

046_尚硅谷_Scala_流程控制（三）_While循环

330

12分4秒

047_尚硅谷_Scala_流程控制（四）_循环中断

380

15分11秒

048_尚硅谷_Scala_函数式编程（一）_函数式编程思想

370

13分12秒

049_尚硅谷_Scala_函数式编程（二）_函数基础（一）_函数和方法

330

10分3秒

050_尚硅谷_Scala_函数式编程（二）_函数基础（二）_函数定义

400

12分38秒

051_尚硅谷_Scala_函数式编程（二）_函数基础（三）_函数参数特殊用法

260

18分56秒

052_尚硅谷_Scala_函数式编程（二）_函数基础（四）_函数至简原则

370

16分9秒

053_尚硅谷_Scala_函数式编程（三）_函数高级（一）_匿名函数（一）_概念及简化规则

330

11分21秒

054_尚硅谷_Scala_函数式编程（三）_函数高级（一）_匿名函数（二）_示例

370

11分41秒

055_尚硅谷_Scala_函数式编程（三）_函数高级（二）_高阶函数（一）_函数作为值传递

310

4分34秒

056_尚硅谷_Scala_函数式编程（三）_函数高级（二）_高阶函数（二）_函数作为参数传递

360

5分55秒

057_尚硅谷_Scala_函数式编程（三）_函数高级（二）_高阶函数（三）_函数作为返回值

360

12分58秒

058_尚硅谷_Scala_函数式编程（三）_函数高级（二）_高阶函数（四）_应用案例

390

4分48秒

059_尚硅谷_Scala_函数式编程（三）_函数高级（三）_扩展练习（一）_匿名函数

420

13分50秒

060_尚硅谷_Scala_函数式编程（三）_函数高级（三）_扩展练习（二）_函数作为返回值

340

10分52秒

061_尚硅谷_Scala_函数式编程（三）_函数高级（四）_闭包（一）_概念和原理

400

17分54秒

062_尚硅谷_Scala_函数式编程（三）_函数高级（四）_闭包（二）_具体应用

380

6分16秒

063_尚硅谷_Scala_函数式编程（三）_函数高级（四）_柯里化

390

10分19秒

064_尚硅谷_Scala_函数式编程（三）_函数高级（五）_递归（一）_概念和实现

340

17分49秒

065_尚硅谷_Scala_函数式编程（三）_函数高级（五）_递归（二）_尾递归优化

310

4分34秒

066_尚硅谷_Scala_函数式编程（三）_函数高级（六）_控制抽象（一）_传值参数

350

8分51秒

067_尚硅谷_Scala_函数式编程（三）_函数高级（六）_控制抽象（二）_传名参数

480

16分34秒

068_尚硅谷_Scala_函数式编程（三）_函数高级（六）_控制抽象（三）_自定义While循环

310

6分33秒

069_尚硅谷_Scala_函数式编程（三）_函数高级（七）_惰性加载

400

14分52秒

070_尚硅谷_Scala_面向对象（一）_包（一）_声明和访问

390

8分47秒

071_尚硅谷_Scala_面向对象（一）_包（二）_包对象

310

7分6秒

072_尚硅谷_Scala_面向对象（一）_包（三）_导包说明

350

12分7秒

073_尚硅谷_Scala_面向对象（二）_类和对象

340

16分2秒

074_尚硅谷_Scala_面向对象（三）_封装（一）_访问权限

340

17分32秒

075_尚硅谷_Scala_面向对象（三）_封装（二）_构造器

320

18分46秒

076_尚硅谷_Scala_面向对象（三）_封装（三）_构造器参数

350

15分31秒

077_尚硅谷_Scala_面向对象（四）_继承

370

15分10秒

078_尚硅谷_Scala_面向对象（五）_多态

340

13分33秒

079_尚硅谷_Scala_面向对象（六）_抽象类（一）_抽象属性和方法

340

3分37秒

080_尚硅谷_Scala_面向对象（六）_抽象类（二）_匿名子类

360

15分18秒

081_尚硅谷_Scala_面向对象（七）_伴生对象（一）_概念和应用

290

8分18秒

082_尚硅谷_Scala_面向对象（七）_伴生对象（二）_单例设计模式

440

18分55秒

083_尚硅谷_Scala_面向对象（八）_特质（一）_基本概念和用法

300

11分22秒

084_尚硅谷_Scala_面向对象（八）_特质（二）_特质的混入

330

6分24秒

085_尚硅谷_Scala_面向对象（八）_特质（三）_特质的叠加

350

13分51秒

086_尚硅谷_Scala_面向对象（八）_特质（四）_钻石问题的特质叠加

390

3分41秒

087_尚硅谷_Scala_面向对象（八）_特质（五）_特质和抽象类的区别

380

8分32秒

088_尚硅谷_Scala_面向对象（八）_特质（六）_自身类型

260

11分58秒

089_尚硅谷_Scala_面向对象（九）_扩展内容（一）_类型检测和转换

340

6分17秒

090_尚硅谷_Scala_面向对象（九）_扩展内容（二）_枚举类和应用类

310

22分36秒

091_尚硅谷_Scala_集合（一）_集合类型系统

300

9分37秒

092_尚硅谷_Scala_集合（二）_数组（一）_不可变数组（一）_创建数组

380

8分7秒

093_尚硅谷_Scala_集合（二）_数组（一）_不可变数组（二）_访问和修改元素

420

12分26秒

094_尚硅谷_Scala_集合（二）_数组（一）_不可变数组（三）_遍历数组

330

10分19秒

095_尚硅谷_Scala_集合（二）_数组（一）_不可变数组（四）_添加元素

330

7分45秒

096_尚硅谷_Scala_集合（二）_数组（二）_可变数组（一）_创建数组

390

1分49秒

097_尚硅谷_Scala_集合（二）_数组（二）_可变数组（二）_访问数组元素

420

14分31秒

098_尚硅谷_Scala_集合（二）_数组（二）_可变数组（三）_添加元素

340

3分8秒

099_尚硅谷_Scala_集合（二）_数组（二）_可变数组（四）_删除元素

320

100

5分14秒

100_尚硅谷_Scala_集合（二）_数组（三）_可变数组与不可变数组的转化

450

101

11分43秒

101_尚硅谷_Scala_集合（二）_数组（四）_多维数组

250

102

7分32秒

102_尚硅谷_Scala_集合（三）_列表（一）_不可变列表（一）_创建列表

320

103

2分46秒

103_尚硅谷_Scala_集合（三）_列表（一）_不可变列表（二）_访问和遍历元素

350

104

9分12秒

104_尚硅谷_Scala_集合（三）_列表（一）_不可变列表（三）_添加元素

380

105

4分52秒

105_尚硅谷_Scala_集合（三）_列表（一）_不可变列表（四）_合并列表

440

106

12分33秒

106_尚硅谷_Scala_集合（三）_列表（二）_可变列表

360

107

9分23秒

107_尚硅谷_Scala_集合（四）_Set集合（一）_不可变Set

390

108

12分32秒

108_尚硅谷_Scala_集合（四）_Set集合（二）_可变Set

350

109

17分6秒

109_尚硅谷_Scala_集合（五）_Map集合（一）_不可变Map

320

110

17分14秒

110_尚硅谷_Scala_集合（五）_Map集合（二）_可变Map

410

111

13分20秒

111_尚硅谷_Scala_集合（六）_元组

390

112

7分22秒

112_尚硅谷_Scala_集合（七）_集合常用函数（一）_通用属性和操作

420

113

10分42秒

113_尚硅谷_Scala_集合（七）_集合常用函数（二）_衍生集合（一）_单一集合操作

360

114

15分30秒

114_尚硅谷_Scala_集合（七）_集合常用函数（二）_衍生集合（二）_两个集合操作

380

115

20分22秒

115_尚硅谷_Scala_集合（七）_集合常用函数（三）_简单计算函数

370

116

5分50秒

116_尚硅谷_Scala_集合（七）_集合常用函数（四）_高级计算函数（一）_简介

370

117

23分45秒

117_尚硅谷_Scala_集合（七）_集合常用函数（四）_高级计算函数（二）_集合转换操作（Map类）

460

118

11分25秒

118_尚硅谷_Scala_集合（七）_集合常用函数（四）_高级计算函数（三）_集合转换操作（Reduce）

280

119

10分43秒

119_尚硅谷_Scala_集合（七）_集合常用函数（四）_高级计算函数（四）_集合转换操作（Fold）

440

120

10分38秒

120_尚硅谷_Scala_集合（七）_集合常用函数（五）_应用案例（一）_合并Map

330

121

12分21秒

121_尚硅谷_Scala_集合（七）_集合常用函数（五）_应用案例（二）_普通WordCount

320

122

22分35秒

122_尚硅谷_Scala_集合（七）_集合常用函数（五）_应用案例（三）_复杂WordCount

330

123

7分47秒

123_尚硅谷_Scala_集合（八）_队列Queue

390

124

4分40秒

124_尚硅谷_Scala_集合（九）_并行集合

370

125

10分47秒

125_尚硅谷_Scala_模式匹配（一）_基本概念和用法

330

126

4分21秒

126_尚硅谷_Scala_模式匹配（二）_模式守卫

400

127

6分3秒

127_尚硅谷_Scala_模式匹配（三）_模式匹配的不同用法（一）_匹配常量

410

128

7分12秒

128_尚硅谷_Scala_模式匹配（三）_模式匹配的不同用法（二）_匹配类型

350

129

7分59秒

129_尚硅谷_Scala_模式匹配（三）_模式匹配的不同用法（三）_匹配数组

360

130

8分55秒

130_尚硅谷_Scala_模式匹配（三）_模式匹配的不同用法（四）_匹配列表

360

131

6分20秒

131_尚硅谷_Scala_模式匹配（三）_模式匹配的不同用法（五）_匹配元组（一）_基本用法

360

132

5分49秒

132_尚硅谷_Scala_模式匹配（三）_模式匹配的不同用法（五）_匹配元组（二）_变量声明

320

133

7分30秒

133_尚硅谷_Scala_模式匹配（三）_模式匹配的不同用法（五）_匹配元组（三）_for推导式中变量

410

134

10分15秒

134_尚硅谷_Scala_模式匹配（三）_模式匹配的不同用法（六）_匹配对象

400

135

4分4秒

135_尚硅谷_Scala_模式匹配（三）_模式匹配的不同用法（七）_样例类

360

136

15分49秒

136_尚硅谷_Scala_模式匹配（四）_偏函数

310

137

8分13秒

137_尚硅谷_Scala_异常处理

310

138

6分53秒

138_尚硅谷_Scala_隐式转换（一）_基本概念和类型

380

139

7分57秒

139_尚硅谷_Scala_隐式转换（二）_隐式函数和隐式类

340

140

9分38秒

140_尚硅谷_Scala_隐式转换（三）_隐式参数

350

141

5分56秒

141_尚硅谷_Scala_泛型（一）_概念和意义

280

142

6分39秒

142_尚硅谷_Scala_泛型（二）_逆变和协变

260

143

6分14秒

143_尚硅谷_Scala_泛型（三）_上下限

410

120_尚硅谷_Scala_集合（七）_集合常用函数（五）_应用案例（一）_合并Map

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐