00:02
嗯,那个各位同学。各位同学晚上好,今天给大家做一个分享啊,分享的名称叫做AI产品课,然后学习一个深度学习算法。嗯,我给他也取了个其他的名字,叫做啊给文科生讲明白深度学习算法,这其实对我是有一定的,呃,首先我自己是文科生啊,然后对我有一定的难度跟挑战的,然后其实把知识呃传递出去,其实啊是对自己的挑战,然后这次里面也引用了一些其他啊地方,我看到的学到知识,所以今天嗯,综合起来给大家做一个分享吧。然后首先是一个简单自我介绍,我是一个呃,一个作家,然后写过一本书,呃,过往十年其实都是在游戏行业里面工作,然后最近三年是在那个呃AI领域工作,但是中间有重合了,又我没有工作13年,然后我是沉迷运营双休,现在是在那个腾讯的用户平台服务,做一个叫游戏知己的产品。
01:08
啊,然后过往也在这个平台给大家分分享过很多次的,OK,就到这里,呃开始讲,呃,人工智能其实是一个综合性的学科,其实它是包含计算机科学,统计学,脑神经学,社会科学,然后能够做的事情,决策,分析,认知跟识别等等,它可以代替人类做很多的功能,那人工智能是啥呢?其实就是一个。让机器人拥有人的能力的一个111个一个一个一个一个东西,然后首先呃,你你想了解人工智能,先看这个右边这张图啊,我们一定要知道几个概念,第一个是人工智能是一个非常大的概念,然后中间这一层叫机器学习,那机器学习在里面那层叫深度学习,所以咱们要学习深度学习算法,得知道这个呃概念是什么样子,然后第二第二块,呃,我们就要讲理解深度学习的这个算法底层逻辑,这个非常非常重要,如果你是嗯好奇的,就是对这个有有有有有。
02:06
有想学习这个东西,掌握一下,如果你是从业者,嗯,这个东西掌握之后,你更能够跟一些,呃,算法工程师进行一些交流,你知道边界在哪些地方,所以掌握一下底层逻辑也是蛮重要的。然后第三个模块就讲深度学习给我,给我自己带来的一些启发吧。OK,进入第一个模块,人积极学习和深度学习,第一个第一次,其实啊,我们看这个其实是另外一种一种样式的这个呃,包含关系,嗯,他其实最底下是个时间轴,从是1119556年,应该是五六年吧,就是从那个达特茅斯会议上就有一个人提出来了,然后在相当一段时间内被认为是瞎扯,因为这里有个故事,就是如果你在1950年到1980年说自己是做人工智能,别人就觉得你就特别假,你最好从简历里面删掉这块,但是如果你是2010年之后,别人就会觉得,哇,你好高大上怎么的,因为为什么?因为那段时间因为算你算力的问题,或者数据的问题,或者算法问题就没有得到很好的发展,所以相当一段时间就是被人评非常低估,然后第二次发展,其实是由于计算机的硬件发展是在八零年,八零年代,这个时候其实计算能力得到了突飞猛进,这个时候就有一个新的呃呃就算法出现,呃呃就是叫机器学习问世吧。这个一。
03:26
张误生之后人们可以用它去做有些分类,然后做一些下围棋,甚至一些简单的计计算的工作,然后到了2010年这个时候,算法算力跟那个数据得到得到这个充分的这个释放,因为其实各个公司都有这些东西,然后然后他就能够去做一些非常呃以前做不到的事情,但是一定能满足条件才是可以完成的。然后人人工智能核心技术,你看这个环就是无论视觉还是自源员处理,还是那个硬件机器人还是我,我就我就不念了,这些东西其实都是同样的功能,但是同呃不同的功能,不同的功能,它底下的核心技术其实都是要么来源于机器学习,要么。
04:07
来源于这个深度学习,或者是一些什么其他的学习方式吧,所以我们要今天掌握一些这个核心地技术的底层原理。然后呢,这这个其实机器学习最早的时候就是这这画了张图吧,反正大家一样掌握的第一个概念是什么?就是你知道什么叫有监督,无监督跟强化这三个不同的概念,嗯,好,接下来用文科方式去解释一下,我有监督其实叫什么?就叫做那个有有有数据有标注的东西,无监督其实就是啊,没有对应数据的标注,然后呃,强化协议是一种基于反馈的去去展现,那这里其实大家只要掌掌握这个有有无监督就好了,然后还有一个呃概念可能半监督,所谓半监督就是一部分是有数据,部分没数据,这是基于这三个词演化出来,然后集成学习,等于是把不同的就是并联算串联进做起来,然后就把两个不同的方法做到一起,然后最后输出一个结果,这个集成,然后深度学习,呃,后面会说那大家了解机器学习就至少这些算法啊,我我不说别的吧,你先刷个阴阳分,就网上有资料,然后也一些书籍,他就找什么是线性回归,什么东西会归什么。
05:17
的数是不向量级贝叶斯这些东西其实你就掌握一下,就是我们今天重点掌讲八,为什么八了,在第二个模块讲八,因为八非常非常强大,前面六个其实你随便查查资料,其实你可以用一些方式去去理解吧,OK,嗯,我们先。理解一下就是有无监督的概念,就是呃,我们其实看图吧,所以无监督什么意思,就是你给数据,从数据中发现信息,也就是说你你看这个,呃,上面这样蔬果,呃瓜果蔬菜对不对,他没有告诉这个就无监督是没有这个告诉计算机这些东西是什么,它计算机呢,就能自动把它进行一个分类。就是呃,就是相似的信息,那它的应用层呢,其实就是能够把一些东西聚到一起,然后然后去进行一个呃,比较适合于做这个推荐,就是相似的东西,你你看了也有喜欢B,看了B又喜欢C,那剧烈的方式,比如说他从一个文章里面看到关键词。
06:14
出现的比较多,那么这个词应该是属于体育类新闻,还是属于娱乐新闻,那看了也有去看B,看了B又去看看C,这个就无间督负责去给他把乱七八糟的东西进行分类,这样的话就能够做,然后第二个叫有监督,有监督其实就是历史数据有维度标签,比如说他会告诉你橡胶橡蕉,苹果是苹果,梨是梨,这个时候就能进行一个预测判断,比如说你给他一堆东西,告诉他是香蕉还是苹果,还是梨,它一般是用来。预测单个结果,或者是预测一系列的这个曲线变化走向,然后第三个概念其实就是强化学习,其强化学习你把它理解为就是养猫养狗的概念,就是大意是你他这个东西做对了给他奖励,做做的不对就给惩罚,那经过一段时间计算机也是能够通过这个,呃,正反馈跟负反馈去。
07:06
获得一个很好的策略,所以这三个比较大的概念,后面其他概念其实就是演化,就是大家了解一下也好了,就是所有的概念也是基于其他的叉叉学习也基于这些东西,嗯,演变出来的。然后两人之间比较,那先说嗯,第一个数据要求,左边是机器,右边是深度学习数据要求,机器学习数据要求相对比较低,右边的其实就非常非常的这个多,然后算力要求你会发现。嗯,2010年之后,2010年之后,这个深度学习再走上,主要是因为此前的这个计算能力不够,所以机器学习算力相对要求是R。那个深度学习算力要求高,我们后面会讲,然后训练时间前面的少,后面的多,你会发现你会你会发现机器学习要求都这么好,呃,第一,然后呃,深度学习要求这么高,呃,为什么大家用深度学习呢?背后有它的原因,一定有机器学习解决不了的事,然后这里主要两个特别的,就掌握一下这个区别是什么,那呃,我这里重点讲一下他们之间的这个处理方式的不一样,以及可解释的方式不一样。
08:16
先说这个处理方式吧,就是你你理解为深度学习,就是先分步骤逐级逐逐个解决组合角色,那深度去学习是一次性的去给你一个结果,比如说这张图,你知道这个呃,是机器学习处理方式,它先用一种算法,我我就不说算法什么名字啊,就是他先去识别这个物体的轮廓,它得判断这个东西是这个物体,然后第二个方式就是再把这个东西识别出来,它它它的处理方式是呃。这个图里面有多少个物体,然后每个物体是什么,这是一个非常就是递进式的关系,然后通过组合角色告诉我这里面是什么,而深度学习就能直接给到这个结果,就过程黑箱,那为什么黑箱呢?后面会讲,但是这个是一个处理方式的差异性。
09:04
第二个其实就是叫可解释向,所谓可解释性强是什么意思呢?其实嗯,我们看到左右两组先向左边,左边这个东西其实就是呃一次预预测这个天气预报的就是他可能有没有这个飓风,所以呃呃继续学习的处理方式,就是说他先看一下这个历史过程中有哪些历史这个风暴技术,比如说这个温度超过40度,温度在80~100之间就容易。发发现这个风暴,然后等等等,当然这刚才那个,呃,可能处理的这个纬度就可能更多,比如湿度,温度,风力,世界经纬度,社会环境等等,其实大致意思,如果历史上表现都这样,那么这次条件非常接近大块率90吧,这其实就能通过这些条件,由于历史数据的存在,它可以。进行组合叠加,然后基于这个东西进行嗯这个判断,然后右边这张图其实呃,其实就是我们非常常用的推荐,嗯,其实好地方用,就比如说大家如果有逛豆瓣或者逛亚马逊,或者逛电商平台,他往往就是说喜欢看A的又喜欢看B,喜欢看B的喜欢看C是什么,什么意思呢?其实有个概念就是叫做叫二重生,然后官方说法叫协同过滤算法,二重生什么意思,其实就是在茫海,茫茫人海中找到一个更。
10:27
相似的那个人对吧,就是就是你,你自己有过浏览这些东西的记录,无论是浏览收藏,购物车,就是这些这些这些记录,那你自己的可能是一个呃,怎样的职业,怎样的消费习惯,然后怎样的呃东西这些标签,其实呃怎么的数据公司就有,所以按理说自己是数据公司,那他你就知道这些购物喜欢你喜欢红色,蓝色,绿色,你有更多喜欢,或者你喜欢对应的图案,那你会发现。你会发现你自己是这个样子,然后其实跟你这样的人也有非常非常多。那么。
11:01
那么你自己这这个人群在在他的消费行为中,或者选择行为中表现这个倾向性,他就能够通过这个相似的倾向性去向你去推荐对应的这个这个结果,这其实就是文文,我文科生理解就是找到茫茫人海中的二二重生,这就是一个可及而行,但是那个深度学习就其实他能做,但是可能。嗯,它也能得到怎样效果,但是效果就怎么说呢,成本太高,所以这是机器学习非常应用的比较多的那个,然后呃,有个概念叫做特征工程,这个概念一定要。掌握,其实继续学习呃这种啊处理方式吧,呃特征工程基本上占做占据工作量60%,甚至70%,也就是特征,你选择好,那么最终就能判断的更加精准,对,那呃特征工程包含三个,就是先是预处理,然后再提取,再是选择啊。
12:01
呃,然后特征表达取决于这个准确性,如果准确性表达的越越越多,然后这个。这个就越越加的精准,然后呃,他能够嗯。其实特征工程特别复杂,其实很多人就会看,工程师就会比较。去标注,去去编写什么是什么什么,如果这些东西条件,那么它大概率是什么,这个其实就要写,要写嗯。我用一张图去做比对吧,这张图其实比如说你看见左边这张图,嗯,输入,这个输入是小汽车,你上下输入的小汽车,所以机器学习machine learning之前已经让人在前面去编辑,其实就是一些专家他去定义这个东西,比如说有四个轮子的啊,可能是汽车,但是不一定四个轮子有可能是马车或者什么其他的车,然后那个汽车应该应该是铁的,那这个这就是。射程,然后它前面有个挡风玻璃,两边都有挡风玻璃,然后汽车有这个,呃,比较那个长宽高是有对应的定义,这定义其实就是。
13:07
汽车的特征,然后他有了这个之后,有了这些定义之后,然后最后判断这个东西是车还是不是车。然后而是如果是深度学习的话,他会去通过一种方式去抽象出特征,就是没有人的定义,所以你会发现这个这个深度学习就是两种东西都能达到结果,但是处理方式不一样啊。然后这是一个例子啊,再讲个更简单的例子,比如说你判断猫跟狗,那呃,深度学习,这你看这个东西提前说啊,这个就属于神经网络,神经网络部分里面有输入,有输出,它基于这个,呃,不同的隐藏层,一个又一个做角色去判断狗狗猫和狗,而下面这个,如果机器学习它会怎么出现,他说猫有两个耳朵,然后猫猫有多大,猫的颜色是什么样,然后狗狗子的鼻子什么样,狗子眼睛。是什么样,猫的眼睛是什么样,然后猫的尾巴什么样,然后他们这些特征要去做定义,然后再接着去做判断,其实这个挺难。
14:04
他他的怎么说呢,他也能判断,但是这个效果没有这个深度学习足够好。它基本上是用一种分类方式去判断,就两种结果都能达到结果,呃但是这个呃效果是不一样的,好这个其实就是呃用特征工程的方式做还是那个做,就是你你理解这个处理过程就可以了。好,下一个模块叫做理解深度学习的,呃,算法底层逻辑,我们先看这张图,这个其实最左边一个是一个非常这网上的图啊,是一个伪量,然后第二张图就是李玉刚画画画照片,然后男男性跟女性,然后第三张图跟第四张图,其实叫什么都是。呃,两个明星啊,我也不知道叫什么,然后其实你你自己如果有判断,你能判断出这个,呃。人是男的是女的,但是你说现在就男的像女的,女的也像男的。你其实比较能够告。用一个很好的呃东西去做,那其实特征其实就比较难描述,你没法去判断到底眉毛粗还是眉毛细啊,这些东西就挺难搞,但是你自己看了就知道那是说明什么,这是说明自己大脑有一种处理的这个方式,这个方式叫做那个。
15:17
呃,神神神经网络,其实神经网络其实就是一种模拟大脑的方式,嗯,这个这个世界上也其实非常多,就是人工或者专家没法定义的特特征工程,你可以跟计算机说三角形是什么,或者四边形什么,圆是什么,对不对,因为它是一个非常明显的规则,三角形就是三个边对吧,连到一起,圆是一个相相同的,中间那个转折那个你可以告诉他这些基本的,但是你没法说人是怎么样,因为男人眉毛粗,女人眉毛一定细嘛,对不对,然后男人嘴巴大,女人嘴巴音小嘛,然后男人颧骨,女人的颧骨,或者男人的一些特征比较粗犷一样也粗,粗犷女人的,但是你能够判断哪些男人,哪些女人或者概念像。你其实如果用特征功能去做的话,你就这个定义起来叫毛死,那你再看这两只,两只动物,同样你很难去定义他们,我觉得就可能鼻子像或者或者那个他们身上都有毛,都有耳朵对不对,然后有的耳朵长,有的耳朵短,然后你其实就光光把狗,就同样是狗,你去做个分类,你去写特征,那狗的特征实在太多,因为样式特别的多,你其实就难判断,所以世界上非常非常多。
16:25
然后嗯,那神神经网络其实就是模拟大脑,其实大脑什么?大脑是由几百亿的这个神经元组成,它的识别网络方式可以通过训练提高,就有点像我们教小孩,然后第二个它是个模式识别去,它是非常善于从一群中找到熟悉那个人,或者是能从一堆东西中找到那个有判断的,然后大脑不管是练习还是使用就是。都不是按照。逻辑跟规则执行,你如果完全按照逻辑跟规则,那是绝对理信任,但是人是不理信,人是感性的人,人是什么?说白了是个感觉动物对吧,就是说没感觉,谈恋爱时候没感觉,或者这个图反正不好,但是我我我我就知道他不好。
17:05
为什么不考虑讲不清楚,所以一个信息在人大脑面前,它是一个传递感受的过程。好吧,然后所以这些东西其实是呃呃呃,可能大脑不是这么运作的,但是神经网络是通过这种方式去模拟大脑的。然后深度学习,这学习先做个定义,是一种实现机器学习的,呃。技术,然后最简单的神经网络,其实就三层嘛,就是第一层叫输出,中间隐藏,第三层叫输出,输出这是一个非常简单的,那么用一张图来说,你看这猫狗。如果用神经网络的方式去处理,就是你先给他张图片,他通过这个东西进行一些一系列判断角色最后在那个output里面进行投票,到底是猫还是狗,然后最终得出一个对应的结果。所以。它的整个处理过程就输入输入数据出来,通过隐藏层的各个神经元进行一番处理,然后再把信号传到下一层,然后下一层再做判断,最后做出判断,然后这是一个非常简单,那什么叫复杂呢?复杂就是隐藏层的这个。
18:11
多少,反正都叫神经网络啊,就是右边的深度学习网站可以有更多的层,你有点像一个投票规则,投票规则呢,就是说基层人。判断就是,呃,到底是猫是狗对吧,然后然后再他把判断结果告诉下一个人,那下一下一个人,下一排的人又去听从第一个人的每层意见,然后再接着他们再商量一下,然后再进行判断,就逐层进行。那个判断,然后得到,那为什么那层呢?是因为每一层的判断,判断标准不一样,你就简单这么理解就好了啊。然后怎么理解神经元就是计算机的最底层单元,是经经管神经网络最底层的单元,神经我前面讲的这个中间的这个每个点无论输入输出。呃和隐藏中间其实都是由一个又一个的神经元去组成,其实人脑也是这么做,做处理角色,不过人脑负杂的多,然后这边是一个,怎么说是一个,是一个算法,我们我这里就不去细讲了,就是神经你你大家看这个蓝色字就可以了,神经元的内部参数包含这个权重,然后每个权重就还有一个偏移值,那么神经元做的计算就是把三个输入的数字乘以各自权重相加,再加上这个偏移值,所以它是个数学题,你知道吗?比如说左边下个下面的这个这个这个图片就是呃,判断这个。
19:34
呃,基于交通信号灯判断要不要前进的,它是由三部分组成对吧,那如果是红灯,它给一个数字,黄灯给一个数字,绿色那个数字,那把三个数字加起来就是一个100,然后权重。对应去标,然后最终结果是负1.5,所以判断的输出结果是判断那。这里有写个规则,这就if else的问题了,就是如果大于零就是前进,小,小于零就是停止,那在这个if else之前一定有一个判断,所以,所以就是前面的判断的过程,就是一个一个结果,这个计算过程就这样,我我我就不去过多解释,反正你理解神经元。
20:13
把这些蓝色的东西记住行了,权重拼移值,然后判断再去输出结果,把这个概念了解一下就好了,然后底层原因什么,其实就是呃,我做了下抽象体验,就是输出的呃神经元就是把输入的信息数字化,就是不管怎样的图片也好,文本也好,还是音乐因果也好,还是什么其他的别的信息,已经把它现在给他数字化信,然后把这些数数字化信息。乘以权重相加,再相乘,这样的话就能得出一个平移值,最终得到一个结果,然后如果输入值大于某个阈值,这个神经元就被激发了,一旦被激发的话,这个东西就能做到对应判断,然后神经元的内部参数圈移值,权重跟圈移值都可以调整的,那么用数据去训练神经网络过程就是调整整个参数的过程,那么神经网络在结构中训练不变,就是呃,神经元参数决定的神经网络功能,听着挺拗口啊,就是非常非常的,呃,那个我这个这个怎么说,我用一个实战的例子帮大家去讲吧,就是毕竟跟文科生解释嘛,比如说比如说你看这上面。
21:21
人类是能够判断这数字什么就504192,那么深度学习怎么去处理呢,对不对,他其实要做的是先。这么去处理一下对吧,他先把对应的数字按照分成对应这个格子,至少数字都是相连,接着吧,他先把它分成一个一个格子,然后呢,接着下一步是把。一比如说一一就把这个这个图像对不对?先切成一个28乘以28的一个像素,那28乘28像素,这你会发现中间的完全的这个黑色就代表着一,然后外面的这个完全的这个白色就代表着零,然后。
22:00
中间那些,呃,那些边缘的灰色的部分就代表着就是附近,根据这个深颜色深浅的不同,所以每一个像素值就是那个零到一个小数,这就呼应了前面的这个说法,就是把输入的东西给了数字化,那么。判断数字的第一步是先把这个呃,图片数字就是它至少这个图形嘛,对不对?理解说它到底是哪个数字,先把它给数字化,然后呢,通过输入784个数字,784怎么来,就是28乘以28得到一个数字判断集,比如数字八跟数字零,那数字八你会发现它的规率什么?数字八的规律是。中间有两个空的,其他东西都是连接,然后你是中间只有一个空的,然后整个东西连接那一什么一是一个连接的,然后剩下的杠周围都是空,那么你你就可以通过不断的告诉计算机这个呃一的写法有多少种,不管他写的怎么往外流流,但是一,但是一不会写出一个很横的一,这样在阿拉伯数字里面,它是一个数的一,然后零也是,你不管是这样逻辑,它就能不断的去呃理解到这个东西,这个用机,这个用那个机器学习你很难去定义这个特征工程,但是机器学习出于这种也是呃也是可以的,但是这个特征工程呃。
23:16
用在人脸上就不合适啊,猫狗上不合适,对,那你这个特征工程定好了之后,那么啊,就对不起这个这个呃,特征通过不断的喂养这个数字,然后。时间长了之后,他就能够知道掌握这个数字的写法,这个规律,然后就是有一定规律,但是说不清楚,就是神经网络干的事,那还有一个概念叫做误差反向传播网络。其实。这是一个,呃,深度学习的拟程碑,它其实中间前面讲的就是神经元那么多,然后中间有有有这个权重,有这个变异值,它怎么去调整呢,其实。你看这个这个东西就是我们假设去判断这个数字,784个是第一层输入,就是这个输入层中间那么多隐藏层,15个神经元,然后第三个层是输出层,对应零到九,因为你是判断你一。
24:11
哪个数字更大,所以他每次判断这个概率问题,那你在一开始的时候就输入各种数字,因为有这个带标注的数据嘛,就吧,这个叫叫这个训练集,就是说得出的结果,比如说那个五跟六好像有有点像,它有不同的写法,它是没法识别,或者二跟五,这样这个时候就误差反向,这个传播完了,就是说他会告诉你,嗯。他会告诉你啊,什么时候这个这个五不对,然后那么他就把这个他要做的事就是把五这个,呃,这个神经元的参数,如果把它变得那个足够大,把其他结果变小,然后五的概率变得足够高,这样就能够。得到得到这个哪个结果更更接近于这个数字的一一件事情,所以就是是根据结果去反向去训练,有点像比如你叫小孩,小孩把一认成了二,或者二认成三,你就频繁的跟他说这个不对,这个不对,这个是什么,然后他就会说二的各种各样的写法,你通过大量的训练跟练习,那不管怎样手写的数字的二,你让他看十张,100张,1000张,小孩就能知道,那同样用这种方式通过训练局先告诉他,然后通过题目去测试,去验证他其实就是误误差反向传播的文科生解释版本吧。
25:29
然后呃,这有网上有一个现场数叫mini,这个东西其实有6万个手写的阿拉伯数字,它其实标记了哪些哪些是什么样子,所以我们要做的就是用这些东西去调整好那个对应的参数,我们可以用其中3万个去做图像的训练集,用剩下的去做这个验证效果,然后不断的去。调这个参数,呃,具体的方算法就不你你就知道误差反向传播这个是怎样的概念就可以了。对,比如说七号神经元,你会发现嗯,调整方式让它的数值变大,其他九个变小,所以调整策略就是看输入哪个信息的结果影响大,它的权重调整就更大一些,就是隐藏层的就更麻烦,就会因为你会发现这个前面一层输入会影响后面的N个结果,后面的输入也会影响最最后一层结果,所以你是从从。
26:23
呃,一般的数据喂养是重新往后走,那么那么咱们的这个微商反向传播网络应该是从后往前走,所以开始其实都挺笨,然后因为它有特定的规则去处理。就就好了,反正这就这个讲起来有点麻烦,我建议用文科生的方式去解释,然后呃,你们就主要是看这个蓝色字,就就就比较合适,嗯。然后每次新的训练结果出来,就进行进行调整,然后使这个网络数据更接近正确答案,其实呃,网络其实么,就反馈及时,有点像你教小孩,然后结果立刻就能跟正确答案比较,不要求马上作业,每次总能进步一点点,不断的去做,最后这个神经网络改来改去,最终就达到达到这个稳定,嗯。
27:10
但是这里其实还有一个问题,就是我们的训练素材,就是网上那个mini的时候,它每个数字不大不小,其实在正中间,但是如果是大的图片里包含小小小的图片,或者像这边给了个图,就2013,你能看见是一二,然后往一三年跳,这个东西有一个局部,所以它的这个识别效果可能就不如完整的,这其实其实生活中很多都是像这张图片的事,他他把一些数字藏在这个里面。这个时候就除非更更经过更复杂的训练,然后才是比较适合能够能够做好的,对,然后呃,新的一代深深度学习络有更多,那神神经网络其实有很多种做法,以及比如说我大家肯定也听过的,叫做什么循环神经网络,九机神经网络,对不对?然后更复杂的东西要加更多的隐藏层,逻辑层,它是一层又一层不断的叠加判断,然后得到对应结果。比方说这里就简单说一下卷接时间网络,比如一张人脸,它原始数据就是一张人脸,机器人没法去理解的,那他机器怎么办呢?机器能把它像刚才切数字一样切成N个小块,对吧?然后他先去找这个底头像相关的各种边,因为眼的轮廓是可以找到的,这些轮廓找完之后,就是这个底层特征,然后对底层射身进行组合,就能得到一个眼、耳口、鼻,因为当你给机器看过足够多的眼睛的图片,眼睛的各个角度图片从上从下,从左从右,然后每个角度做完之后,它它。
28:36
才能够去识别这些东西都是中层特征,然后有这个中间层特征,然后就再进行组合,就能够得到一个高层特征,也就是说嗯,你会发现第一层是通过轮廓去找,找对应的,对应的这个这个呃呃五官,然后通过五官组合到一起,然后那一比如说一张图里面有很多大脸小脸,比如照片,那他就能够通过识别一个照片去判断这里面有多少个人,那把这个这个不是静态的嘛,那同理,如果。
29:05
一个币。摄像头能够通过照片能他们那个里面有多少个人,同样就能通过,假如那个监控,监控就能看到,比如说这里有多少车流量,或者有多少人流量,在只能放个探头,在那个地方就能够判断有多少人走过去了。对不对,这个其实就是一个不断从低维升到高维的一件事情,对,这就是一个卷积神的概念,它它的计算其实就是非常非常笨,但是这非常利于计算机,但是这个中间的计算机的数据量是非常非常大,你前面我们去处理那个一就那么麻烦,处理人脸这个麻烦的程度就更高了。好,这个就是那个多讲了一下,就是大家把这个呃深度学习呃,这个逻辑理解就好了,然后第三个就大家的启发什么,我们这里就是前面说了,有的简单,有的复杂,这里有一个叫做不讲人话,有的不讲人话,就是你们看这个蓝色的字,我我我我我就不念了,就是每个字你都认识,但是连起来就看不懂,好吧,其实大家只用记,记得一点,就是每一层是从前一层中去提取特征权,就有点像投票机制,比如说第一层输入,那在中间一层投票啊,这个像什么,对吧,然后在进第二层的投票,这个更像什么,第三层投来投去就经过多层的这个。
30:28
应该叫感觉吧,或者是叫角色,或者叫数理化的角色,在最后的一个逻辑里面去推演出这个东西更像什么,那个更像那个东西,就是神经网络输出的一个一个结果,所以是每层到每层体育特征,然后为什么有训练级跟这个验证级,还有测试级呢?训练级就说白了是从左往右走,那验证级其实就为了用通过刚才的反向传播网络从后往前走,这就是一个呃,一个概念啊,然后这里要讲一个。特点,特点什么?就是第一个概念叫做它只能判断有规律的数据,比如说。
31:03
一有很多种写法,你开始把这个那个竖的叫做一,或者把横的叫,再把第三个叫一,一那。他他就没概念,如果你非要去处理这三个不同一的写法,你先训练一个阿拉伯数字的一,那它输输出的结果就阿拉伯数字一,然后第二个是汉字简体一,然后第三层就是繁体汉字一,这就是三个不同,你先通通通过输出三个不同的这个那个这个,呃,深度学习的神经网络得到三个训练模型,它就能判断,那么当你把这三个掌握了之后,就能干嘛,其实你会发现有一些。怎么说呢,就是那个那个。你直接判断出人家是不是去留那个电话号码,比如有些诈骗,他会用那个火星文繁体字去做这个东西,他被你电话号码就是拿小写的一大写的一跟繁点字一交叉组合,那这种东西我们判断这一组数字联系到一起结入数字,可能很大概率判断这是个诈骗邮件,或者是一个不好的信息,那我们就能通过这些东西给他抓出来,它是三个神经网络,呃呃,算法给它组合成一个角色依据,这样的话就能通过这个东西去抓了,这是一个特点,它只能判断有规律的这个数据哈。
32:19
然后第二特点,它必须用专门的数据喂出来,所以其实很其实数据就等于是养料,你训练一个网络要大量的数据,图为比如你判断数字字母,这个猫狗人脸,它其实要大量的带标注的训练集跟验证级,这样的话,所以训练数据才是各个呃公司的资源,因为它效果非常好,它比它比那个怎么说比做特征工程要省事,因为很多东西特征工程就机器学习没法干的,但是深度学习可以干,所以这个东西挺好,但是它的依赖性就是。有这个对应的一个局局限性,对吧,然后嗯,所以呢,您既想拿做一个深度深度学习的网络,你你你真的得有几万个图像去作为训练素材就行了,所以这个原理是公开的,但数据是各个公司真正真的这个资源。
33:09
然后我第三个就是生学非常耗资源的,就是我们我们前面讲的就是判断数字,就28乘以28,那你如果要更好的结果,更复杂的这个业务判断,你比如判判断人脸轮廓,再判断五官,再把它组合起进行判断,这就就就卷积了,卷起来了,然后它是需要更更长的这个训练时间,跟这个调试时间就就OK,所以这深度学习三个特点才能给我们带来启发什么就是。啊,算法是公开的,然后算力说白了你就是要花钱就行了,你买更比如说显卡3080更更牛逼的这个GPU,这样还不是CPU,然后去去投投产,然后再通过数据去养,你会发现这些东西合到一起才能做出一个神器,就是能判断这这些很难被特征工程量化的东西,然后所以数据才是最最值钱的东西,就是你你进我以前在小厂打工啊,其实挺难的,小厂就没有什么数据,我们就有的时候用特征工程做,或者更简单点,要用用用正则的方式去做,然后就就很难,你你你数据不够,其实难比较难得结果,特别是抓那些垃圾广告。
34:22
你看大厂也有那么多面对垃圾广告的这个方式他就知道,至少他过往封掉的那些号里面,他一些行为特征都是能被标记出来的,为什么封它对吧?这些东西一旦做的多,他记得就足够多,所以一个数据就有,要贵就特别好,然后外面其实就怎么说,这个图像标注其实上当框是已经从。还有什么记不得,反正就这些世界公司,他们经常会去做一些数据采集,他是会跟公安部的去合作,说这个东西就是大量车的。图片大车小车,三轮车,摩托车这些东西,它这个采集出来,然后把这些东西,这些数据就属于比较干净的,里面肯定有这个东西,然后再把这个东西喂养,然后它去不断的去,呃,有了自动标注,有的人工标注,然后还有一些任务标注,反正得到一个结果,最后做出一个数据,所以光做数据标注也是一个非常挣钱的一个版本跟行当,所以。
35:15
所以通过这个你要了解到数据的这个价值跟重要性。如果你有概念。呃,你至少至少掌握这个东西吧,有专门的数据标准公司,比如一张图片多少多少钱人做的话,还有。做这个其实就是,呃,有那话怎么说,就有多少智能就有多少人工,人工智能就是这个概念。啊,这个嗯,我们看一下这个整个周期啊,就是拿一个横竖坐标轴,这个横轴时间纵轴的上面是技术发展挤压进行突破,你会发现1956年就已经有这个概念,但是八零年才会有一个。系统出来,然后在九零年才会有一个东西,呃,就是应用出现,但是这应用又不好用,但是唯一就是有一个战胜国际夏季冠军,但是这个东西终究是有限的,然后在2016年这个技术不断的发展,然后但是技术发展归发展,你会发现为什么在前面几十年没有了,是因为前面的就是你没有这个对应的这个积累,然后你你你得知道这个,但是到了某个节点,诶数据也有了,然后算力也有了,所以才有了后面的。
36:20
后面的这些自动驾驶啊,然后那个视觉啊,自然语言处理啊,特征啊,知识图破这些东西出现,这些东西不断的去呈现,算法算力数据都同时匹配了,就能组成神器,就能召唤神龙了啊,其实现在人工智能出现在我们生活中的方方面面,其实就我而言非常方便,然后我非常喜欢现在的东西。然后这里嗯,有个概念,就是呃,左边是这个人为总结,因为人脑是通过经验这个概念,它通过归理归纳出各种规律,然后通过这个判判断出一个结果,但是你会说每个人的大脑中够有限的,或者一个人的智慧他存在自己脑壳里面,他没法。
37:04
被被传播,但是如果有了这个记忆数据,你能发现就有点像那个呃发明创造一样,很多发明创造其实都是在某些地方有,但是如果把这个东西。你想没想过未来一种情况就是,如果嗯,你家里有一个医生,比如说你家人医生,你看到他的身体状态就不对,他是通过规律去判断,你可能有病要去做体检,或者该怎么治疗,该怎么疗养,那那这些东西医生资源又很稀稀缺,对不对,那你那你如果把这个医生东西训练成一个能够判断出他可能能力有问题的这个,呃,这个东西通过这个机器训练的方式去得出一个算法模型,比如说。呃呃,感冒是什么特征,然后肝病,可能眼珠子发黄,然后肾病,然后其实人体有很多数据,有生物特征数据,它就能够推出你可能得的什么病,那这个东西如果出现在你计算机里面,你把这个东西你让你让你你的那个计算机摄像头每天看看你,或者你每天。
38:05
洗洗那个你你你你的洗的这个手里面有什么东西,它它也是能识别到你这个些信息输入的,或者咱们的人体的血液,毛发,大便这些东西,这些人人体的特别特征出现出来,他也能够做这个东西,那我们刚才讲的是医疗的案例,同样教育的案例也是相似的东西,人所以机学习的这个好处就是你要去攒出这些东西来,然后然后然后你能够把这个东西拿出来去造福呃社会吧。然后好,这个基本上到最后的总结话了,所以这张图前面说过就是人工智能,什么就是为机器赋予人工智能,然后机器学习是它的一个新的概念,是它的一个子集,然后深度学习是一种实现积器学习的技术,然后神经联络是积器学习的一种算法,你说神经网络是深度学习算法也对。对吧,其实我我们自己如果做这行或者对这行有趣的话,其实就应应当掌握这个东西,就是你至少今天还掌握了一些呃,算法知识吧,然后。
39:04
在这一头,这一头其实什么?其实我们过往而言大家能懂的,其实我刚才讲的医疗的案例对不对,还有安防的案例,安防给小区带来很多案件,在游戏,在交通,我自己是做游戏,人工智能,我们是在行业解决方案里面,你能看到各个公司在里面去卖,那往下往下而言,这些解决方案背后是由多个具体技术去拼凑起来的,那再往下推延就是多个这个,呃,计算机视觉有有就肯定不止三个技术,云工程,自然云处理,特别自然云处理这个技术就特别特别多了,然后每每每些技术组合起来,就能出现一个解决方案,对不对?那再往下去探一层,就是这个算法,所以我们自己至少制造前面两层。甚至知道中间的,呃,这一层的技术方向,那你当你掌握了底下就是这些方向全部是由记忆学习跟深度学习去处理的,各种样神经网络去得到的,那你掌握了这个算法这一层面,你了解这个东西就就能够怎么说呢,你能够将来能够。
40:02
像这张图一样,你能把握时代的脉搏,当你把一些东西数据匹配,也许你能发明出一个神器,比如我刚才说的医疗案例或者教育的案例,对吧?这个是我们参与今天这次分享的同学所应该应该掌握的这些东西。嗯,好吧,然后然后这个其实就是也也排列一下算法知识吧,就是嗯,大体的就进学几个算法,你就想想就是嗯,更深层次,因为我我们刚才讲的就是算法,算法我们今天讲的深度学习,其实呃,你学习深度学习之前它好,但是它有很多的局限性,我前面也讲了,所以你不妨先从这个机器学习先掌握起,那机器学习这些东西常用算法,什么聚类分布,K基尼普素,贝叶斯决择数等等等等。对吧,其实每个算法就解决聚类,就是把什么东西归到一起分类,就是是A或是B回归一般是计算连续值,这是帮帮助这个怎么说我更人去理解,那这些东西的产线算法,这些东西有一个大概的了解,你脑海中就有个框架了,然后把这些东西了解之后,就能有一个就是对应的概念,我觉得这个就反正本次课程也就达到了,所以一个东西能讲的东西有限这些这些东西,嗯,帮助大家了解这个结构,帮助大家去。
41:17
嗯,理解这中间的这个关联性,也方也也是方便入门,也是也是对那个呃,专业知识的一种补充吧。然后OK,会议环节,其实这里就是大家提问话,可以在那个留言投票或者那个群里说,然后抽到的应该是有礼物的,然后就是我自己打个广告,就是我的这个,呃,企业微信,如果你是腾讯的,可以直接私聊到我,然后如果跟我去私人邮箱里发一些东西,对这有有兴趣就我一定会回的。然后其实我们要经常掌握一些方法论,就有点像,我觉得这张图特别能表达我了,我我我现在留言,你们可以在群里留言问问题啊。就是那个直播,直播间或者一些地方。因为多个地方在做直播,然后嗯,其实左边这张图我其实蛮喜欢,就是牛顿觉得不是第一个被。
42:06
苹果砸中的人对吧,但是他自己能够得到,万一你他其实也是之前做好足够多的准备,所以你这些准备就是。你掌握了知识,然后你因为某件事情启发,也许你就捣鼓出一个一个一个一个神器出来了,好吧,这个其实就是方法论的一个价值。嗯,然后其实我历史,呃本次分享也就基本上就完了,呃,那个留言问题一会解答就是我历史有有过很多次直播,然后我基本上是偏向于做这个AI产品方向的这个直播,因为我自己也本身也是属于一个应用层的产品经理,现在也是自己的不断的去学习,因为学习输入能够倒逼输出吧,然后好,行,那这个分享到这里,我一会儿,呃,下面翻一下这个群里各个同学的这个提问吧。然后注意回答一下。
我来说两句