00:13
但是一六年的时候,我们知道阿尔法狗他突然就火了,对吧,当年他就是把所有的这个围棋冠军都打败了,这也是Google提出的谷把mind收掉了是吧,这个他们公司搞出来的一个东西,那阿尔法狗为什么能把人类打败呢?首先是第一点就是阿尔法狗他学习了很多人类的棋盘,这个人类的围棋棋盘呢,是19乘19的,对吧?考考大家这个棋盘总共的状态有多少?好像没人说三这个数是吧。因为一个大家想想,一个格子上你可以放子是吧,你可以放黑子可以放白子可以不放对吧?所以一个格子上有多少个状态啊,三种对,总共有多少个格子呢?有19乘19,呃,19乘19对吧?这是三的19乘19次幂。
01:15
就这个数。这个数已经远远超过了这个宇宙中所有的原子的个数,所以说你去穷举搜索它是不可能的,这也是阿尔法狗为什么很火,如果是只是下一个国际象棋,或者下一个其他的一些很简单的一些棋类的话,通过搜索就可以预判出机器该怎么走,能取得更大的一个成功的可能性,但是呢,在象棋上我们是做不到这一点,通过穷举是做不到一点,对吧?那就问题来了,通过穷举做不到,那我怎么知道人会怎么走,我怎么知道我该怎么应对呢?他这里面把所有人类历史下过的棋盘都拿回来了,然后呢,学习了一下。这个学习两个字说的很简单哈,但是对,但是结果就很牛哈,他是怎么学习的呢?他也是这个搜索也是便利,但是呢,他会挑很多很重要的节点去便利,他不会做全局的便利,这也就是刚才那个下面同学刚才说的,他用的是蒙特卡罗搜索速去做这个搜索,那做完搜索之后呢,比如说啊,我搜索出来了,你你你们比如说这个人现在放了多少个子有这么A状态,然后我机器现在呢,可能处于劣势,我有B状态,我怎么评估我现在个B状态是要赢了还是要输了呢?他用的是一个神经网络。
02:38
用这个网络去评估现在我到底是占上风还是占下风,只要我保证我一直占上风就可以了,就赢了嘛,对不对,用的是ne,就因为神经网络这个强大的拟合能力,才能把他们这样很复杂的一个状态都学到。以往我们可能也是用模特卡拉做手术,然后我们可能写了一些规则,或者说我们用一些简单的机器学习的方法去做这个棋盘的优势劣势的一个判断,所以呢,我们的效果就不好,我们打不败人类,但现在我用了re ne,用了这个深度神经网络就把人打败了,因为深度学习呢,有强大的拟合能力,但这是明天我们要说的内容啊,所以这个东西大家有一个基本的一个概念就OK了。
03:20
然后呢,在这幅图里边,我们看到就是康塔纳是吧,就现在这个人机对话非常啊,现在经常有这个什么出门问问呢啊,还有什么这种公司,如果你们以后去这种公司的话呢,那是肯定要去做这种,首先是什么呢?语音到文字的一个转换,对吧?我们都知道以前语音到文字的转换呢,其实是非常不准的,对吧,但现在我们看到那个科大讯雷输入法,它已经可以很好的把人类的这个话就转换成文字了。基本上转换率非常低,你手机上先抓一个讯飞输入法,你这边说那边可能就直接发这个短信就录出去了,就就出去了,对吧,那么现在语音转文字为什么会转的这么好,包括转成文字之后,这个机器为什么知道该怎么回呢?这里边儿关键的技术呢,也在于我们刚才讲的这个深度神经网络。
04:09
嗯,也在这里面。呃,第三个是这个一个图,这是这个图肯定不是那个张学友,张学友演唱会当天截下来的啊,但是这是他们公众号里边写的一个图,就是说张学友开了几场演唱会,每个演唱会里边都用面部识别抓到嫌犯是吧,很巧张学友是那个一个嫌犯克星,是为什么在几万人里边去抓到一个逃犯,现在就是依赖于我们现在深度神经网络对人脸的识别准确率已经达到了非常高的这样一个状态,包括我们现在去公司,很多公司已经刷脸打卡了,对吧,包括那个有的火车,火车站是那个刷脸验证对不对这样的对。然后接下来这一幅图呢,是百度一直在搞的这个无人车,无人驾驶,现在首先落地的场景呢,我看到的是京东的配送,对仓库里边的配送,然后以及美团的这个外卖配送,他可以把这个外卖装到你家来,这样的话就把外卖小哥的工作给替代掉了,所以外卖小哥应该就失业了,我估计他们不能干,对应该是不能干,所以就是可能是AI对未来大家这个职业可能都有巨大的影响。然后呢,下一幅图呢,是这张图片,大家可以看到这个图是一个很油画的风格是吧。
05:29
这个图并不是出自于某个作家之手,这是机器生成的。而现在的深度学习呢,已经能实现这一幅图,它就生成一个类似风格的一个画。比如现在给大家拍了一个照,然后呢,扔到神经网络里面去,他就能给你学出来一个这种风格的一个照,教室的图片就能就生成这样一张图片,对对对,然后呢,第六幅图呢,是这个大家看大家认识他是谁吗?也不认识,对因因为他是一张计算机生成的人脸,这是张假的人脸,所以大家不认识,对吧,因为他不是任何人。
06:08
啊,那么怎么生成的呢?这里面用到了一些更更为高级的技术,主要的技术呢,叫做干。叫对抗生成网络,是这一年最火的一种,呃,深度学习人工智能的模型叫对抗生成网络,它基本的思想呢,就是说我有一个一批小样本,然后呢,我去,因为这样本里边所有的人脸,我都认为他是真的,对不对,这是真人的,我认为他真的,然后我通过计算机不断去生成假的,不断去生成假脸,因为生每次生成一个假脸之后呢,我们是我们说他有一个G,这个G就是一个生成器,它生成了一个假点,然后呢,另外一面呢,我我们有一个判别系。叫地。这个D呢,就是对G和这1000这个这个图像放在一块去做判别,因为我知道这1000个是真的,这个G里边是假的对不对,所以我就会让他不断的去学习,让D尽可能的把这1000张全判断为真的,对吧。
07:11
D学好了之后呢,因为D的能力提升了,G在生成的时候呢,他发现D给他判别成错误的了,所以呢,G就会依赖于D去学习怎么生成更真实的人脸。这个过程大家能听懂是吧,就一边生成一边判别,他俩一起学,最后两个人都收敛到一个很好的状态,这个时候呢,D可以很好的判别出来哪些脸是伪造的,而G能很好的生成一些假脸,让D看不出来到底是真的还是假的。这个技术不仅可以用在图像上,还可以用在文本上,然后我们也做过一些工作,可以生成一些很很有趣的一些文本,对,但因为这个东西训练起来比较慢,因为它同时训练两个这个模型会慢一些,所以呢,在大家的CPU上跑起来呢,还是费点劲。然后下面我贴了一个链接,大家可以可以回看一下,就是现在那个波士顿动力的机器人,他这个机器人可以像人一样去翻转跳跃。
08:09
所以说它这里边儿用到一个主要的技术呢,都都不是这些技术啊,用的主要的技术叫强化学习。叫强化学习,是从环境里边不断的去学习的一种技术,所以大家可以可以了解一下,这是总部的一些涉及到一些技术。那什么是人工智能呢?这,这里边儿都是一些官方术语。什么人工智能呢?它是研究开发用于模拟、延伸和扩展人的智能的理论、方法、技术和应用系统的一门新的技术科学。人工智能呢?是计算机科学中一个比较重要的一个分支,它试图了解智能的一个实质,并且生产一种机器能代替这个人类的一个智能。主要现在应用场景有这么几种机器人,机器人就很多了,比如说那个,呃,大家看到的出门问问啊,很多很这种机器人是吧?然后语音识别,各种各样的,搜狗翻译宝是吧?大讯飞翻译宝是吧?大讯飞语音识别首先基于的都是先把语音识别成文字对吧?然后再去做文字转换对吧?然后图像识别,这里边有人脸检测是吧。
09:16
无人驾驶对不对,无人驾驶本身有图像嘛,安防,然后包括那个图片,比如商业化广告分类是吧。比如你在淘宝上买东西,你拍一个,然后他就推荐像商品了,对吧,那这个地方如果图像他识别不了,他理解不了图像的话,没有办法推荐,然后最重要最重头的一个东西就要自然人员处理。因为互联网上大部分人在搞的都是一些文本性的工作。我们在做的事情是什么呢?从网上爬取出来所有所有的网页,很多网页对吧?然后呢,有人做搜索引擎,把这网页搜索起来,做多多开索引对吧?你搜一个query,搜一个term,他就能给你匹配到一个document上去,把这个do返给你,对吧?这是做搜索引擎那帮人做的事,还有人做什么呢?做推荐系统对吧?把所有的数据都做一个清洗,并且做一个优质,重新筛选,然后之后再做分类。
10:09
做一个标签达标对吧,比如说你昨天刚看了漫威,你在微信上搜了一个漫威的电影,然后呢,今天那个百度或者是其他的一些,不管通过什么手机的一些窃取方式还是什么的,把这把牛虹行为拿到了,就给你推荐漫威的这个小视频,或者是漫威的这个文章,你看了非常喜欢看,你就点进去了,对吧,每次点进去之后呢,就对你用户做了一次记录,就认为你在这个兴趣上有一个倾向,一个倾向,然后呢,另外一部分,他从网上抓数据的时候呢,也把这个数据分成了好多好多好类好多类,但是肯定不是人去分的,因为每天新鲜事物层出不穷,对吧?那。他收集到了很多信息,然后他又做了一个画像,跟你这个人的画像之间做匹配,如果匹配的很好,就把这个东西推荐给你,对吧,就越来越点点的越来越多,最后发现你的那个推荐系统里边,信息流里边只有你自己喜欢看的东西,别的什么都看不到,对吧?所以说这也是一个弊端,但是至少用户粘性很高。
11:12
这是自然语言处理这一块,然后呢,下一个是专家系统,专家系统比如现在有很多一些治疗啊,包括一些我看一些医院里面还有一些很多地方会用的,就是说当你发生什么样的情况的时候,你该做什么,就做很很复杂的一个事情,是吧,因为因为很多时候我们自己人没有那么多知识,对吧,包括和知识工程都结合在一块儿,知识工程里边比较重要的一个叫做知识图谱。现在用深度学习去解决一些知识的时候啊,有些局限,那机器你不管看到了多少数据啊,他没有知识,比如打比方说我现在开车,车前面有一个小狗,对吧,小狗突然间跑出来了,那么我立刻就要停车,对吧?因为它的主人在后面跟着呢,很可能它会找我麻烦,对吧?这是一个知识,但是你要计算机去学的话,这个事儿他就学不到,就很难学。
12:04
所以说呢,知识工程主要着眼于这种事情上面,他建议一个人和人,物和物之间的关系,然后通过关系去评价,这个时候到底该做什么样的决策啊。接下来第五个最后一个是那个学习和深度学习啊,这个是一个大的范畴,那人工智能呢,是对人的,呃,意识思维和信息过程的模拟,但是呢,现在来说呢,还超越不了人啊。人工智能里边分了这么几种,第一个叫做弱人工智能,就是我们现在搞的就是弱人工智能,它在某一方面可以做的比人更好。相信于人或者比人更好,对吧,然后第二方面呢,叫强人工智能,什么叫强人工智能的,就是说他已经在各个方面都比谁做得好。第三种呢是超人工智能,就他自己可以研究什么,甚至研究这个物理定律,研究宇宙是吧?当然呢,这两个东西实现起来是非常难的,是非常非常难的,现在我们还有很多问题没解决,但弱人工智能在很多方面现在已经做的比较好。
13:08
然后呢,讲到这个人工智能呢,我们讲一个人叫图灵,五岁的时候,他提出一个,呃,一个一个概念叫做人工智能。就计算机刚出来的时候,大家就在想,计算机这么能计算是吧,那能不能代替人工智能呢?就是他当时提出了一个东西,叫做图灵测试,什么叫图灵测试呢?就是现在,呃,把一个人关在一个小屋里面去,然后呢,我就在外面,我去跟他对话是吧?如果我分不清他是人还是机器,它就通过了图灵测试。这个这个概念很简单是吧,这个东西本身对人工智能上没有什么太大的一个,就是说技术上的一个帮助,但是他给我们评价上带来了很大的帮助,我们一直用图灵测试去评价我们一个机器人是不是达到了我们这个正真正人的一个满意。嗯,因为今年那个的IO大会啊,他提出了一个叫Google这样一个技术。
14:06
这个技术呢,用在了Google assistant里面,当时他演示了一个打电话订餐是吧,就我们不知道Google现在这个到底做到黑客技都做到什么程度,但是可以肯定的是,现在机器人在某一方面做的已经可以超越人类了,所以说图灵测试能不能说被通过了呢?大家现在已经不追求说途径测试是否被通过这个目标了,因为我们现在互联网的很多的目标呢,目的不是为了让他通通过图形测试,而让他代替人类工作的很好,对对,比如一个订餐机器人,他在订餐上可以跟你沟通的非常好,但你问他火车票,他就不知道对不对,他没有通过土地测试,但是他一样可以工作的很好,对吧,所以我们现在就很多时候不看这个图形测试了。我们更多的呢,是看一些这个具体方面的一些应用,呃,图灵提出了这个人工智能这个想法以后呢。呃,有几个大牛在1956年的夏天就去达特茅斯学院开了一个会,提出了一个名词叫人工智能,其中有几个大牛呢?一个叫约翰麦卡锡,就现在人工智能之父,其中还有一个人比较比较有名,叫克劳德香农。
15:18
知道了,信息论的发明人打比方说,大家每天都在用那个压缩文件包RA2,这个二二压缩是有上限的,对,你比如说打比方你现在已经压缩成一个二二了,然后你把这2R再次压缩,它的空间就不会变了。对吧,为什么呢?因为信息是有上限的,就你比如打比方,我现在要是比如说咱们还说二战那种事情,比如说说那个,呃,德军是胜了还是败了,那么这个这个东西至少你得用一笔头去表示。对吧,一或零嘛,对吧,至少一比特,所以它的信息量就是一比特。一本书呢,它也是有它的信息量的,不论你怎么压缩,你都不可能把它压缩成一笔。
16:03
对吧,所以香农当时发明的这个东西叫做信息论,就主要是解决这个事情的,这是香农的主要一个贡献,另外有一个人呢,在60年代的时候发明了一个感知机的一个东西,感知机是什么东西呢?嗯,简单来说啊,我给大家简单画一个一个二二维的一个平面,这个二维平面上呢,有两个触点。是不是这有两簇点,这个两处点很可能是什么呢?各种各样的应用啊,比如说呃,这个楼房质量是不是达标,欧洲是达标,差是不达标是吧?那个医院的片子,这个病人是不是有问题是吧?O是有问题,叉是没问题,对吧?我们生活当中处处存在着这样的例子,我们需要把它分开,我们需要找一个线把它分开,为什么呢?一旦有一个线分开之后,再来一个样例,我现在不知道它是真的是假的,我就可以通过这个线判断,哎,它的线的上边它是真的,它没问题的,我就把这个东西分开的。
17:05
那么当时呢,有一个人叫罗森布莱特,他就提出了感知机,就提出这么一个东西,这个东西其实当时提出以后呢,就是其实火了好长时间,为什么会火,因为它可以解决我们生活当中已经是很多很多问题了,对吧,就当时很火。但是呢,好景不长,很多人发现,如果这个数据变成这样的,他解决不了。比如说这儿。他解决不了。现在无论如何通过一条直线也分不开,对吧。就是其实在后面我们说机学习里边有很多其他的方法,其实我加一个和函数,就现在机器学习讲,加一个和函数呢,就把它分开了,但是当时呢,人的这个就很多,现在看起来很简单的技术啊,但在研发的时候,因为人都不往上想,或者说当时技术所限,就是实现不了,所以说这样的一个问题,这个问题叫什么叫抑惑问题,咱们把它抽象一下,简单说一下,他的问题就是在讲。
18:06
这样一个平面的一个数据结构,这样一个数据结构,我们通过直线是怎么也分开的。对吧,这个问题呢,被这个上面这个这个提出人工智能的四个人之一的马文明斯基给发现了,马文明斯基呢,专门写了一本书去抨击感知机,去抨击他这个罗森布莱特所谓的这个连接主义。在同时呢,就是这个罗森布莱特提出这个感知机的同时呢,还有另一帮人,另一帮人在搞专家系统和知识工程。就是这个人工智能刚提出以后呢,就马上就分成两派人,第一派人呢,他们主要的做法呢,他们当时叫做符号主义。另一派人呢,最开始呢,叫做廉洁主义。什么叫符号主义呢?就人工智能刚提出之后,有很多人就认为我这个世界上所有事情都是可以通过数学公式表达的。
19:05
他认为所有东西都可以通过数学同式达,包括图片图像,包括人脸识别,包括自然语言理解,都可以通过数学公式去表达。他以为是我只要写一个公式就OK了。他们最开始发展的很快,把这个罗素有一本书叫数学原理是吧?就是专门讲那个数学基础原理,这个符号主义所做出来的,这个这个人工智能的,就把这个数学原理这个书里边的呃,38条定理都证出来。就在没有人为干涉的原因下,就没有人为干涉的这个情况下,全给证出来了,这是一个非常了不起的成就,所以当时符号主义的人就非常非常的开心,他们就提出了几四个观点,认为前面我们就不说了,第三个、第四个应该是认为短期内计算机就可以实现类似于作曲或者是作诗这样一些事情。然后呢,第四个呢,是可以实现什么类似于很多的那个复杂的一个定理的一个研研究复杂定理的一个研究啊法,然后呢,好景不长,因为我刚才说过这个这个数学这个基础,它就导致你这个东西是有上限,这个东西做不成,所以呢,好景不长,美国这个国防部呢,就对他们就就是不支援了,因为他们就呃,比如说最开始我比如七三年做了很很多好东西,对吧,但是到76年78年还是这些东西,这科研是等不了这么长时间了,对吧,所以国防部就撤支了,然后撤支之后呢,他们之后就失去这个经济来源,所以说符号主就陷入了这个冬天。
20:38
这是第一次浪潮的一个衰落,然后这时候连接主义呢,因为被这个马文明斯基批判的体无完肤,所以他也衰落了,所以在七几年到70年代末到80年代初的时候,人工智能是一次低谷。能看到了感知机是推向了高峰,然后明司机批判他解决不了异货问题,然后呢,再加上这个,呃,很多这个专家系统逻辑符号主义不好使,然后我们就进入到第四低谷,对吧。
21:09
然后呢,第二次高峰是什么?是是是因为什么呢。因为很多专家当时开始去着眼于知识工程,他们搞了很多这种知识工程的机器,就是说比如说大家啊,我我建一个医学的一个专业的一个机器,因为这个最开始人这个计算机这个用的很少,那个时候还没有现在PC这些东西啊,所以说知识工程啊,他当时大火了一阵,又上一个高峰。但是呢,后面随着这个,呃,因为一些知识工程能做的事情非常有限,所以后面又进入了低谷,直到2000年左右的时候,2000年前后SVM一些等一些机器学习算法的一些兴起,机器学习这块呢,得到了很大的一个提升,但是呢,到两千一零年左右的时候,两千一零年深度学习,深度学习是2006年出,就是深度学习两千零零年出来的,但是一直到两千一零年的时候,深度习都没有火。
22:07
都是以SDM为代表,传统的机器学习是比较火的一个算法,但是他们到两千一零年的时候做不上去了,所以呢,后面大家把这两个都放到了轻度学习上,所以现在是AI的第三次浪潮。那么现在来看呢,机器是否具有真正的智能的,就这是我们人眼睛中的图像是吧?我们可以理解这个图像是艺术的,它这个树非常漂亮,树非常漂亮,山也非常漂亮,但计算机看起来呢,是什么呢?是很多数字对吧?所以说你让他去计算机去理解这个图像呢?他的确可以理解,但是他没有办法去推理,计算机只能感知到这里边有一排数字,这里边一排数字,这些数字呢,很可能是山,那些数字呢,很可能是湖。就是计算机能做到的程度,就到现在为止。所以说,目前只能实现感知智能,没有办法实现推理智能。
23:02
嗯,再有一个例子就是这个,我们我们试着对他做个切词哈,南京市长江大桥欢迎你对吧。呃,重庆市长江大桥欢迎你,武汉市长江大桥欢迎你啊,这个这个机器就会问江大桥是谁呢?南京市长江大桥他是谁呢?为什么每个市场都叫江大桥,要问这个啊,但是如果是我们人的话,肯定不会问他这个话,对吧?对呀,所以这就是一个人工智能现在一个问题,他没有办法推理,如果你发现三个市市长都要江大桥,你就觉得自己切实肯定是有问题了,对吧,但是机器现学不到这个东西,对吧?机器现在只只知道南京市场大桥,诶合理的,武汉市场大桥他们都是合理的,对吧?所这是现在推理智能没有非常完善所面临的一个问题。到现在还有很长的路要走,然后呢,所有的行为呢,现在计算机呢,都是在猜,他只在猜的概率大是吧,我比如我看见了1000万条数据。
24:03
都说是碰到这种情况,我要往前开过去,那计算机就就往前开过去,因为什么呢?因为现在这个猜猜概率最大那个对吧,他就开过去了,然后呢,图像和语言呢,是原始的信息感知智能,现在实现的还不错,但是语言和艺术这块呢,是推理智能这块现在还实现的还差很多,对。嗯,然后我们的这个学习方法简单跟大家说一下,刚才我们给大家说了这个周世华的积极学习和李航的统计学习方法这两本书,大家可以有兴趣可以下去看一下,对大家的主要的意义呢,不在于说你能把这个人工智能渠道多么牛,就能算是机器人,而在于说你在平时工作里你能掌握,你能掌握三个东西,一个叫图像,一个,一个叫图像,一个叫。呃,语音一个叫文本。你能掌握这三个媒介的一个主要的处理手段,你在互联网充分的话,就是肯定就是一个大麻。
25:06
这么说就是生成肯定不是问题,而且是个技术大大,因为因为图,我们现在所有接触的所有的东西,无非就是图像语音加文本对吧,那视频就是变化的图像加语音嘛,对吧。好,那我们先暂时休息一下。
我来说两句