在图像辨识、语言翻译和动态时报排序等都用到大量人工智能的Facebook,希望破除这个迷思。Facebook的AI研究部门负责人Yann LeCun认为,多数的害怕来自于不理解,「我们希望告诉人们AI并非魔法,而是严谨的科学。」因此在部落格上发布三段浅显易懂的影片,替大家上一堂AI入门课。
其中,人工智能特别擅长辨识出大量数据中的模式,这是人类较不擅长的,此外,还可用于学习翻译、简单的逻辑推理,甚至是系统性地产生新想法。
他们将人工智能比喻成一台机器,若最终希望能让它辨识出「汽车」和「狗」的不同,必须先提供大量汽车和狗的照片,让机器练习回答,并在每次的回答中调整解题过程。最终,就算出现过去没看过的图片,也能找出是否有共同点而辨识出物体。
过去,传统算法只能重复性的一一比对数据库,比对到类似图片才能归纳出答案,而常听到的机器学习算法,则可在比对的过程中「训练」机器的辨识能力,大量减少所需时间和运算效能。
看过影片后,就可以了解机器学习的过程其实真的很「数学」。
对计算机而言,图片由一组数字矩阵组成,这些数字分别代表不同像素的亮度。举例来说,想要分辨字母「C」和「D」,首先计算出代表C和D的数字矩阵,再乘以「权重」,若数字加总后大于零,可判断是C,反之则为D。而机器学习算法,就是在辨识图片的过程中不断依照C和D的图像特性,调整权重。
影片中说明,算法会同时考量C和D的数字矩阵,最终可调整成只对C有反应且为正的权重、只对D有反应且为负的权重。因此,只要知道加总结果大于或小于零,就可以知道数字矩阵代表的字母。
有利于辨识局部图像的深度学习法:卷积神经网络
不过,就算学会如何辨识不同物体,只要物体出现在图片中的尺寸、露出部位和角度只要有些不同,就可能让机器误以为是完全不同的东西。
这时候便会用上深度学习结构「卷积神经网络(convolutional neural network,ConvNet)」,在第一层会先抓出物体的局部影像,例如轮胎的轮子,或人的眼睛,且让这些局部影像重复出现在不同影像图层的不同位置;第二阶段则可将第一层的影像组合起来,例如整张脸、机翼等,最后可组合成完整的一辆车、一架飞机、一个人等。透过这样的分层分析,可简化机器辨识复杂图像的步骤。该技术也可应用于自驾车、语音辨识及翻译。 三种AI学习方法
Facebook指出,目前人工智能学习方法大致分三种。
首先是透过输入大量资料并给予奖励反馈的「强化学习」,教机器下棋就是其中一种,不过缺点是,就算只是学一个简单任务也需要大量数据和练习。
而最常用于训练神经网络的「监督式学习」,就像爸妈用绘本教小朋友物体名称,当我们提供机器汽车的图片,会告诉他正确答案是汽车,算法可以从这过程中学到汽车的特性。
最后一种是「无监督式学习」,亦称为「预测型学习」。大多数人类和动物最初都是以这种方式学习,透过观察以及和这个世界互动,便能学到基本知识,例如这世界是三维的、物体不会突然消失等。但目前人工智能尚未发展到这种学习阶段,这也是限制人工智能进展的因素之一。
不过令人意外的是,文章中特别提到哲学的重要性,因为其对理解和学习任何知识都有帮助。这也呼应到Facebook近来被批评其动态时报推播假新闻影响美国大选结果,在每种机器学习应用的背后,最终还是得回归到「人」。