学AI的高中生还有5秒钟到达战场,请90后叔叔阿姨做好准备

郭一璞 假装发自 语文考场 量子位 报道 | 公众号 QbitAI

一个多月前,商汤科技参与编写的《人工智能基础(高中版)》成功刷了一些人的屏。

这本给高中生的人工智能选修教材让许多人惊诧:现在高中生都这么前沿了么?甚至在海外,也有许多网友将其视为中国AI进一步崛起的一个证明。

所以,量子位怀着给自己的高中生涯补课的心态,通读了这本给高中生的AI教材。

这本书写了什么?

相信这本书的目录已经有很多朋友见过了,量子位在这里简单介绍一下每个部分的内容,看不懂的同学可以直接跳到下一段:

第一章 人工智能: 新时代的开启 1.1跨越时空: 铭铭的一天 1.2光辉岁月: 人工智能简史 1.3百花齐放: 人工智能在各行各业的应用 1.4初露真容: 人工智能与机器学习 1.5本章小结

第一章主要是基础知识,介绍了人工智能的应用、上世纪50年代以来的三波人工智能发展浪潮,以及机器学习的简单概念。

和许多其他学科的课本一样,第一章非常简单,几乎没有任何技术方法的内容。

第二章 牛刀小试: 察异辨花 2.1初学乍练: 分类任务 2.2含英咀华: 提取特征 2.3分门别类: 分类器 2.4实践出真知: 测试和应用 2.5五花八门: 多类别分类 2.6大显身手: 二分类在生活中的应用 2.7本章小结

第二章算是正式开始讲技术原理了。编者先从变色鸢尾和山鸢尾两种植物的分类入手,引入特征提取分类器判断的过程,详细讲了特征提取是什么、如何把特征总结为特征向量、如何训练分类器、感知器学习算法、损失函数以及支持向量机。

之后,再把二分类延伸到多类别分类,介绍了这类技术在相机人脸检测和癌症监测中的应用。

第三章 别具慧眼: 识图认物 3.1温故知新: 基于手工特征的图像分类 3.2另辟蹊径: 基于深度神经网络的图像分类 3.3“网”不厌深: 深度神经网络的发展与挑战 3.4忽如一夜春风来: 图像分类在日常生活中的应用 3.5本章小结

第三章里,深度学习卷积神经网络终于出现了,这对于笔者这样一个假理科生来说,需要集中精力反复翻阅才能大致看个明白,其中的一小部分,比如梯度,则压根看不懂是什么。

作为以识图为主要内容的一章,编者在这本书里先介绍了计算机图像的RGB格式,引入了三阶张量的概念,之后补充关于卷积运算的数学基础知识,介绍了用卷积提取图像特征。

后面则是对深度神经网络的具体介绍,卷积层、全连接层、归一化指数层、非线性激活层、池化层这些概念得到了一一介绍。

此外,这一章里编者也补充了关于深度神经网络的一些其他知识,比如ImageNet多年以来准确率的不断提升、数据与计算能力对神经网络 发展的限制、过拟合与欠拟合,还有笔者完全没看懂的梯度消失。

最后,作者以人脸识别为例,介绍了图像分类与深度学习在社会中的应用,比如门禁、刷脸支付、安防等。

第四章 耳听八方: 析音赏乐 4.1洗耳恭听: 听声的艺术 4.2丝竹管弦: 音乐风格分类 4.3言听计从: 语音识别技术 4.4听声辨曲: 乐曲检索技术 4.5本章小结

相比前一章图像分类,音乐和语音这一张似乎讲得格外模糊,厚度仅有前一章的一半。

开头先介绍了人耳的听觉原理,以及乐音三要素响度、音调、音色这些声音方面的基础知识。

之后引入了梅尔频率倒谱系数(MFCC)这个概念,以及依据此概念进行深度学习的方法。

再往后,就是对于语音识别和乐曲检索的简单介绍,总共不超过4页。

第五章 冰雪聪明: 看懂视频 5.1化静为动: 从图像到视频 5.2明察秋毫: 视频行为识别 5.3基于深度学习的视频行为识别 5.4本章小结

这一章先介绍了光流概念,之后大概介绍了如何用双流卷积神经网络识别短视频动作,最后则是针对长视频的时序分段网络。

第六章 无师自通: 分门别类 6.1当人工智能未曾听说花的名字 6.2物以类聚: 鸢尾花的K均值聚类 6.3人以群分: 相册中的人脸聚类 6.4层次聚类与生物聚类 6.5本章小结

标题里的“无师自通”说的是无监督学习

而所通的对象依然鸢尾花,用K均值聚类将大量鸢尾花样本氛围山鸢尾、变色鸢尾和弗吉尼亚鸢尾三类。

之后,把鸢尾花变成人,通过人脸检测、人脸转正、特征提取步骤之后,完成人脸聚类,以实现相册根据面孔自动分类的过程。

第七章 识文断字: 理解文本 7.1任务的特点 7.2文本的特征 7.3高屋建瓴: 发掘文本中潜在的主题 7.4投其所好: 基于主题的文本搜索与推荐 7.5本章小结

这一章最主要的内容是词袋模型,以此分辨中文分词、停止词、低频词,之后得出不同词汇的频率,发掘主题。

语义分析和搜索可能过于难了一些,书中只给到了两页的简单介绍。

第八章 神来之笔: 创作图画 8.1九层之台, 起于累土: 数据空间和数据分布 8.2化腐朽为神奇的创作家: 生成网络 8.3火眼金睛的鉴赏家: 判别网络 8.4在对抗中合作与进步: 生成对抗网络 8.5得心应手地创作: 条件生成对抗网络 8.6本章小结

标题是画画,内文一定是GAN了。

开头先介绍了数据空间的概念,之后则单独把生成网络和判别网络拎出来讲,之后进入了对抗过程的步骤演示,最终,终于生成了一些假模假样的明星照片。

第九章 运筹帷幄: 围棋高手 9.1初窥门径: 阿尔法狗的走棋网络 9.2远见卓识: 阿尔法狗的大局观 9.3成就非凡: 阿尔法元 9.4本章小结

大众最为熟悉的阿尔法狗终于在最后一章出现了,这一章介绍了阿尔法狗的策略网络、估值网络、快速走子网络和蒙特卡罗树搜索,当然,还介绍了一点强化学习的概念。

究竟难度几何?有图有真相

除了第一章的基础介绍之外,其他部分还是在将技术相关内容。虽然受限于高中生的数学基础,但是对于具体的原理逻辑,已经讲解的相当详细了,可以说是学术不足、科普有余。

比如在介绍卷积神经网络时,书中以飞机、汽车、猫咪、木牌等图像的照片作为示例,先科普了计算机存储图像的RGB三色,提出三阶张量的概念;

又补充了卷积运算的数学知识;

利用卷积进行图像特征提取的原理和流程;

最后引出深度神经网络的结构,还顺便介绍了发展历程与应用。

其他相关的概念也是从实际应用的问题切入,从数学原理开始,一步步推导出算法模型,进而引入方法概念,最后回到实际应用中。

这个过程让身为媒体的量子位学到了不少技术内容的基础知识,还成功复习预习了包括卷积运算、矩阵乘法、各种函数在内的一些数学知识。

在看完本书正文之后,量子位还翻了一下书后的参考文献,发现Yann LeCun, Ian Goodfellow等大佬的作品赫然在列,这可能是很多高中生离学术界最近的一次了吧。

对于这本书,创新工场副总裁王咏刚给到了一个中肯的评价:

不过,一个难以解决的问题是,书中有许多实验环节,需要配套的实验平台来完成。根据执行主编林达华教授在知乎的相关介绍,商汤科技已经为合作学校提供了实验平台:

为了配合教材中的22套实验,我们还开发了一个配套的教学实验平台。在这个平台里,我们对多种常用的算法进行便于中学生进行实验的API设计和封装,配套的数据集也做了适当的剪裁,尽可能使得普通的中学生能在可以接受的时间里能够完成实验。在这个平台上,我们选用了在AI领域最广泛使用的Python语言。我们为合作学校提供了多方面的支持,包括教学平台的支持,老师的培训等等。

图片来自林达华教授的知乎回答

很遗憾的是,除了合作学校之外,量子位并没有发现其他可以接触实验平台的渠道。在这本书出版方华东师范大学出版社的天猫官方旗舰店里,许多买了书的顾客在评价中表示,虽然书本内容清晰易懂,但是书中并没有附带光盘或网站等软件资源,身处非合作学校也接触不到实验平台,无法动手实践,有些遗憾了。

不过,相比其他课本,这本书的一个巨大优点是:

内容易读接地气,配图丰富,排版舒适,整本书都是彩色的。

让人想起当年学不会的高数/大物/模电,整本书密密麻麻,都是黑白文字,除了封面之外再无一点色彩。

希望编写大学教材的老师们行行好,写的稍微生动一点,拯救一下学渣。

汤教授也可以皮一下

除了知识与科普,主编汤晓鸥教授也在书里放了一点点彩蛋。

比如,本书每一个章节页和每一章的开头都会用一个故事或者生活场景作为引子,而故事的主角是一个叫“铭铭”的小朋友,铭铭的父亲是一位著名的人工智能科学家,因此他学到了许多关于人工智能的知识。

而本书主编、著名人工智能科学家汤晓鸥教授的儿子就叫铭铭。

真·孩奴·汤晓鸥教授,的确在儿子身上寄托了很大的希望呢。

另外,作为商汤科技联合创始人,汤教授悄悄软植入了一点产品信息:

在第三章的末尾,介绍图像分类技术的应用时,书中举了帮助警察搜寻犯罪嫌疑人的人脸识别布控系统作为例子。

例子的配图,正是商汤科技的人脸布控系统SenseFace。

品牌曝光×1

此外,量子位还发现了一个小Bug:

DeepMind被强行加了空格,写成了“Deep Mind”。

校对同学本月工资-50RMB。

学AI,那是别人家的高中

高中学AI,这种看似“反常”的事情毫无疑问的引起了一波讨论。

讨论最热烈的是8090后的叔叔阿姨对年轻一代超越自己的担忧。

不少网友在这本书出版后迅速买了一本开(fa)始(peng)学(you)习(quan),担心被00后的高中生们超越,担心二十年后不懂AI的自己饭碗不保。

但引发更多争论的则是:这本书第一批合作的40所学校,都是大城市的顶尖高中,比如北京的清华附中,上海的七宝、格致、交大附中,广州的广雅、执信,西安的交大附中,成都七中,青岛二中等学校。

这些学校所在城市的本地居民都知道,这类学校是一个城市乃至一个省最为知名的顶尖高中了,能够在这些学校就读的孩子,除了极个别天赋异禀的学生之外,多数是既有条件优厚的家庭背景、又足够聪明好学的孩子。

而这些条件优厚的家庭背景,就意味着其父母不说非富即贵,也至少是高学历、高素质的中产家庭。

这让许多人感叹教育资源分配不均,能进入大城市顶尖学校的孩子可以学到包括AI在内的更多新知识,而小镇青年们只能要么进高考工厂深造,要么在教学水平一般的中学听天由命。

但是,这些差距并不是一本书、一门课的差距造成的。

执行主编林达华教授在知乎回应了这种观点:

不过,即使是能送孩子读高中名校的中产家庭,家长也对过于强调素质教育有一些担心。笔者前不久见到了一位家长,他的儿子就读于这本书合作名单中的某知名高中,作为大学教授的他对儿子的高考充满了担忧,害怕过于丰富的课外活动和知识让儿子在未来的高考中败下阵来。

不过另一种声音则显得毫无压力:高中生还没学高数、线代等基础数学知识,也没学python编程,给毫无基础的孩子讲AI,他们不仅任何实践都做不出来,而且可能被揠苗助长。

这些评论者可能并没有看这本书的正文,因为书中一行代码都没有

看,知乎大V轮子哥就非常淡定:

虽然都是学习科技,参观科技馆和学懂数学物理做实验显然难度差了十万八千倍。

这本带有少量专业知识的科普读物就相当于参观科技馆,并不会让中学生开始实际的学习研究,不过对于让他们认识AI、适应可能在几十年后出现的AI世界有一定的好处。

正如这位不在互联网的互联网人士徐先森隐藏在省略号中的意思,二十年后,当00后成家立业,成为社会中流砥柱的时候,还不懂AI可能真的与2038年的时代脱节了。

况且,科普总是能引发年轻人的兴趣,不妨把它视作AI科技在高中生中的一种推广,总会有对此感兴趣的孩子被点醒,或许十年后,他们中的少数优秀学生就会用新的研究成果证明这本书的价值。

量子位在读完这本书后,也想为编者老师们提出一个小建议:作为面向高中生的科普书,可以再补充一些社会认知的内容,比如:

担心AI取代就业岗位怎么办? AI能消灭哪些旧岗位、创造哪些新岗位? 如何理性的看待科技发展、防止陷入泡沫、成为资本的韭菜?

对绝大多数不会成为AI研究者的高中读者来说,这些内容或许可以号召社会更加理性地看待AI这门技术。

说不定,还能拯救几个准备进入终将被AI取代行业的孩子。

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2018-06-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏思影科技

《大话脑成像》之七——假设检验和效果量

费希尔推荐您欣赏这篇文章并关注思影科技! 又到了新一期与读者见面的时候,这期内容可能有点难,有的人会说高端玩家,你膨胀了,你不带我们玩了,不存在的,我还是你们的...

31180
来自专栏数据科学与人工智能

【应用】信用评分卡:逻辑回归

几年前,我和妻子在英格兰和苏格兰度过了几个星期的假期。就在登上英国航空公司的飞机之前,一名空姐告诉我们,我们已升级为商务舱。快乐!度假真是一个美好的开始。一旦我...

22830
来自专栏ATYUN订阅号

Obvious用AI生成艺术画作,以43万美元拍卖价成交

机器是否能创造艺术,这个问题是许多争论的核心,并且已经持续了几十年。但它在市场上是否有价值呢?这一点在今天已经得到了明确的回答,一幅AI创作的肖像画在拍卖中以近...

17430
来自专栏量子位

玩个锤子,李飞飞夫妇团队的最新研究

14020
来自专栏灯塔大数据

塔说 | 麦克阿瑟天才奖得主解码计算机视觉“原罪”:AI 如何认识人类世界

导读:麦克阿瑟“天才奖”获得者Trevor Paglen训练AI算法,他的展览项目“看不见的图像的研究”(A Study of Invisible Images...

35190
来自专栏机器学习人工学weekly

机器学习人工学weekly-2018/2/4

注意下面很多链接需要科学上网,无奈国情如此 1. Google相关的消息: 1.1 TF发布1.5正式版,跟之前提到的RC差不多,主要是增加了eager和lit...

344100
来自专栏企鹅号快讯

人工智能大数据背后的神秘公式:贝叶斯公式

转自:工业智能化 大数据、人工智能、海难搜救、生物医学、邮件过滤,这些看起来彼此不相关的领域之间有什么联系?答案是,它们都会用到同一个数学公式——贝叶斯公式。它...

69450
来自专栏新智元

【CVPR最强参会指南】深度学习走下神坛,中国AI独角兽强势抢镜

19630
来自专栏新智元

2018谷歌学术影响力排名出炉:CVPR进入前20,ResNet被引最多过万次!

【新智元导读】谷歌学术昨天发表了2018年最新的学术期刊和会议影响力排名,CVPR和NIPS分别排名第20和第54。在排名第一的Nature里,过去5年被引用次...

11830
来自专栏新智元

【揭秘】美国天网文档泄露,机器学习算法或错误杀害数千人

从2004年至今,美军无人机的轰炸已经在巴基斯坦的某个地区杀死了2500~4000人,其中绝大多数死者都被美国政府归类为“极端分子”。轰炸对象的选择背后,...

30660

扫码关注云+社区

领取腾讯云代金券