大数据文摘作品,转载具体要求见文末
编译 | 钱天培 寒小阳
作者:Scott Kirsner
MIT热衷于数字,所以就让我用几个数字来描绘一下一门叫6.036的MIT课程的火热程度吧。
这门课由4位讲师以及15助教执教。
讲课地点在26-100教室——MIT最大的讲堂,可容纳566人。
然而据创办这门课的计算机科学教授TommiJaakkola描述,这学期大约有700名学生报名了这门也被称为“机器学习入门”的课程。所以上第一节课的时候,有100多个学生是在一个备用教室观看直播的。
由于主动退出这门课的学生不够多,Jaakkola就整出了一些“预备作业”来筛掉更多的学生,借此让学生们了解到这门课对他们线性代数和概率论知识水平的要求。
为什么这个叫“机器学习”的东西这么火爆呢?它到底是个啥?为了知道这些问题的答案,我在上周访问了32号楼(也被称为计算机科学与人工智能实验室)。
首先,机器学习不是关于如何为工厂制造更聪明的机器人,也不是关于如何为农场制造更高效的收割机。
我们这里谈的机器往往是一台电脑。它消化数据、分析数据、并从中寻找规律。那或许涉及观察成千幅的画作,把他们分为立体派或是印象派;也可能涉及检查几百万张的乳房X光照片,把可能引发癌症的病况与其他病况区分开。
另一位教授这门课程的教授Regina Barzilay提到,现如今放射学大多是基于放射学专家的个人经验的。“有了软件,”她说,“你就可以让机器学到能够区分会得癌症的乳房与健康乳房的特征。”
“机器学习”这个术语与人工智能有着紧密的联系。“实际上我压根就不把机器学习和人工智能区分开。”Jaakola说道,他们都在试图解决同样的问题——自动化系统该如何学习。”(机器学习和人工智能都和MIT有很深的渊源,而这可以被追溯到上世纪60年代。)
如果你曾经在Amazon购过物,用过Google翻译,或是让Netflix基于你之前喜爱的节目给你推荐一台新节目,那你就已经在受益于机器学习了。以Amazon为例,软件研究了你过去买过的商品,你在网站上的浏览记录,以及其他因素,从来把最可能吸引你买的商品放在页面上。
这是一个急速发展的领域。“过一段时间,我就会选一篇以色列的报纸,然后用Google来翻译,”Barzilay说道(他的母语是希伯来语),“翻译的水平逐年提高。现在,翻译一篇文章就和打开电源开关一样简单。谷歌真是太棒了。这一切都发生在了过去的10年间。”用软件来分辨失传的语言是Barzilay在计算机科学领域非常感兴趣的一个项目;她办公室的窗台上放了一块罗塞塔石碑的复制品。(译者注:罗塞塔石碑是古埃及象形字研究的重要资料。)
图为风靡MIT的“机器学习入门”的讲师,TommiJaakkola和Regina Barzilay
By Scott Kirsner GLOBE CORRESPONDENT APRIL 06, 2017
“机器学习入门”这门课涉及了三个课题项目。这三个项目“把学生学到的更理论、更偏重算法的知识与实际的数据与问题联系了起来。”Jaakkola说道。比如,那可能涉及查看一组电影评论,然后开发一个软件来区分好评和差评。
然而在这门课程中学到的技能也能有更高级的用途,比如说预测一种被药剂师研究出用以治愈某种疾病的分子是否对人体有毒——Connor Coley,一个学习了这门机器学习课程的MIT研究生说道。“当你不用再花那么多精力关注你研究出的分子是否有毒或是否能被生产出时,你就有更多的时间来关注你的最终目标了,”Coely解释道。
“机器学习入门”能在2017年如此受欢迎的其中一个理由是,现在有如此之多的公司正在招聘懂得机器学习的员工或实习生。在波士顿,像Facebook,Amazon,TripAdvisor,Spotify,以及芯片制造商ARM,都正在招聘具备机器学习技能的人。
“现在对机器学习的需求可以说是疯狂的。”KatBailey,一个在Acquia(一家波士顿的电子出版社软件制造商)的工程执行官说道。“虽然现在有越来越多的人在学校得到了相关的训练,但市场需求依旧不能被满足。”在Acquia,机器学习或许能被用来将博文在网站上自动分类,或是把博文和其他讨论类似话题的帖子关联起来。
在Wayfair这家波士顿的家装公司,机器学习被用来帮助公司发送有关某个特定促销的邮件——比如说,有关露台家具的促销——给那些最可能购买的人。为了吸引即将毕业和未来几年毕业的学生,Wayfair已经在它湾区的办公区举办校园行活动、以及有关数据分析的夜间论坛。(Bailey曾在Acquia举办过一个叫“波士顿贝叶斯论坛”的活动,目标是吸引对贝叶斯统计在机器学习中的应用的人们。当然他还举办过别的很多活动。)
Wayfair的分析总管Dave Drollette说,他们公司也已经在参与当地大学的课程大纲建议委员会,“这样他们就会知道他们该如何为学生对那些职位作准备了。”
尽管对于懂机器学习的人,现在有大量的职位对他们开放,但像那些成日里检查X光或是翻看法律文件搜寻信息的人,他们又该何去何从呢?机器学习也有可能使得那些需要大量知识储备的工作不在必要。
Jaakkola和Barzilay都是乐天派。“我觉得我们不该为那个人们手动开沟挖渠的年代的逝去而感伤,”Barzilay说道,“现在我们有了挖掘机,它能解放人们去做更有意思的事情。”Jaakkola承认,机器学习和人工智能会对现存的“很容易被自动化”的工作造成影响,但这对孪生的技术也会为我们带来难以想象的便利。比如说,他提到,“你可以让盲人在无需他人或导盲犬的引导下被自动告知他周围的情况。”
“不必担心,”Barzilay告诉我们,“我们还远不至于制造出能写故事的机器人。”当然了,现在已经有软件能够把某个公司的季度收入包装成一个可读物,但他们可写不出《波士顿环球报》中的精美故事。
我希望她是对的,因为这门课的预备作业我可是一道题都答不出来。
原文链接:http://www.bostonglobe.com/business/2017/04/06/what-makes-this-hottest-class-mit/wcAVJfK8U9D64hyVSTTbqI/story.html
关于转载 如需转载,请在开篇显著位置注明作者和出处(转自:大数据文摘 | bigdatadigest),并在文章结尾放置大数据文摘醒目二维码。无原创标识文章请按照转载要求编辑,可直接转载,转载后请将转载链接发送给我们;有原创标识文章,请发送【文章名称-待授权公众号名称及ID】给我们申请白名单授权。未经许可的转载以及改编者,我们将依法追究其法律责任。联系邮箱:zz@bigdatadigest.cn。