数据教学不如先从本科生“下手”?

近年来,互联网发展之势汹涌澎湃,人工智能等新兴科技也方兴未艾。这些领域无一例外地需要海量的数据作为支撑,同时自身也会产出庞大的数据以待处理。与之相应的数据科学能力受到国内外高校极大重视。本文主要介绍美国伦斯勒理工学院在培养学生数据科学能力方面的新旧举措。

信息化的社会无时无刻不在产生体量庞大的数据。“每分钟,谷歌要翻译6950万个单词,脸书上有将近22万张照片上传分享,而YouTube上的视频内容将增加400小时,相当于24000人不间断地视频直播自己的生活。”兰迪•博芬罗斯在2017年美国工业与应用数学学会的年会上说道。海量的信息数据推动了数据科学领域交叉研究的迅猛发展,这不仅改变了数据研究专家处理数据的策略,也促使越来越多的高校将数据科学课程与传统数学课程相结合,为学生提供前所未有的学习项目,以便他们能在今后从容面对不断变化的现实挑战。

博芬罗斯是伍斯特理工学院数学科学系的副教授。早在2014年,伍斯特理工学院就推出了面向硕士研究生的数据科学项目,由学校的数学科学系、计算机科学系和福西商学院联袂打造。这一项目既独立于三个院系又蕴含三个院系各自的特点,旨在培养学生的数学分析能力、数据获取与管理能力、数据挖掘能力以及商业思维。

从本科生入手

同时参加这次工业与应用数学学会年会的还有伦斯勒理工学院数学教授克里斯汀•本尼特。在学生的数据科学能力的培养上,伦斯勒理工学院同样不甘人后。

2014年,伦斯勒理工学院开展了自己的数据科学项目,即美国国家科学基金会资助的“本科生数据分析数学项目”(以下简称“DATUM”)。DATUM包括一门介绍数据科学所需基础数学知识的数据数学导论课、夏季研究项目、数据分析和建模课程以及顶点课程等。同年,本尼特教授主持建造了数据实验室以探索如何利用智能技术应对交叉学科的挑战。这一实验室的建立为该项目争取到了不少工业界的支持和同行高校的协助。

该项目允许大一下学期的学生参与,并且对学生的要求仅仅是了解一些基础的微积分知识,因此,导论课程的内容设置就显得尤其重要。“教师团队确定导论课内容的标准是所教的知识是做数据分析必须具备的。”本尼特表示。由于项目的核心任务是对包罗万象的实际问题进行数据分析研究,因此,包括线性代数、最优化、多元微积分、统计学等多种多样的数学知识都根据需求进入了导论课的范畴。而这些知识往往需要数学专业的学生花数年时间逐步消化吸收。可想而知,教师们需要从需求出发,以数据分析为前提,对所教内容进行取舍,不求面面俱到,但需深入透彻。

值得一提的是,虽然是导论课,但教授方式却非纯理论讲授,而是理论配合小型项目进行,以便学生在实际操作中掌握基础知识。比如,学生在导论课上会使用计算机建模来预测不同化学物质相互反应的结果,从而完成药物设计的任务。“学生们对学习项目兴趣浓厚,总想用新知识去解决新问题。实践证明,把不同学期的学习内容整合在一起进行教授是行之有效的。”本尼特这样表示。

顺利完成导论课的学生就有资格参加夏季科研,利用真实的数据进行数学建模并加以分析研究。学生参加的科研项目包括分析高端制造技术、阐释昼夜交替在生物医药领域的影响,以及根据乔治湖化学成分的变化来分析生态意蕴等。“科研肯定比数学课要艰深晦涩,我们让学生接触并专注于高级的数学方法和工具,其核心就是学习如何把抽象、复杂的现实问题通过数学工具进行表达,再加以分析研究。”本尼特说道。

同时,学校还希望通过夏季科研的锻炼,学生能够适应在不同学科背景的团队中合作,能与同伴顺畅沟通并且可以提出有价值的问题。实际情况证明,学生在学业初期参加科研项目能有效激励学生刻苦钻研的精神,引起学生探索求新的兴趣。“参加DATUM项目的学生有一半左右都加入到了夏季科研当中。这一研究是学校和企业共同开展的,学生不仅能获得报酬,而且能积累经验,为以后的发展奠定基础。”本尼特表示。

美国国家科学基金会对DATUM项目的评价报告引述了第三方机构的表述,“DATUM的导论课和夏季科研经历对学生影响深远,他们把自己的兴趣(专业)与数据分析相互融合之后,更加宽广的职业道路跃然而出。”

人人都要“挖”数据

科学技术日新月异,社会对数据人才的需求也与日俱增。2017年,美国商业与高等教育论坛发布的一份市场分析报告预测,到2020年,美国数据科学的相关岗位将稳步增长并达到每年272万左右,数据逐步成为建造未来世界的基石。借助多年DATUM项目的成功经验,针对全校所有本科生的最新核心课程,伦斯勒理工学院提出了“数据灵巧”要求,以期所有学生都能利用种类繁杂的数据,描述并解决现实问题,培养出未来世界的“建筑师”。这一全新的核心课程体系将从2019年秋季开始实施。

在新核心课程的制定上,学校五个学院的教师群策群力,突出了专业教学与课外学习并重的特点,体现了学科交叉的重要性。除了“数据灵巧”的要求外,学生还需要完成一门课外顶点项目、参加校外实践、参与学术与文化课外活动、加入阅读计划等。同时,学校还改进了现有的社会学课程和沟通技能要求,希望学生具备创造性思维和批判精神,还能立足自己的专业领域有机地结合其他学科知识。显而易见,在当前科技高速发展的背景下,数据科学能力是学生融会贯通多学科知识解决实际问题的必备技能。

“数据驱动着社会的发展,未来的领袖必须能利用数据从容应对挑战。学校推出的‘数据灵巧’要求是目前许多高校‘数据素养’的强化版本,核心目标是让学生借助数据作出决策,区分数据的因果性和相关性,掌握从浩如烟海的数据中提炼关键机制的能力,以及树立不滥用数据的观念。这些是我们每位毕业生都要具备的能力。”学校校长雪莉•安•杰克逊这样阐述。

“数据灵巧”要求学校所有本科生完成两门数据科学课程的学习。一门借用DATUM项目的导论课形式,为学生的数学建模和分析能力打下根基;另一门则与学生所学专业相结合进行讲授。新增的课程并不会增加学生毕业所需完成的课时数,而是与已有课程进行融合,强化数据科学能力的学习。同时,对于学有余力且有志于进一步深入数据领域学习的学生,学校还研发了后续课程,包括基于学校建设的实验室与工业界人士联合教学等。

学校教师大多对这一新要求深表赞同,“这一举措的落实激动人心,在平日的研究工作中,我们的教师和研究生已经运用了先进的数据分析工具和机器学习的技术,现在本科生也能接触并学习这些新技术,这让学生和学校都受益匪浅。”学校数据探索与应用学院院长吉姆•亨德勒说道。

结语

数据科学项目的顺利开展绝非易事,它牵涉到校内诸多教学部门的协调配合。或许就如同伍斯特理工学院博芬罗斯副教授建议的那样,把该项目脱离于任何学院的管理而作为学校层面的交叉学科学习项目是最可行的实施办法。此外,诚然当前数据科学领域发展迅速,社会需求大增,但冰冻三尺非一日之寒,高校当以长远发展的目光来开展数据科学项目,根据自身情况,建设有机的体制,从底层做起,逐步完善。“关键在于改变传统教学,特别是数学教学的模式,目标不必太远大,但要从目标需求倒推教学内容的安排。”本尼特建议。

主要参考文献:

[1]Sorg,Lina."Integrating Data Science in Applied Mathematics Curricula". The Siam.September 25, 2017. Web.

[2]Martialay, Mary."Rensselaer Introduces First in the Nation 'Data Dexterity' Requirement for All Undergraduate Students".RPI News . March 22, 2018. Web.

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180719A1DT6F00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券