MIT新突破:让视频识别模型的训练速度提升三倍

10月10日消息,机器学习使计算机能够识别人脸和医学影像。但当它的任务是解释视频和真实世界的事件时,有可能会让机器学习模型变得庞大而繁琐。

据外媒报道,日前,MIT-IBM沃森人工智能实验室的一个团队已经找到了一种解决方案。研究人员创建了一个模型,可以加快视频识别模型的训练速度,同时也可以缩小模型的大小。

这一研究的关键就在于改变视频识别模型查看时间的方式。当前的模型将时间的流逝编码成一系列的图像,这就产生了更大的、计算密集型的模型。MIT-IBM沃森人工智能实验室的研究人员设计了一个时间移位模块,它给模型一种时间流逝的感觉,而不需要显式地表示时间。经过一系列测试,该模型的执行速度比当前模型快三倍。

时间移位模块使得在移动设备上运行视频识别模型变得更加容易。麻省理工学院助理教授Song Han表示,“我们的目标是让所有人都能使用低功耗的人工智能设备。要做到这一点,我们需要设计出高效的人工智能模型,这种模型能耗更低,能够在有大量人工智能活动的边缘设备上顺畅运行。”

据了解,研究人员将在2019国际计算机视觉大会(International Conference onComputer Vision)上发表他们的研究成果。

通过减少训练所需的算力,该方法也可能有助于减少人工智能的碳足迹。它可以帮助视频、社交等平台发现暴力或恐怖镜头。同时,还可以让医疗机构在本地运行人工智能应用程序,保障了数据的安全。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20191010A0JS7C00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券