4月4日上午10时,ACM Fellow、IEEE Fellow、腾讯机器人实验室“Robotics X”负责人张正友博士接受信息科学与技术学院吴晓教授邀请,来我校作题为“人机智能交互与机器人展望”的学术报告,分享他在人机交互、人脸表情识别等领域的核心技术研究。讲座由信息科学与技术学院、科学技术发展研究院以及信息化与网络管理处共同主办,信息科学与技术学院院长助理吴晓教授主持报告会。
张博士首先回望了人机交互的发展过程以及当前研究成果。他指出,可识别的智能交互系统将会为用户提供更加人性化的服务:在他及其团队的努力下,自带摄像机和麦克风的机器人诞生了——基于视觉,人脸识别,人机交互语音等技术,它可以听到用户的声音并且看到人们的表情。
如何做到有情商的人机交互?在张博士看来,只有考虑到用户的表情,理解人的表情,人与机器才可以做到更加融洽的交互。而表情识别研究在诸多领域有着深刻的实践背景。张博士提出情商有4种分类,而这是一个认识自我与他我的过程,有了情商才可以像人一样进行交互情感,但从计算机来理解情商还有很长的路要走。
讲座上,张博士与大家分享了20多年来智能化人机交互中的人脸表情识别技术的研究历程。在日本工作期间,张博士便开始研究人脸表情识别技术,而他也是世界上第一个采用神经网络做表情研究的学者。随后,张博士重点介绍了人机交互中的重要组成部分:置信点集的几何位置和这些点的多尺度多方向Gabor小波系数,二者既可以独立使用也可以结合使用人脸特征提取是为了找到人脸最合适的表示方式。在微软工作期间,他与团队设计了Emotion API表情识别系统,从图像,中得到人们的表情,原来的想法便是从语音等浅层信息中进行观察,而后来便是结合深度信息,即从身体变化,语音等多角度来观察一个人的表情与感情,将多种信息结合起来,通过API来进行私人助手等多种运用。
在张博士看来,“Robotics X”实验室旨在创建人与机器和谐互助的未来,不断增强人的智力,关怀人的情感以及发挥体能潜力:“我对人工智能的发展持乐观态度,我不认为人工智能的发展会威胁到人类的发展主导地位,相反,人工智能的发展则是为人类社会提供新的发展动力。”同时,他从人工智能的科研前沿视角回答了学生们所关心的人工智能“威胁论”。讲座最后,张博士就表情研究的科研等学术问题与现场师生进行深入的探讨。
作为学校深入推进和实施数字化战略的启动会议,邀请张正友博士来校讲座充分体现了学校对于数字化战略工作的重视和信息科学与技术学院在信息化专业领域中的号召力。张正友博士是世界著名的计算机视觉和多媒体技术的专家,在立体视觉、三维重建、运动分析、图像配准、摄像机自标定、人脸表情识别等方面都有开创性的贡献。Google Scholar论文引用次数近44000,单篇最高引用次数超过11000次。他发明的平板摄像机标定法在全世界被普遍采用,被称之为“张氏方法”。张正友带领的微软研究院视觉团队在学术研究上做了大量的工作,除在国顶顶尖会议(比如CVPR、ICCV、ACM Multimedia)上发表了大量文章和几部专著,而且在微软很多产品里都有团队的贡献,比如Windows、Office、Xbox、Kinect、Skype for Business、Office Lens等。张正友是国际顶级会议CVPR 2017大会共主席,担任多个国际顶级期刊编委和国际著名会议大会主席和程序委员会主席。
编辑:徐一航
西南交通大学信息科学与技术学院in传媒
领取专属 10元无门槛券
私享最新 技术干货