清华-谷歌AI——北京

清华成立人工智能研究院成立后于2018年6月28日举办了为期两天的清华-谷歌AI学术研讨会,我们有幸跟随老师参加了这次研讨会,本次研讨会聚集了众多AI专家及学术大咖,其中中国科学院院士张钹院士、有谷歌人工智能总负责人Jeff Dean、Google云人工智能研发中心主任李佳、麻省理工大学教授,IEEE/ACM FellowBill Freeman、CMU教授,美国MICrONS计划的项目负责人Tai Sing Lee、DeepMind首席科学家Pushmeet Kohli等,其中还有我们一直很是敬仰的李飞飞教授!李飞飞,美国斯坦福大学计算机科学系副教授,目前处于学术休假期,现任Google中国中心负责人。

能跟李飞飞老师合影真的够激动很久

ps:以前小编从来没发现自己高的这么明显

此次研讨会主要就机器学习、强化学习、NLP、计算机就视觉最新进展进行了探讨与介绍。通过了解相关资讯内容,了解到本次研讨会是清华大学大制造人工智能高端交流平台的首次尝试,参与探讨人员阵容豪华,且有涵盖了众多有意思的主题,因外语水平及相关专业能力受限,这里仅能做出简单总结。

其实这也是我在本次会议感受最为受挫的地方,因为参与会议的同龄人都非常优秀,可以做到同学术大咖进行相关问题的探讨,但我还在试图搞明白每一个演讲的大体意思,更别在进行相关思考,落差感非常明显。

类比不同阅读能力的层次,周围的同学已具备基础阅读能力,并且可以做到检视阅读同分析阅读的水平,甚至可能相当一部分人已经可以达到主题阅读水平,而我还在在基础阅读的程度苦苦挣扎。需要努力的地方实在太多,就这一点也十分感谢我的老师能给我们这个机会去参与这样一个高层次的会议,发现自己需要努力的方向。这大概是小编这次出行最为感慨的事情。

研讨会部分内容概要

Illuminating the Dark S pace Towards Ambient Intelligence in AI-Assisted Healthcare

Li-Fei-Fei

李飞飞指出当前在医疗健康领域,由于人类医疗过失导致的医疗事故是一个无法忽视的问题,这一类医疗事故导致死亡人数多过车祸致死人数。而此类人为医疗事故最易发生的场所,诸如医院、养老院等提供医疗保健服务、医者与患者接触最多的场所最易发生此类医疗事故,但现阶段此类场所尚且有较少AI的参与。

传统的应对方案单一简单且难以推广,也难以做到有效监督,李飞飞同她的团队于5年前从自动驾驶汽车技术中得到启发,即将自动驾驶汽车可以做到的利用传感器感知周围环境并做出相应规划的技术应用到医疗场景当中,将AI置于环境中,识别所有人的行动,打开一条不同的AI辅助医疗健康之路。

在演讲中李飞飞从三个方面介绍了医疗环境智能:感知、人类行为识别和整个生态的构建。感知方面,主要是采用计算机视觉技术,结合深度和红外传感器采集数据,跨传感器追踪最后将各数据进行整合,整合出一个3D空间。人类行为识别则采用深度学习技术,对人类活动进行准确识别和监测。研究人员的目标是将采集到的视频信息中所有行为识别出来,辅助医护人员工作。

最后李飞飞还提出将更为广泛的医疗临床数据整合到整个生态中是未来的工作方向,但当前数据的采集仍是一大挑战,因此是在无法得到大数据的前提下进行工作,李飞飞同她的同事采用迁移学习,将医疗信息加入到视频信息生成相关数据,已得到了不错的初步结果。

Using Vision to Improve Speech Understanding

Bill Freeman

Bill Freeman是谷歌研究科学家、MIT教授,他指出,人类在识别和理解人类语言方面具有很强的能力,即使是在嘈杂的环境中,人类也可以在几个人同时说话的情况下区分出想要提取的信息,而这一点对于计算机而言,仍是十分艰巨的任务。

Freeman教授同他的团队尝试模拟人类理解语音信息的模式,让计算机通过“看”来辅助语音识别,大幅度提升了计算机语音识别的能力。

Freeman在本次演讲中,通过许多demo向我们展示了他的团队的研究进程。首先是MIT的研究员发现时频信息可以作为一种视觉的声音信息。在此基础上,使用视觉信息通过计算,加强特定目标人员的语音信息同时抑制其余无关声音,通过这一算法结合计算机语音识别技术即可实现对特定人员语音的识别与理解。demo中现实,他们已经可以实现,选择视频中特定人员,输出该人员的语音信息。他指出这一技术在语音识别、会议转录等应用场景有重要价值。

这一重要研究思路也表明,从一种模态(例如图像)中可能获取到从另一模态(例如声音)很难或不能获取到的信息,若将多种模态获取到的信息进行合理结合,能够达到相互促进的效果。

Enterprise AI: The New Frontiers of Real-word Research

Jia Li

李佳为谷歌云AI研发主管,同时也是谷歌AI中国中心总裁,她主要分享了AI解决实际问题的一些案例,对当前企业AI相关研究背景,指出企业环境提供了许多AI研究课题,但当前存在的很大问题就是在某些领域例如医疗方面疑难杂症,罕见病、少见的自然灾害现象等,都没有充足的数据,无法在一个大数据的背景前提下进行相关研究。

就数据方面而言,想要将AI应用于实际,首先就需要解决数据问题,然而现实世界存在大量未标记、高噪声的数据。而学术实验中使用的数据往往是无噪声、充分标记的数据。因此将实验结果直接应用于实际尚存在距离。并且李佳指出,在一些实际应用中,实验结果的可解释性也十分重要。

之后李佳介绍了她们的研究应用于实际的案例,指出论文已在CVPR 2018发表,是胸部疾病诊断的相关研究,论文题目为:Thoracic Disease Identification and Localization with Limited Supevision.感兴趣者可以查阅文献。他们这项工作有两点意义。一是数据仅需要少量位置注释,二则实现了诊断结果的可解释性。

除以上内容,Quoc Le就Auto ML相关研究内容做出了介绍与总结,他们的研究使得神经网络框架的自动生成成为可能,使用机器学习机器学习,内容十分前沿也很有趣,有兴趣的同学或老师可以查询他们团队的相关工作。Tomas Pfister则是介绍Google应用Gan模型进行语义、姿态理解的研究进展进行了介绍与总结,提出了新的思路与模型,就给出的演示结果可以看出达到了很好的实验效果。当然研讨会当天还有许多有意思的报告,小编只着重记录了几场自己感(ting)兴(de)趣(dong)的内容同大家分享。

经历了入场紧张且大部分听不懂的会议、北京烤人的温度、拥挤的地铁和安排紧张的时间点的疲倦后,在同金龙师兄、木柳师姐相聚北京坐在一起吃饭时,所有的倦意都消失了,仿佛还是从前,偶尔师兄师姐带我们去吃好吃的,同刚刚入学时给我过的生日同样,心绪上稍显局促,但更多的是亲切感跟师兄师姐就在身边的安心感。师兄还是跟之前一样习惯性的叮嘱和照顾,师姐也是下班立刻跑来跟大家相聚,饭后一起骑车回住处,仍似从前,只是并不在校园说完再见去各自寝室,这次的范围,是偌大一个北京城。晚安,下次再见咯~

车票时间的关系,回程的路途紧张刺激,但这次的地铁异常的给力,让我们在发车前二十分钟飞奔到了车站,充满成就感的车站照一定要发。

然后临行前的暴雨昭示着我跟鑫月上哪儿出差哪儿下雨的迷幻诅咒仍旧保留,但经历一路的雨过天晴,路上的彩虹,很惊喜也很圆满。

后记

这次会议其实给我这只研一

即将结束的“小朋友”冲击很大

周围的同学真的非常优秀 差距感相当明显

也很感谢老师带我们参加这次会议

少年啊少年

你才刚刚在路上 并且没走几步,

你要警觉 你要努力。

图文 | 喵~

编辑 | 喵~

哈哈

希望读完本文的你

1

有所收获

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180705G1VLA600?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券