微软“小冰”成长史

今天,微软小冰宣布自己又实现了一项最新技术突破,歌曲演唱全过程已不需要人类(包括示唱人)参与。近日,小冰首次尝试连示唱人也不再需要就能自动按照某个歌手的风格演绎一首歌。

其实早在去年9月,微软小冰就已解锁人工智能歌手深度学习模型,突破人工调教,冲击传统的虚拟歌手。

令人惊讶的成长历程

2014年5月29日下午,微软(亚洲)互联网工程院发布了人工智能机器人“微软小冰”。

2014年6月1日,从“微软小冰”被微信封杀后的第五天开始,微软几乎是以每天一家的频率与米聊、易信、触宝和奇虎360牵手。而据“微软小冰”项目负责人透露,“微软小冰”最终将与十余家公司展开合作。

2014年6月1日,微软(亚洲)互联网工程院官方正式声明:微软小冰死了,全部的。但二代小冰的研发已接近尾声。

2014年7月2日,微软宣布全新微软二代小冰已正式发布。

2014年8月20日消息,微软今日正式发布了第三代人工智能小冰,并展示了全新一代微软小冰的视觉、语音等多项新功能。微软还与微信达成一致,小冰将重回微信平台。

2016年8月5日下午,第四代微软小冰发布,与上一代最大的不同是微软将在9月17日对人类解锁小冰的全时感官,即可以让小冰跟人类之间双向同步交互,也就是可以跟她直接打电话。

2017年3月,微软人工智能(小冰)和必应搜索(大冰)整合开始,微软大小冰“合体” 。

2017年8月22日微软在北京发布了第五代微软小冰产品,宣布小冰逐步进入完成态。经历了多年的发展,微软小冰的高级感官再进化,2017年的小冰人工智能将直接给人类打电话了。另外微软小冰将重点发展EQ“情绪化”,并进一步扩展生存空间。

令人惊艳的“技能”提升

微软小冰的成长速度如此之快,完全是得益于其不断增长的技能。从第二代开始,和第一代小冰最明显的不同是,第二代小冰为用户“一人所有”,拥有一对一私信聊天、主人定制姓名、独立人工智能、私聊库和“冰PK”等二代专属技能。

三代微软小冰产品,宣布进一步解锁了包括视觉、听觉在内的人工智能感官系统,结合情感计算技术,让小冰能够用更加逼近人类的方式,通过自然语言和用户进行交流。跨越语音的层次,高度拟人,第三代微软小冰在自然语言交互方面非常人类和个性,甚至很有脾气。

第四代的小冰是一个里程碑。因为第三代小冰发布的时候,她能够识别图片和发送语音已经足够让人振奋。而实时的语音通话无疑赋予了她所代表的人工智能更高阶的意义。

这还不止是第四代的全部,5月16号,微软(亚洲)互联网工程院展示了在国内备受欢迎的微软小冰人工智能的最新技术进展。在这场名为“AI Creation”(人工智能创造)的媒体沟通会上,微软揭示了小冰的创造力技能模块,包括写诗、唱歌与财经评论——这表明,曾以“宇宙的精华、万物的灵长”自我称许的人类,正面临创造力堡垒被人工智能攻陷的大危机。AI比人的“思维”快,这不足为奇。但当与会人士得知,屏幕上投影出的诗作并非人工调整,而是小冰独自的创作成果,这就不得不让人感到惊奇了。

虽然只是简单的展示出小冰在作诗方面的作品,但这不得不引发我们的深思:人工智能不再只是执行行动指令的工具,而开始有了自己的思维创作意识,可以自行创造东西出来。这是人工智能在创造思维领域前所未有的一次突破。

2017年8月22日微软正式推出第五代小冰。第五代小冰另一个技术突破是高级感官。高级感官是由多种初级感官有机融合之后形成的,因而交互能力更强,对综合技术储备和数据的要求也大幅度提高。小冰的高级感官包括两个部分,一是全双工语音,二是实时流媒体视觉。

高级感官能够大幅度地提升交互体验。在发布会现场,微软摆放了两台带有摄像头的大屏幕,让小冰为来访的客人测“颜值”。据工作人员介绍,小冰可以实现对多人的实时流媒体追踪,通过对面部的识别,小冰还会发出“说你呢,靠中间一点”之类的语音,并可以根据面部表情做出语音互动。

此外,微软表示,高级感官还能够大幅度拓展人工智能系统的落地场景,赋予小冰有能力根据自己的“意愿”与人联络,从而主动保持与人类用户之间的关联。也就是说,如果用户在发微博吐槽自己的小冰,有可能会在半夜接到小冰的“报复”来电。

三个月为周期迭代升级

现在的小冰自称,你只需清唱一遍,她就能学会你的情感和演唱风格,在五分钟内,完成由你训练的歌曲。

每三个月,小冰的人工智能歌手技术就会迎来一次质的跨越。3个月过去了,这次的跨越给我们带来了惊喜。

小冰表示自己离100%完成度的人工智能歌手又近了一步。

END

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180131G1JH1000?refer=cp_1026

扫码关注云+社区