今日,微软宣布自定义语音服务成为加入微软识别服务行列的最新程序。自定义语音服务是一款可以高度灵活地把语音转换成文字的程序,它可以被认为是更智能版的Siri或Google Assistant。
自定义语音服务结合了两种尖端技术来实现。第一个技术被称为CRIS,即自定义识别智能服务。微软称,该服务为公司提供了部署定制的语音识别的能力。
开发者可以通过上传音频文件样本,将识别器根据特定环境进行自定义。在不同的环境下,比如工厂或户外,这可以使用户获得更好的识别。这意味着CRIS能够使给定组织通过构建自己独特的词汇语音指令来进行语音命令。
与CRIS一同加入微软识别服务行列的是LUIS(语言理解智能服务)。LUIS被微软描述为一个“目的引擎”,它能够帮助计算机理解用户言语背后的意义。比如,发生在当前的语音指令可能是一个特定的词或短语,但计算机需要由程序员映射到一个给定的行动。
“找到咖啡”或“给我咖啡”都将打开你的地图应用程序并直接指向附近的咖啡店。开启LUIS,你可以使用“找到咖啡”、“带我去喝咖啡”、“我需要咖啡”、“我需要提神”、“我不能让我的眼睛睁开”等多种说法来找到一个咖啡店。
LUIS被用来了解用户的目的是什么,而不仅仅是用户说了什么。有了它的帮助,程序员可以花费更少的力气,来处理更多的可以被用户使用的语音指令。
自定义语音服务虽是一种服务,但微软自身并不一定会围绕这个服务构建产品。这种工作将由类似Human Interact这样的VR内容工作室完成。
Human Interact的最新上市项目Starship Commander,是一款充分利用微软新技术,从而用声音操控进行体验的VR游戏。该款游戏将带来目前在沉浸式应用程序中,最为复杂的语音交互引擎。
Starship Commander比拥有立体声的游戏更加重视交互性。用户将扮演一艘星际飞船的飞行员,其任务则由一台超级计算机和全息上司下发。你可以同这两个角色对话,并通过不同的语音指令的分支选项来探索世界。
CRIS在Starship Commander的应用
Starship Commander是通过CRIS 和LUIS构建的。因此,游戏中的人物都能够理解和应对关于飞船和外星人的特定词汇。即使用户没有给出准确的措辞,LUIS也能够正确地理解并映射到一个给定的结果。“让我们继续”、“继续推动故事发展”,你可以通过不同的说法推动游戏进行。尽管特定组合的单词没有连接到特定的命令,但使用了微软新技术的引擎能够根据用户的目的映射出结果。
用声音控制的VR游戏无疑会带来更好的沉浸感,你可以与虚拟人物进行更多交流。游戏角色的好感度系统也可以进一步拓展,以带给玩家更真实的游戏体验。