专栏首页喔家ArchiSelfDuerOS的零编程技能实现

DuerOS的零编程技能实现

我们正在步入智能语音时代,而DuerOS正在为生产和生活中的智能语音赋能。开发者可以使用DuerOS提高的Bot SDK,像开发Web应用程序那样完成智能语音技能的开发。

从终端用户的视角来看,技能就是一个个具体的智能语音应用;从开发者的视角来看,技能就是支撑智能语音交互的后台应用。程序员改变世界,那么,如何没有编程能力能否实现智能语音应用呢?

在DuerOS Bot Platform(DBP,https://dueros.baidu.com),答案是肯定的。

目前,DBP平台提供了4种零编程就可以实现的智能语音技能,只要你会一般的计算机操作,就可以无需编码实现智能语音技能,进而在小度系列的智能语音产品上享受自己的成果。

小技能

小技能是DuerOS 平台自动为用户生成的技能,在限定交互场景之后,开发者只需提供内容,即可在小度系列的智能语音设备上播放这些内容。

目前小技能功能包括话术类、音频类,图片类和视频类的小技能,播放方式约定为顺序播放,随机播放和播放一个之后关闭。

话术类小技能

话术小技能是指开发者仅在技能开放平台上配置文本内容,DuerOS就可以生成对应的小技能,将文本内容播报出来。

在开放平台上面填写文本内容。每个技能最多支持100条文本。支持在线填写和批量导入两种方式。开发者还可以为每条文本内容配置背景音乐和图片。

应用场景示例:小知识、小笑话等。

音频类小技能

音频类小技能是指开发者在技能开放平台上配置音频资源后,DuerOS自动生成将音频资源按照配置的方式进行播放的技能。

配置音频包括配置音频资源,选择播放模式和配置音频切换话术。当选择顺序播放和随机播放模式时,可以配置切换话术支持用户主动切换音频。系统默认配置了一些切换话术,也支持添加自定义切换话术。

应用场景示例:场景音乐,个性化祝福,自定义歌单等。

图片类小技能

图片类小技能是指开发者在技能开放平台上配置图片资源后,DuerOS自动生成将图片资源按照配置的方式进行图片播放的技能。

上传图片,支持本地添加和资源管理添加两种方式。本地添加的资源也会展现在资源管理中,目前只支持PNG或JPG格式。在没有用户表达的时候,图片会进行自动的轮播切换。

应用场景示例:家庭相册,旅游记忆等。

视频类小技能

视频类小技能是指开发者在技能开放平台上配置视频资源后,DuerOS自动生成将视频资源按照配置的方式进行播放的技能。

配置视频包括配置视频资源,选择播放模式和配置视频切换。在选择顺序播放和随机播放模式时,如果不配置视频切换,在当前视频播放完后,会继续播放下一个视频,用户无法主动切换视频。

应用场景示例:聚会纪念的MV,观光风景,小纪录片等。

需要注意的是,音频类资源目前只支持MP3格式,视频类资源目前仅支持MP4格式。小度智能音箱只支持话术类小技能和音频类小技能,在小度有屏设备上支持所有类型的小技能。

内容播报类技能

通过内容播报类技能,用户可以通过技能订阅新闻资源和有声资源。其中新闻资源包含时政、财经、社会、娱乐等,这类资源的时效性较强,更新频率比较快。有声资源包含脱口秀、小说、广播剧、历史、人文、有声书等,这类资源时效性不强,更新频率相对较慢。

以新闻数据为例,在这类技能中,开发者仅需将资源按照新闻数据的格式提供到DuerOS平台中即可。新闻数据不仅仅会被技能名称调起,在开发者授权后,也会被推荐到DuerOS的其它新闻渠道中。

新闻数据既可以手动上传资源文件,也可以通过XML的形式来提高数据源,具体XML 的格式参见。文件要求是UTF-8格式,即encoding="UTF-8"。每个文件要小于10M,且每个文件中记录不能超过50000条。如果文件大于10M,或者记录数超过50000条,需要将文件进行拆分,并保证拆分后的每个文件满足上述条件。最后将拆分后的文件的URL地址,整理成一个新的文件即可。

相对于小技能而言, 内容播报类技能提供了持续的内容更新能力。

故事探索类技能

故事探索类技能在DuerOS平台上是固定角色扮演的对话式游戏,通过游戏编辑器(故事工厂)无需编程就可以实现此类的技能。

游戏编辑器把此类技能抽象为为场景、状态和关系三个部分。

场景通过图片、文字和语音描述了故事的环境、事件、人物、对话等内容。场景通过游戏编辑器中的节点编辑它的内容信息,主要是配置场景中所要播报的语音,有屏设备展示和无屏设备展示可以配置场景所需的标题、文本、图片等内容。

状态是故事中人或物的属性,用来描述故事分支剧情的多样性。在故事的开始设置各个状态的初始值。

关系是场景之间的链接,涵盖了进入的条件和进入新场景后的状态更新。Query条件是主动进入条件,用户通过Query与故事互动来进入下一个场景。状态条件指在当前场景中状态满足某些条件时才能进入下一个场景。

具体的操作示例可以参考故事工厂在DuerOS技能开发中的应用——百度2019AI开发者大会DuerOS公开课摘要解读之四

自定义内容回复技能

开发者可以创建自定义技能为用户提供各种服务,如提供天气预报、百科常识、互动游戏、订购物品等。用户只需要语音交互就可以获得相应的服务。

自定义的技能涉及到交互模型的建立,具体可以参考

针对指定的意图,开发者可给出“自定义回复”,将回复的逻辑托管的DuerOS平台,从而实现零编程的自定义技能。

自定义回复可以是文本,也可以是开发者预先录制好的音频。DuerOS回家自定义的文本通过TTS技术在智能语音设备上播放出来,对录制好的音频的音频可以直接播放。

小结

文中给出了4种技能生产方式:小技能、内容播报技能、故事探索类技能和自定义回复技能。这四种类型的技能都是可以零编程实现,无需部署,完全建立在DuerOS Bot Cloud 之上,开发者只需携带着自己的内容和创意,就可以在DuerOS 开放平台上定制出丰富多彩的智能语音服务。

随着DuerOS 不断演进,更多的零编程技能类型,以及更多高效的技能编程方式将不断涌现,敬请期待。

本文分享自微信公众号 - 喔家ArchiSelf(wireless_com),作者:老曹

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-11-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • “他山之石”,语音技能开发的10个要点

    语音技能的构建既是一门艺术,也是一门科学。开发智能语音技能有一些技术方面因素,还要有设计语音体验的创意,两者都很重要。

    半吊子全栈工匠
  • 调试DuerOS的智能语音技能

    进入了智能语音时代,我们都已经熟悉了如何在DuerOS 上开发一个智能语音技能应用,典型的流程如下:

    半吊子全栈工匠
  • 在校大学生能成为DuerOS 的独立开发者吗?

    答案是肯定的。在去年百度开发者大会上,中学生都可以成为DuerOS的独立开发者。只要你会用Javascript(nodejs)或者python 编程,有一台可以...

    半吊子全栈工匠
  • 广泛vs狭窄的技能树:软件工程技能揭秘

    每个软件工程师都有自己掌握的技能。如果你掌握了一到两种技能,而其他的技能却很少,那么技能就是“深而窄”;如果你能在不成为任何领域的专家的情况下做一点事情,那就是...

    汐楓
  • 未来什么职业最赚钱!LinkedIn 2017年美国新兴职业报告

    新的职业种类对于所有水平的工作人员来说都拥有着新的可能性,这对于正在职场转型的职场人士意义更为重大。

    华章科技
  • LinkedIn发布2020年“最需要硬技能”TOP10,区块链荣登榜首

    工作最看重哪些技能?LinkedIn Learning从660万+专业人士和20万+工作网络中分析出了有效的数据,以揭示2020年最需要的10种硬技能和5种软技...

    AiTechYun
  • 调试DuerOS的智能语音技能

    进入了智能语音时代,我们都已经熟悉了如何在DuerOS 上开发一个智能语音技能应用,典型的流程如下:

    半吊子全栈工匠
  • 在校大学生能成为DuerOS 的独立开发者吗?

    答案是肯定的。在去年百度开发者大会上,中学生都可以成为DuerOS的独立开发者。只要你会用Javascript(nodejs)或者python 编程,有一台可以...

    半吊子全栈工匠
  • 数据科学人才: 如何顺藤摸瓜提高你的竞争力

    摘要 基于一项针对620多位数据专家的调查研究,我们发现数据科学技能分为三个分支:行业知识背景(本文特指商业),技术/编程和数学/统计。这项研究将影响目前数据科...

    CDA数据分析师
  • Exchange中限制部分用户外网访问

    最近遇到一个需求,公司某业务部门需要让本部门一部分员工不能通过公网使用Exchange邮件系统。然后,公司邮件系统是发布公网使用的,要直接限制部分员工不能外网访...

    李珣

扫码关注云+社区

领取腾讯云代金券