展开

关键词

AI赋能产品:如何寻找语音交互的业务场景

过往18个月,大家定期就会围坐一个圈,开头脑风暴会议,思考有哪些场景适合语音交互?从普罗大众的高频刚需到特定行业的细分场景,大家轮流发言,想到哪里哪里,不打断不评价,每时每刻都在寻找创业场景。 厨房里面有点播做菜视频,厨房用品的需求。 医院的卫生间和病床上,病人移动不便,使用语音交互是没有压力的。 滑雪场上穿着滑雪服,相当多时候需要用到通讯设备进行交流。 我们来看下面几个案例 image.png 厨房蔬菜就不太合适,是因为蔬菜是非标品,品类和新鲜程度存在太多的人为主观接受及条件筛选。 但酱油就可以,最多加一个品牌作为复合查询条件,并且商品的尺寸大小无所谓,决策压力较小。很多的人其他的调料(醋、盐、鸡精等)几乎也没什么品牌需求,能用就行。即标准品,用户接受默认选项。 笔者负责任的说,任何业务都可以有语音交互的解决方案,只是看合适合适。 综上,创业公司在选择业务场景的时候,通过上述条件要素筛选,更容易筛选机会。

34283

面向NLP的AI产品方法论——寻找语音交互的业务场景

过往18个月,大家定期就会围坐一个圈,开头脑风暴会议,思考有哪些场景适合语音交互?从普罗大众的高频刚需到特定行业的细分场景,大家轮流发言,想到哪里哪里,不打断不评价,每时每刻都在寻找创业场景。 厨房里面有点播做菜视频,厨房用品的需求。 医院的卫生间和病床上,病人移动不便,使用语音交互是没有压力的。 滑雪场上穿着滑雪服,相当多时候需要用到通讯设备进行交流。 用户使用语音的前提。一个是不得不,一个是更便捷。我更希望大家从更便捷的角度去考虑,而不是不得不,所有的不得不,人类都有办法。 通过第一层场景选择后,第二层是业务选择,判断哪些更合适。 ? 厨房蔬菜就不太合适,是因为蔬菜是非标品,品类和新鲜程度存在太多的人为主观接受及条件筛选。但酱油就可以,最多加一个品牌作为复合查询条件,并且商品的尺寸大小无所谓,决策压力较小。 笔者负责任的说,任何业务都可以有语音交互的解决方案,只是看合适合适。 综上,创业公司在选择业务场景的时候,通过上述条件要素筛选,更容易筛选机会。

29320
  • 广告
    关闭

    语音识别特惠,低至1元!!

    为企业提供极具性价比的语音识别服务。被微信、王者荣耀、腾讯视频等大量内部业务使用,外部落地录音质检、会议实时转写、语音输入法等多个场景。

  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    黄学东:微软“全武功”解决企业会议的痛点

    语音识别在现在的媒体阶段,是文本输入还是语音输入还是图像输入?基本上还是一个相对比较松的耦合。 ,而且把语音识别第二好的结果也考虑进去。 第二是定制服务增加了语音合成,想要换成自己想要听的声音,可以上传三个小时、十个小时,越多质量越好,可以定制到你想要的声音。所以我们全线语音和翻译都实现了量身定制。 人工智能产品怎么更成功的被市场接受,让消费者更容易去掏钱?如何落地和激活?为什么这次和微软合作语音的开发及机会在哪里?微软的技术怎么独特的激活这个市场? 雷宇:其实这两个问题是一个问题。 黄学东:语音交互过程中,在所有的商业场景中,用电子邮件、微信等等其他的产品都已经数字化了,会议中的语音是现在没有数字化的一个主要媒体,这对生产力的提高、对消费的提高是最后的痛点。

    41350

    Human-like learning在对话机器人中的魔性运用 | 牛人讲堂

    然后它如何知道第三方App能完成哪些任务,需要点击哪里,然后才能与用户想做的事情对接? 当它的重心变成了为用户完成任务时,它的核心技术要求是什么? …… ? 这类问题,显然无法直接通过一个端到端的框架来进行训练和学习,而是首先需要针对问题本身进行建模,然后在这个基础上再寻求合适的学习方法。 接着上面问题:二是知道第三方app都可以完成哪些任务,需要点击哪里,然后才能与用户想做的事(语义理解)进行对接。 ▎这个你们用什么应用内搜索技术解决的? 比如“飞机票”的过程:有人会去网上,有人会打电话,有人会去柜台;有人很固执,只要满足其所有既定条件下的机票;有人犹豫不决,不停地对比,边询问边考虑;更多的人是有一个基本优化目标,比如价格要尽量低 如果从应用的角度来看,当然合适的方法是要考虑语言问题的各个侧面,融合逻辑,知识和统计的力量才能获得有效的进步。

    41350

    面向NLP的AI产品方法论——如何通过数据分析迭代优化

    出门问问这一块做得比较细致,页面层级比较深,期望用户能够给予更精准的反馈,到底自己的AI助手哪里做的不够好。 找出正常的用户后,进行分析统计,比如4个槽位,仅仅填充了2个,用户努力对话几轮后,放弃掉了,哪里卡住了,哪里半途放弃了,这种就非常值得研究。很容易形成一个数据漏斗,看看问题主要集中出现在哪。 案例一(飞机票时,用户切换技能后下单) 用户在飞机票的时候,我们发现相当一部分用户会(担心延误)查看天气,这个是用户的购买决策依据,所以这个就给了我们启发,不要让用户问,在查询机票的时候,就直接一并显示天气情况了 案例二(电影票时,用户口语习惯) 电影票刚刚上线那段时间,发现大量用户在填充电影名词槽那里卡住了。 关联阅读: 一篇文章深入理解VUI和GUI的优劣对比 面向NLP的AI产品方法论——寻找语音交互的业务场景 面向NLP的AI产品方法论——如何设计多轮语音技能 面向NLP的AI产品方法论——如何做好

    30810

    【玩转腾讯云】文本转语音介绍

    简单的文字转语音的解决方案 语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。 产品的优势: 高拟真度 腾讯云语音合成系统使用业界领先技术构建,具备合成速度快、合成语音自然流畅、合成语音拟真度高等特点,可用于多种应用场景,让设备和应用轻松发声,人机语音交互效果更加逼真。 语音播报 在语音导航应用、新闻类 App 中,语音合成可以快速生成高质量的播报音频,方便在用户行走、开车等不方便阅读消息的情况下,利用音频及时获取信息。 图片.png 这里是你的使用情况,如果你是第一次使用,那么腾讯云会赠送一个新手包,一个包含800W字符的额度,有效期是3个月,这除非你是要朗读小说,否则你3个月是用不完这个额度的.如果觉得合适,你就可以增量包了 如果您同时购买了多个付费资源包,则按照购买时间的先后顺序进行扣减,先的先扣。 增量包的价格如下: 图片.png 那么现在我需要借用这个平台读一段话,那么我该怎么操作呢?

    2.1K2423

    我们可以从Alexa语音助手的错误中学到什么:用户对话界面的设计性挑战

    语境同样与上则娃娃的新闻故事息息相关,如果Alexa已经辨认出其正处于电视节目的环境中(主持人假装想要娃娃的小女孩时使用的是过去时态),那么Alexa就不会采取行动。 这是我们在人际交往中认为理所应当的事情,比如对方可以记住我们在哪里、正在做什么包括我们刚刚谈到的所有一切。毕竟,你可能不会花太多的时间与一个不记得你最近给他说过什么的朋友交往。 与图形用户界面所达到的即时性和反馈不同,对话界面需要时间接受所有的语音信号并且知道在作出回复之前输入语音已经结束,然后用户须收听整个回应来判断界面回应的准确性。 接下来,我们应该向哪里努力? 我们需要学习如何创建自然对话方式,替代现有的图形界面。对话本身是没有改变的,我们必须向人类已创造的人际交流直觉机制致敬,毕竟我们无需要求他们重新学习这项技能。 一个理想的交互世界可能看起来更加变化多端:能无缝对接各种最合适类型的交互界面来达成给定的任务。

    23120

    2019年,这11个数字营销趋势不容忽视!

    随着购买历史记录、消费者行为和点击链接等数据得到运用,定制化内容变得更加容易。事实上,96%的营销人员认为个性化可以促进客户关系。 例如,登录你的Netflix账户,马上就会看到各种为你量身定制的个性化内容:横幅广告、轮播、订单、艺术品、文字和搜索等。 正如他们所说:个性化=最大的享受+最少的搜索时间 ? Pinterest也毫无意外的加入了视觉搜索行列——他们推出了Lens,这是一款新的视觉搜索工具,用户可以用它来拍照,找到在哪里购买商品、搜索类似产品或查看相关商品的pinboard。 ? 人们通常会在很短的时间内快速决定吃什么,选择哪家餐馆,什么,或者去哪里,所以每一个营销人员都应该知道的微时刻有: ? 到2020年,50%的搜索将是语音搜索。 谷歌上20%的移动查询是语音搜索。 25%的Bing搜索是语音搜索。 人们通过音频内容进行搜索时,语音搜索功能在提供相关信息方面起到了非常重要的作用。

    54010

    Talla:如何在工作流程中为人工智能提供机会

    要确定客户支持AI的机会在哪里,首先必须回答三个基本问题: 你有AI可以使用的支持文档吗? 你是否可以通过观察到的频道AI处理支持问题? 你的一部分客户是否有类似的支持问题? 如果你愿意投资高质量的转录,基于语音的通信对AI非常有用,亲自沟通可能超出AI的范围。 如果你的支持团队必须为大多数支持案例开发定制解决方案,那么AI将不会那么实用。 换句话说,如果你的常见问题清单相当稳定,那么AI可以带来真正的优势。 准备好将AI添加到客户支持工作流程中的可能性很高,你只需为客户支持团队找到合适的AI解决方案。 End

    18230

    思必驰高始兴:AI语音市场未到竞争点,深耕技术把握好窗口期

    语音技术无论是往芯片走,还是往端走,最终都是为了让语音交互的体验达到极致。 不过我们在问到具体合作情况的时候,高始兴并未透露太多,他表示,“思必驰做的事情不一定非要在本体去做,有可能是和新的合作伙伴深度的结合,这种合作并不是你我卖的商务合作,更多是是产业链上的一种合作。” 其次就是要打通芯片和云端的服务,所以除了AI语音芯片之外,思必驰还打造了DUI平台,提供全链路对话定制开发,最终让“芯”和云去深度结合,打穿最终的体验。 而面向企业智慧服务的定制平台会话精灵,则是利用启发式对话和复杂结构知识管理技术为企业提供更流畅的知识和信息的沟通方式,这也是思必驰对未来智能语音应用发展的新思路。 ? 一个赋能C端公司,一个从B端企业切入,思必驰选择的这两个方向,也是贯彻他们用语音技术赋能的理念,最终通过他们的语音技术构建一个大的语音生态市场。

    21520

    一键定制的机器女友,我就问问有几个人谁不心动?

    她的肢体能运动,还有语音功能。虽然其头部、眼皮和嘴唇的活动还很生硬,语言能力也有限,但她却是AI与高度仿真人体结合的产物。 同时,这款机器人最讨喜的功能是能一键定制性格。 ? 用户只要需在手机等智能设备上安装App,就可以自行选择定制专属于自己娃娃的性格,其中包括“愤怒”、“忧郁”等情感。 他说:“一开始这个娃娃,是因为单身了很久。但个人觉得谈恋爱挺浪费时间的。不过还是想有女生陪,所以就买了她。”他承认自己和机器人之间是肉体关系,但这种关系只是“次要的”。 “有了性爱娃娃,我就可以给她衣服穿。有了她,我的人生不用担心做错什么了,喜欢给她帽子,就去,不用怕她说不喜欢”,杨先生进一步解释道。 ?

    561100

    学界 | 图像识别攻击还没完全解决,语音识别攻击又来了!

    桌上的智能音箱吓得跳了起来 AI 科技评论按:当前的语音识别技术发展良好,各大公司的语音识别率也到了非常高的水平。 它通过生成原始音频的「基线」失真噪音来欺骗模型,然后使用定制的损失函数来缩小失真直到无法听到。 基线失真是通过标准对抗攻击生成的,可以将其视为监督学习任务的变体。 难点有如每个单词从哪里开始和哪里结束? 在语音识别中,正确分类的概率是使用连接主义时空分类(CTC)损失函数计算的。 由于针对性攻击的最薄弱环节直接决定了攻击的强力与否,Carlini 和 Wagner 引入了一个定制的损失函数,该函数会惩罚最强攻击部分的不必要的失真。 另外,针对语音转文本模型的攻击必须根据每段音频进行定制,这个过程还不能实时完成。

    51520

    创业使人成长系列 (1)

    所有人员大部分来至原来团队,需要每个员工自己入股,采取的形式是1万给2万的股,不同岗位可购买的额度不同。如果失败,则购买股份的钱会退给你。工资也是正常发放。当时觉得条件挺优厚的就加入了。 现在来分析产品失败的原因是不合适的,因为时间太久,记忆会有偏差。这也让我深刻的认识到,养成反思做笔记的习惯是多么重要。 最直观的感受是,当初为什么做陌生人语音社交?原因就是原来公司就是专门做语音交互的。 不仅在技术上陷入了价值网依赖,在很多运营策略上也照着大公司的运营思路去做,当初光域名都花了好几万,其实这个对创业公司重要吗?仁者见仁智者见智吧。

    6310

    全球首款性爱机器人今年发售,新型恋爱关系将诞生?

    AI技术与性爱需求的高度结合 美国成人用品公司Abyss Creations旗下的Realdoll工作室生产了全球首款性爱机器人,名叫Harmony,肢体能运动,还有语音功能。 而消费者也完全可以自行定制自己喜欢的娃娃。不过麦特说,顾客们的要求都太完美了,有自己的一套审美标准。 性爱机器人智能化:必然趋势 这家公司的CEO麦特说:我从来不认为这些玩偶和机器人能够替代人类。 Harmony性爱机器人 只要在手机等智能设备上安装APP,就可以自行定制专属于自己娃娃的情感,其中包括“愤怒”、“忧郁”等情感。 麦特为Harmony定制了“嫉妒”的情感,她时不时会用有点刺耳的苏格兰口音说:“把那个女孩取关了!” 她能自己“说话”,说她爱看科幻片,当然也爱自己的主人。她可以在与人交流的过程中学习沟通。 有了性爱娃娃,我就可以给她衣服穿。有了她,我的人生不用担心做错什么了,喜欢给她帽子,就去,不用怕她说不喜欢。

    48060

    微信智能语音服务上线,集成语音识别、语音合成、声纹识别等功能

    腾讯云智能语音服务将以强大的垂直领域定制化服务,打造专业高效的语音大脑。 语音搜索:针对垂直领域提供定制化的语音搜索引擎,如QQ音乐听歌名找曲目、电商APP语音搜索商品等,可提供便捷人机交互方式; 智能客服:在与招商银行服务号的合作中,提供了语音互动实现智能客服,通过机器学习挖掘用户问题 三、专业领域定制化共享云端价值 腾讯云还将提供专业领域定制化服务,包括识别模型训练等,对专业领域的海量语音、语言数据库进行信号处理和知识挖掘,获取语音识别系统所需要的“声学模型”和“语言模型”。 语音技术是怎么实现的?技术难点是什么?可以用到哪里? 腾讯云此次开放智能语音服务,提供强大的垂直领域定制化智能语音服务,打造专业高效的语音大脑,将满足开发者们更多样的场景需求。

    2.5K80

    扫码关注腾讯云开发者

    领取腾讯云代金券