首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

解密:依图如何一年实现语音识别指标超巨头玩家

在第四波 AI 浪潮下快速成长起的「小巨头」并没有停下开疆拓土的脚步。人脸、语音等多模态生物识别技术的融合成为人工智能应用的发展趋势之一。...、ST-CMDS; 依图自有数据集包括安静对话、混响数据集; 非公开数据集,即向第三方购买的数据集,包括语音助手场景、电话闲聊、电话客服、远场演讲、口音等场景的数据。...而排名靠后的阿里云智能语音、云知声开放平台、腾讯 AI 开放平台-WeChat、讯飞开放平台、百度开放平台远场方案在电话闲聊、电话客服场景下均超过了 15% 字错率,即「毫无可读性」。 ?...吴:上述测试涉及到了多种硬件设备,比如智能音箱、手机以及其他硬件设备。我们希望能够覆盖更多硬件设备。硬件方案的确会影响语音识别效果。但是面向不同的识别场景,我们都是调用同一套算法,同一套 API。...左为依图科技首席创新官吕昊,右为华为智能计算渠道合作部部长康鑫 活动现场,依图方面还宣布了将联合微软推出语音开放平台,依图的语音识别方案将在微软云 Azure 上线。

4.3K30

出门问问发布四条新品,虚拟助理新增多轮对话功能

创立初期,出门问问的语音助手“你好问问”(也即今天发布的个人虚拟助手“问问”的前身)以APP、微信服务号、Google Glass应用的形式进入公众视野。...个人虚拟助理VPA 早前,出门问问语音助手“你好问问”具备例如:查询路线、天气、订机票酒店等基本功能。此次由“助手”向“助理”的升级主要体现在多轮对话方面。...免费级AI开放平台 如今很多成熟或相对成熟的人工智能公司都采取开放共赢的战略。出门问问也于今日开放AI平台给硬件厂商和开发者,并宣布通用版本免费的政策。...出门问问用“纵”、“横”来阐述其开放AI平台的战略,纵向上,通过对开发者和硬件的开放交互式合作不断丰富和完善自身,让“问问”继续深度成长;横向上,与更多硬件产品携手,为用户创造更完备的全场景智能化产品体验...Tichome采用科胜讯(Conexant SmartAudio)的麦克语音前端处理方案、基于盲源分离的消噪算法(无需考虑噪音和人声的方向性)、动态实时自适应的回声消除和智能的消混响技术,以及针对远场拾音优化过的高动态范围模拟芯片技术

1.1K50
您找到你想要的搜索结果了吗?
是的
没有找到

思必驰AI芯片发布:内置完整语音交互方案,支持离线模式,All in One

而且思必驰语音交互发家,兼有多年软硬件一体化打磨经验,现在推出自研芯片,也在性能和功耗方面有备而来。...此次发布的芯片进行了算法硬件优化,基于DSP架构,内部集成codec编解码器以及大容量的内置存储单元。...而且思必驰AI芯片雄心,还不止于芯片市场本身,发布会上也强调,会以开放心态做芯片,跟各类合作伙伴一起推进软硬件IP、AI芯片技术等方面的合作,实现技术赋能各行各业。...在智能家居市场,针对带屏设备推出的“晓听助手”,具备远近场无缝切换、One shot一语即达、免唤醒所见即所说、多轮对话等功能,使语音搜索更智能,并可快速定制UI/UE,增强产品个性化特征。...通过“会话精灵”,打造会务助手、招聘助手、销售助手等案例,已服务于CCTV生活圈、央视科教、阅课等微信公众平台,为企业打造智能助理。 而重中之重是对呼叫中心的智能化升级。

1.9K30

“小度小度”开启AI硬件的“量贩”时代

从推出带屏音箱到升级智能屏,新的产品模式让小度助手成为了全球增速最快的智能硬件体系。...小度助手支持超过1.1亿的智能设备及1.8亿的智能投屏电视,可以语音遥控400+家电。...以旧换新活动,有力激活了智能音箱存量市场,利用无屏升级有屏的红利窗口期,革新家用电子消费品生态,加速开启全民智能屏周期。...另一方面,在AI购物节期间,小度还发起智能屏Air新品免费试用活动,通过资格审核并成功提交订单的家庭可免费试用30天。可见小度对智能屏产品有着高度自信,敢于挑战免费试用。...这让用户不仅可以无任何负担体会到智能的价值,同时也增强了对小度助手整体品牌的信任。 除此之外,“小度AI购物节”还有着多样的线上线下多平台大促,以及促销玩法。

1.3K20

智能音箱的中国战争

12月26日,华为宣布与微软展开在人工智能语音助手领域的合作;几乎同一时间,小米员工在微博透露,2018年最后一天,小米旗下两款智能音箱将支持召唤微软小冰。...换句话说,互联网公司做智能音箱核心逻辑是用硬件来“分发”自己的智能语音服务,智能音箱是它们新型“App”;手机公司则是给硬件搭载智能语音服务作为增值进而让其卖得更好,智能音箱是手机的延伸。...这样的开放系统会很有市场,第二类玩法意味着硬件公司都要强化AI团队。...89元尝鲜价,这让百度小度在11、12在京东、拼多多、苏宁、国美等平台悉数拿下第一。...正是因为此,追求每款产品盈利的硬件厂商和缺乏充沛资金支持的中小玩家很难与互联网巨头PK。 其次,智能音箱要真正智能,不只是需要AI还需要内容、服务和IoT生态。

1.6K20

喜马拉雅小雅Nano首发,仅需1元即可预约限量抢购

想要第一时间尝鲜的话很简单,只要在喜马拉雅APP活动页面上支付1元诚意金,就能预约抢购199元的小雅Nano,限量10000台现货。 智能音箱大战还真是一波未平一波又起。...因此,内容+智能硬件合体之后,从音频内容的数量和质量上来看,喜马拉雅的会员权益实际上是得到了升级。用户不但可享用优质内容,还能通过语音就完成所有功能的操作。...小雅Nano拥有“便捷的语音交互系统”、“24小时的家庭语音生活助手”、“用户在小雅Nano、小雅AI音箱APP等多个端口可实现跨设备断点续播”、“免打扰云端自动更新,技能持续升级”等功能。 ?...毕竟,有了相当丰富的内容,在整个AI领域的技术也有了阶段性的突破后,内容平台巨头围绕着内容优势往硬件入口拓展,以增值形式占据更多的语音消费场景,提供便捷服务,这本就是一个水到渠成的事情,也是行业职责所在...未来,由AI硬件带来的效率革命很重要。但基于此基础上,硬件能够传递的“内容价值及服务的广度和深度”也相当关键。

92020

AI预测技术在语音交互的落地 | 微软新一代全双工语音交互技术 | 智能语音 | 解读技术

在应用方面,米家生态链Yeelight语音助手是全球首个搭载全双工语音交互感官的智能设备,也是内置微软小冰的首个“AI智能设备。...这里插一句,所谓的“AI”,就是在音箱里同时加载了小米的“小爱”和微软的“小冰”,说是生活问题找“小爱”,情感问题找“小冰”,至于为什么这么做,小编感觉还是在于“小爱”语音识别性能有待提高,找人帮忙撑场子了...对话式人工智能基础框架正在发生变化 如何理解这种技术变革,目前大多数的智能音箱或智能语音助手采用的是Turn-oriented框架,在这种框架下,对话如十字路口,当用户提出问题后会将其引导到特定的场景并最大理想化完成特定任务...(2)节奏控制器:节奏协调,包括与人工智能自己的协调,与人类对话的协调,还有和其他语音助手的协调,时机和内容同等重要。...语音交互是对话式人工智能智能硬件设备的基础之一。全双工语音交互技术的应用,有望实现用户体验的下一次飞跃,并成为人工智能语音交互的新“标准配置”。

3.1K20

一文看尽Google新品发布会:手机、音箱、笔记本,硬件全面AI

李根 若朴 发自 十一假期 量子位 报道 | 公众号 QbitAI AI+软件+硬件,让Google助手无处不在。 这是Google刚刚结束的产品发布会的核心旋律——开门见山、贯穿始终。...智能音箱新成员:Mini和Max 新硬件发布之前,小结了一下过去的成绩:全球Chromecast设备已经有5500万台;虚拟助手Google助手去年回答了1亿个问题。...Google Home Mini是一个饼状的智能音箱,织物表面下有可以亮起的LED灯,可以播放360°的声音,也有支持远场语音技术的麦克风。...即便在摄像头成为标配的时代,Google Pixel 2也没有跟风,核心原因是Google团队认为算法能解决的问题,就不劳烦硬件了。...Google方面称,未来Google助手中也会加入Lens技术的应用,即直接语音交互完成更多视觉相关功能。

1.4K80

日韩三巨头联手推出 AI 语音助手平台;蓝牙、WiFi 版树莓派发布 | 开发者头条

日韩三巨头联手,推出 AI 语音助手 Clova 微软发布 Azure Stack 第三技术预览版本 每日推荐阅读 14 步教会你用 Python 掌握机器学习 █ 树莓派也有蓝牙和 Wifi 啦!...日前,火爆日韩的社交应用 Line,发布了基于人工智能语音助手平台 Clova;并推出与之捆绑的一系列 AI 软件工具,以对日语、韩语的语音识别和自然语言处理(NLP)进行支持。...作为对标亚马逊 Alexa 的服务,Clova 将在未来被应用于智能家居、玩具和其它智能硬件设备上。AI 研习社获得消息,索尼将于 2018 年推出搭载 Clova 的智能硬件产品。...另外,Line 还收购了东京知名物联网设备、家庭机器人初创公司 Vinclu,着手开发基于 Clova 的硬件产品。3D 萌妹子语音助手设备 Gatebox,正是该公司所开发。 ?...Naver、索尼、LG 三巨头联手开发 AI 语音助手平台,似乎智能家居领域的日韩联盟已经成立。

1.4K70

微软正式推出新一代全双工语音交互技术 | 黑科技

此次的技术与既有的单轮或者多轮连续语音识别不同,这项新技术可实时预测人类即将说出的内容,实时生成回应并控制对话节奏,从而使长程语音交互成为可能。...同时,采用该技术的智能硬件设备,将不再需要用户在每轮交互时都说出唤醒词。仅需要唤醒一次,就可以轻松实现连续对话,将语音交互的自然度推到了一个新的层次。 目前,该技术已经首先在微软小冰全球产品线中落地。...其中在中国市场,除了搭载在中国科技馆的小冰电话亭中以外,微软还与小米公司紧密合作,米家生态链Yeelight语音助手硬件产品已经植入了此技术。...这也是全球首个搭载全双工语音交互感官的智能设备,也是内置微软小冰的首个“AI智能设备。 除了中国市场外,此技术也被用在日本市场。微软在日本的语音系统小冰凛菜,已经通过该技术实现载直播平台中落地。...同时,首个车载智能项目也一开始路试。微软计划在未来六个月内,完成该技术在更多产品线中的覆盖。

1K20

Google IO大会:5G和折叠屏来了,还有这些改变世界的黑科技

03 AI语音助手更全能 视觉之外,就是AI语音语言方面的能力。 劈柴哥先从Duplex说起。 去年,Google推出了震惊四方的打电话AI系统Duplex,并在一年内实现了全美40多个州商用。...而Duplex之源——Google AI助理Google Assistant也有大进展。 Google宣布升级AI语音助手,并把语音交互能力完全放入手机。 优秀到什么程度?...只可惜,Google的AI语音助手,Google的这个福音技术,只能在Google“亲儿子”——Pixel手机上使用。 当然,依然是AI语音语言能力,还有技术牛X,情怀满分的新能力。...Pixel 3a依旧是天生骄傲,用AI和算法硬件劣势,依然保持祖传前后单摄像头,都可以提供背景虚化的人像模式。 现场展示照片,单摄的Google手机,夜景成像吊打摄的iPhone X。 ?...Google先祭出新时代的AI硬件产品打造理念: AI+软件+硬件。 ? 其次,带来新发布: 带屏智能音箱。 之前叫Google Hub,现在改叫Nest Hub。 ?

1.3K60

一文看尽Google IO大会:史上最快手机全语音操控,不开口也能打电话,安卓Q登场

AI语音助手更全能 视觉之外,就是AI语音语言方面的能力。 劈柴哥先从Duplex说起。 去年,Google推出了震惊四方的打电话AI系统Duplex,并在一年内实现了全美40多个州商用。...而Duplex之源——Google AI助理Google Assistant也有大进展。 Google宣布升级AI语音助手,并把语音交互能力完全放入手机。 优秀到什么程度?...只可惜,Google的AI语音助手,Google的这个福音技术,只能在Google“亲儿子”——Pixel手机上使用。 当然,依然是AI语音语言能力,还有技术牛X,情怀满分的新能力。...Pixel 3a依旧是天生骄傲,用AI和算法硬件劣势,依然保持祖传前后单摄像头,都可以提供背景虚化的人像模式。 现场展示照片,单摄的Google手机,夜景成像吊打摄的iPhone X。 ?...Google先祭出新时代的AI硬件产品打造理念: AI+软件+硬件。 ? 其次,带来新发布: 带屏智能音箱。 之前叫Google Hub,现在改叫Nest Hub。 ?

1.6K30

智能手机行业即将上演“芯端云”军备竞赛

至少就AI而言,不论是从Siri这些年的长足进步,还是Amazon Echo的成功案例都表明,只有软硬件结合再辅以持续的互联网服务才能实现真正的智能体验。...已启动“AI First”战略的谷歌在今年收购HTC的硬件部门弥补硬件的短板,华为和苹果更是不约而同地在芯片层面引入专属AI模块,跻身行业前列,让智能手机终端层面的AI计算力得到质的提升。...倍性能提升,进而可以更好地实现图像识别、语音交互和智能拍照等AI应用。...EMUI8.0在系统层面处处应用AI提供服务,除提供AI个人助手语音助手AI小E、AI指识屏等AI助理服务外,还可以智能感知场景进而提供个性化的功能服务,在AI慧眼识物技术加持下自动识别拍照场景、实时调整参数...、存储能力、智能服务能力等等的整合;比如EMUI8. 0 为国内用户重点打造的智慧功能AI个人助手语音助手AI小E、AI指识屏等就是基于云端服务而实现的。

1.6K90

京东推出京鱼座独立品牌 展开全新AIoT生态布局

硬件层面则使用京鱼座独立品牌,并采取“自研+合作”两手抓的产品策略:入口领域自研节点、专业领域合作共赢。 ? ▲京东IoT事业部总经理周炯 在消费产品端,京鱼座智能产品将全线搭载小京鱼智能助手。...其核心采用7mm动圈+动铁单元的单元结构,并搭配复合航空钛金属膜,格莱美大师调音为用户提供卓越音质。用户轻敲耳机即可唤醒小京鱼智能助手,通过流畅的对话实现丰富功能。...此外,这款产品是国内互联网公司推出的首款支持直接语音唤醒智能助手的耳机,不只是降低对运动的困扰,更是全方位解放双手。 ?...京鱼座AI音箱:这是首款京鱼座智能音箱,它采用了被动膜共振技术,搭配8W全频发音单元,支持360°声场,专业级调音,音质出众。...令人惊喜的是,12期间京鱼智能新品将也与消费者见面。另外,一款主打随叫随到、能说会道、忠诚陪伴的机器人万能助手也在研发中。 全面升级AIoT布局 京东深度融合数字技术与实体经济 ?

1.1K30

手机人工智能时代,华为Mate 10这些功能一定要知道

华为Mate 10系列产品近日发布,不出意外,这个重磅系列的产品引发了行业的强烈关注,尤其是没有跟风国内炒作全面屏的大潮,而是率先独立推出了AI芯片麒麟970和f/1.6大光圈的徕卡摄镜头,而对于人工智能时代的智慧手机...语音助手:真正实现正常对话   EMUI8.0也引入了麒麟970的智慧引擎,在人工智能方面除了上文提到的识物、识屏、在线翻译 ,这次语音助手也进行了全面升级,能更懂我们说的话了。 ?   ...现在可以直接对语音助手说:“手机有点卡怎么办?”...Mate 10语音助手可以对手机进行智能检测,并给我们提供了一键优化的功能,同时,语音助手也在不断的学习,人工智能强大之处并不在于能立即实现多少功能,而是通过手机端AI的不断学习来更加适合用户的使用。...近期华为申请了“U”的商标,这个标志的注释为:用于管理智能家居设备和移动应用程序的软件。而这也是华为手机全新的语音助手

3.9K90

AI语音定制化,将给2020带来三个可能

让我们从语音合成、对话式AI,以及智能语音硬件三者发展的合流中,审视一下进入AI语音定制时代的2020,可能发生的三个改变。...因此,AI语音定制的工程化与商业应用,始终被抱以高度期待。这条技术线索可以说是AI语音硬件,比如智能音箱、智能屏等产品持续发展的奇兵。...语音定制的产业化通道也就此展开。 在另一条轨迹上,我们可以将其看作智能语音助手和对话式AI硬件的整体进化。 从2015年,亚马逊的Ehco诞生起,语音助手就处在用机器音一问一答的基本能力里。...而AI语音定制的能力,或许可以看作2020年智能语音助手和相关硬件的又一次升级,用户可以借此实现千人千面的AI硬件,开发者有了新的开发基础。连锁发生的产业化影响也能够随之展开。...在智能家居、智能手机助手智能穿戴设备中听到自己亲人、偶像的声音,是一件可以充满各种玩法的事情。开发者将可以借助各种硬件形态,挥洒AI语音定制的想象力。 3、“声音著作权”的无数新玩法。

1.8K20

小冰负责人李笛:微软不缺钱,缺对未来的把握

然而,包括 Siri 在内的智能手机端的语音助手,都未能让语音成为主流的交互方式之一,而小冰虽然在手机端积累了海量用户,但是绝大部分都是通过文字的形式去跟小冰交互,语音占比不到 10%。...有数据显示,在所有智能设备中,手机端的语音助手的活跃度最低,DAU 甚至小于 4%,相比之下智能音箱的 DAU 为 70%,智能手机端语音助手活跃度偏度一直是一个难以解决的问题,而以智能音箱为代表的智能音箱为语音助手带来了很好的切入口...2017 年,国内的百度、阿里、小米等纷纷推出搭载自家语音助手智能音箱,抢占语音流量入口,而老牌选手小冰却姗姗来迟,直到 2018 年初,才与小米生态链企业 Yeelight 合作,在智能音箱上落地。...对此,李笛表示,“小米和我们都很开放,包括我们也接受 AI,小米也接受像我们这样的 AI 设备,我认为今天整个行业最核心的问题是大家还没有找到一个真正的解决方案到底这个 AI 是什么,这也是为什么我们跟小米...至于战略方面,李笛表示,“微软内部的战略叫做无处不在,我们认为我们是做 AI 的,所以我们提供的不是一个硬件设备的语音助手,不是提供一个功能或卖点,而是利用这个硬件设备实现我们的新触角。”

2K50

囹圄中的科大讯飞

高楼皆由AI起 作为最早一批的智能语音入局者,即将走过二十年的科大讯飞已经成为了中国最大的语音识别人工智能公司。...其产品占据了中文语音识别服务市场70%的份额,国内智能语音市场份额则占据了44.2%,遥遥领先于百度、苹果等公司。 可谓是真正占据了中国智能语音市场半壁江山的企业。...在会上科大讯飞宣布,每年在全国选择6个城市举办AI生态沙龙,还要在既有的长春、洛阳、合肥、重庆四个AI创基地之外,继续在全国各地建立更多的众创空间;要从46万开发者团队中寻找1024个钻石团队,为他们提供五大平台的钻石级别扶持...2014年科大讯飞的语音平台曾为搜狗语音助手提供底层语音技术支持。两年左右时间,搜狗成立了自己的语音团队,并且推出和讯飞听见类似的实时翻译技术。...而与此同时,围绕语音交互的硬件市场早已群雄环伺,搜狗、猎豹以及网易都在今年下半年陆续发布了语音识别硬件,科大讯飞高达2999元的翻译机显得有点高处不胜寒。

1.6K10

解码AI多语种技术创新,跨语种沟通正成为现实

全球化背景下,AI 多语种智能语言技术在各行各业的应用越来越广泛。 科大讯飞作为智能语音行业的执牛耳者,在多语种智能语言技术上不断进行技术创新和应用落地实践,迎接市场环境变化下的新挑战。...1多语种语言技术面临三大挑战 活动开场,讯飞 AI 研究院副院长方昕带来了《科大讯飞多语种智能语言技术进展与应用落地》的主题分享。...目前,科大讯飞已经初步构建了一套多语种整体的多语言系统,包含了数十个语种的语音合成、语音识别、图文识别、机器翻译系统,提出的解决方案包括语音助手智能家居、AI 字幕、内容审核等,提供通用解决方案和重点领域的定制化解决方案服务...在语音助手解决方案方面,科大讯飞主要面向手机、音箱、大屏等需要助手功能的场景,通过海量数据训练来优化重点垂类和打造最自然的识别效果。所谓垂类指的是手机语言助手调用联系人、天气、音视频等。...除此之外,语音助手解决方案在海量数据的基础上,支持语种混说和语音识别。

1.8K40
领券