中国语音巨头科大讯飞2014年8月20日在北京召开规模宏大的发布会,展示语音技术最新成果、发布科大讯飞一揽子软硬件产品、启动讯飞超级大脑计划、宣布科大讯飞1亿元创业基金,并对表现突出的讯飞开发者进行了表彰 台上还有一个模拟智能客厅,核心家电一应俱全。这场发布会耗资不少,一定程度表明科大讯飞高调拥抱智能硬件大潮的决心。 计算智能是深蓝机器人时代,存储和计算都是本地化的;感知智能则是让机器能听会说,能看会感知环境,这是当前大多数智能硬件在做的事情;认知智能即智能3.0时代则是机器可以向人的大脑一样思考,理解,推理,预测, 灵犀 3.0全面连接智能家庭,让用户通过语音控制家里的一切家电、窗帘。 1.0时代是软件公司,2.0时代是软件公司+互联网公司;3.0时代要做软硬件一体化、面向未来的互联网科技巨头,它要用语音连接一切。 SuperSofter是WeMedia早期成员。
过去,音箱多是作为电视、电脑的配件存在的,但是随着技术的提升,现在的电视拥有了环绕立体声音响系统,而音箱也渐渐成了讲究便捷性的电脑的一个“累赘”。 具体讲,智能音箱的本质就是一个音箱,而让它能够从众多音箱中鹤立鸡群的就是其中所加载的语音识别、云服务等人工智能技术,以及与第三方服务商的无缝连接,而这些,只要厂商愿意,几乎每个智能硬件都可以做的跟智能音箱一样出色 在外游玩、工作时,用户通过手机上的软件可以对智能家电远程下达命令,比如苹果iOS10上的Home软件;在室内时,对于一些回到家就放下手机的用户而言,一个智能家居控制中枢就作用就显现出来了,而相比于可有可无的智能音箱 组合式硬件更适合智能家居 当前的智能音箱是依靠语音来进行人机交互、命令下达的,这其中也有着一些隐藏问题。 比如说当家庭人员同事说话时,其作为唯一一个控制中心很容易造成“大脑”的混乱,并且,由于墙壁等物体的阻挡,用户的声音在传达到音箱时极有可能失真、语音不清,从而影响用户得体验效果。
为企业提供极具性价比的语音识别服务。被微信、王者荣耀、腾讯视频等大量内部业务使用,外部落地录音质检、会议实时转写、语音输入法等多个场景。
8.4 语音大脑VB580平台简介 语音大脑平台VB580是华镇电子推出的一款语音识别软硬件一体解决方案,具有低成本、高可靠性、通用性强的特点。 VB580平台采用了高性能 32位音频处理器,软件采用了华镇第五代的语音识别算法、降噪算法、麦克阵列等前端处理算法,能够为智能设备提供远场环境下语音控制、语音交互能力,使硬件能听懂用户的说话内容、语音指令来完成设备控制操作等功能 8.5 语音大脑VB590平台简介 VB590平台是华镇推出的一款离线语音识别AI软硬件一体解决方案,具有超低成本、高可靠性、通用性强的特点。 VB6824平台采用了高性能 32位音频处理器,软件采用了华镇第五代的语音识别算法、语音降噪算法,能够为智能设备提供远场环境下、稳态噪音环境下语音控制、语音交互能力,使硬件能听懂用户的说话内容、语音指令来完成设备控制操作等功能 该芯片从语音输入开始,语音检测,语音特征提取及 DNN 运算完全采用硬件架构设计, 软件主要进行语音解码和语音播报。该芯片具有较高的运算性能及低成本、低功耗、小尺寸 等优势。
只见话音刚落,立即被转换为文字显示在电脑上。 禄丰法院加快智慧法院建设步伐,近日为全院28名入额法官安装了32寸宽屏电脑和法官语音助手,并在两个数字法庭安装了庭审语音助手,开启了智慧法院“左看右写、语音录入”的工作模式,标志着该院在智慧法院建设上迈上了一个新的台阶 安装32寸宽屏电脑 法官可以“左看右写” “法官助手”系统应用智能语音识别技术,改变以往文书及材料的撰写模式,由键盘手动输入转变为语音便捷输入,法官只需“动动嘴”就可实现轻松完成所有文书及材料内容输入, 通过语音快速便捷编辑文书、材料录入、查找资料,达到法官书写文书“左看右写,语音输入”智能模式,有效促进法官办公体系和办案能力现代化,大大提高法官办案效率。 指导使用庭审语音助手 快速生成标准化庭审笔录 安装于数字法庭的智能语音识别软件,可根据庭审现场发言,即时转换成文字,并将审判人员、书记员、原告、被告等的发言自动载明发言人角色,显示转换在文档之中,形成符合规范要求的庭审笔录
可穿戴智能设备与人工智能两者结合,使得人体感知能力进一步补充和延伸,情景感知将会是下一个智能硬件科技新趋势,很快很多可穿戴等智能设备将具备某些“情景感知”功能的应用软件,这一核心定是人工智能的崛起。 X等智能眼镜和各种智能手表等可穿戴设备,NAO等机器人、智能音箱和智能家电等智能硬件,利用其科大讯飞的“语音唤醒”功能,设定好语音指令,当设备处在休眠状态下,透过语音交互,可穿戴等智能设备直接进入工作状态 机器学习作为人工智能的一种类型,可以让软件根据大量的数据来对未来的情况进行阐述或预判。谷歌将最新的机器学习软件开源,并将此系统的参数公布给业界工程师、学者和拥有大量编程能力的技术人员。 科大讯飞据公开资料显示,2014年提出“讯飞超脑”计划,未来“讯飞超脑”将考上国内重点大学,讯飞超脑关键技术要突破人工智能在语言理解、知识表示、逻辑推理和自主学习方面的认知智能技术体系,研究面向穿戴式设备及智能家居的新一代感知智能语音交互核心技术 传感物联网创建人杨剑勇了解到,图灵机器人可为智能化软硬件产品提供中文语义分析、自然语言对话、深度问答等人工智能技术服务。
传统的手写记录要转换成文字需要人工敲打,或通过拍成照片的形式用扫描软件识别,准确率无法保证,OCR手写识别功能可以说提供了一条办公捷径。 讯飞智能办公本的智能笔记功能,可以在语音转写的同时实现手写记录,而且在查找笔记时支持关键词语音快速检索包括文字、录音、手写笔记在内的多种格式资料。 最后是整合丰富外部软硬件生态,实现办公能力和场景的多维度延展。作为高效的办公设备,讯飞智能办公本的文字、文档和手写笔迹都可实现无线打印、无线投屏和多端同步。 另外在阅读办公场景,讯飞智能办公本可导入多种格式的电子书,且兼容主流第三方阅读软件,还可将阅读资源从绑定好的网盘下载至本地,更为特殊的一点是,借助讯飞的语音合成技术,办公本可模拟真人声音进行情感化阅读, 二十多年的人工智能和语音技术研发、迭代和应用,已经让科大讯飞的语音语言、机器学习和自主学习等技术水平位居行业先进水平,高强度的持续研发投入筑就了科大讯飞的硬技术壁垒。
之前给大家推荐过小程序分享丨智能文字转语音神器,讯飞快读这个小程序可以解决大家文字转语音的问题,小轻论坛也绑定了讯飞快读,大家可以在公众号的菜单栏打开这个小程序,去转换语音,用来恶搞室友和同时也是很有意思的 今天小轻主要给大家推荐这款电脑软件,虽然没有上述的语音库庞大,但是功能还是很多的。 免安装便携软件,可以放U盘里,插到任何带有语音库的电脑上都能用。 Balabolka可以使用计算机系统上安装的所有语音(注意是所有语音)。 如何知道我的电脑上已安装什么声音?已安装的声音在这里可以看:Control Panel(控制面板) ? Speech(语音) ? Speech Properties(语音属性) ? 我试用过那些收费一千多的软件都没有这个校正功能呢! ?
2014年底,语音行业新闻不断:云知声完成5000万美元B轮融资主攻智能家居,科大讯飞推出自己的语音智能音响硬件,百度语音涉足智能硬件领域……智能硬件正在成就语音,语音也在成就智能硬件。 还有许多智能硬件的使用场景中,双手并不方便,比如在驾驶过程中,再比如看电视离屏幕太远,这时候必须要有脱离双手的新型交互模式。正是因为这些原因,语音成为智能硬件最理想的交互方式之一。 具体来说,语音识别可以解决输入部分,比如通过语音让智能手表完成某个动作,发起一次搜索,再比如通过语音让智能音响播放下一首歌曲,让智能电视播放特定节目;语音合成可以实现交互反馈,比如语音播报搜索结果,语音播报导航指令 ;语义理解则可以解读声音背后的需求做出反馈,用户可以很自然地对电饭锅说,“明天早晨8点帮我煮一碗八宝粥”,智能电饭锅解读指令并准备行动;声纹识别则可以实现个人ID鉴权,实现智能家居的开门、智能购物的支付等等 百度语音则是基于深度学习,以百度大脑为基础,百度大脑是百度在人工智能时代的核心智能平台,图像识别、自然语言处理,均会基于百度大脑。
一分钟AI 继苹果刘海屏被吐槽后,传华为P11将采用异形屏,同时提高人工智能使用体验。 美国AI公司通过机器学习算法,在最短的时间内找到3D配方,帮助波音公司3D打印飞机金属零件。 王健林:万达广场线上线下融合主要研究方向是人工智能,并将大量实施 IBM沈晓卫:担心人工智能对人类的威胁就像担心火星上车牌限号 小米AI音箱迎来重要更新:加入控制电视功能,将成为智能家居的控制中心 计算机视觉公司 用算法替代研究员,这家AI公司帮波音3D打印飞机金属零件 3D打印组件能为波音生产每架飞机节省上百万的成本,然而找到适合3D打印的合金的配方确是一个难题。 小米AI音箱迎来重要更新:加入控制电视功能 小米AI音箱是小米在7月26日发布的一款智能音箱,它是由小米电视、小米大脑和小米探索实验室联合开发。 最近,小米AI音箱迎来重要更新,它加入了用“小爱同学”唤醒词控制电视的功能。像打开/关闭电视、视频快进/暂停等功能都能通过小米AI音箱完成。
这里有四个关键组成部分:1)交流和感知(声音、触觉、视觉等);2)环境、多设备可用,无论在手机还是汽车上都能触达;3)不需要你开口问,就能提供你所需要的信息;4)同样不需要你开口问,电脑就能学习和适应你 智能音箱Google Home下一步将进入日本市场——这也是Google Home登陆的首个非拉丁语系国家。 在这次发布会上,智能音箱家族增加两个新成员。 Google Home Mini是一个饼状的智能音箱,织物表面下有可以亮起的LED灯,可以播放360°的声音,也有支持远场语音技术的麦克风。 笔记本:Pixelbook 接下来发布的是首款Google笔记本,一款名为Google Pixelbook的高性能Chromebook,结合了笔记本电脑的性能、平板电脑的便携,以及智能手机的个性化。 值得一提的还有一个永远在线的显示屏,无需触摸电源按钮,就能了解所有屏幕上的通知/时间。 当然,Google的手机,核心大招都在软件方面,或者说就是AI在手机上应用。
其亮点在于旗下分别定为智能助手和情感交互的小冰和小娜,目前小娜和小冰的对话水平已经属于语音助手界的顶级水平。 目前负责微软研究院的是执行官Harry Shum。 ? Echo的智能音响兼语音助手。 Matt Wood IBM实验室 IBM最近的超级电脑华生(Watson)安装有IBM研发的“语气分析工具”(Tone Analyzer),这一工具可以对人类的书写文字进行智能识别,识别出其中的高兴、悲伤等情绪 华生电脑甚至可以识别出用户的性格特性,比如是内向还是外向。另外其分析工具能够分析整个的句子,而不是零散的几个单词。如果能够识别出用户的情绪,华生电脑自然也能够做出更有针对性的应答服务。 比如通过语音文本转换工具,华生电脑可以以恰当的语气语调回答问题。比如如果某个用户当前的情绪属于愤怒状态,则华生电脑也不会采用兴奋激动的语气回答问题。
随后,微软研究院副院长ACL候任主席周明先生,讲述了人工智能发展的四个层次,即运算智能、感知智能、认知智能及创造智能,重点对当下火热的语音智能做了详解,他认为,现在人工智能更处于感知智能突飞猛进的阶段, 海尔U+人工智能交互系统现已向第三方服务开放,包含软硬一体语音方案、智能设备交互服务、硬件数据入口、技能开发接口等方面。 是家电,这里面包括互联互通的协议,包括通讯的软硬一体解决方案,像我们的Wi-Fi等软硬一体的模块,承载了安全的Uhome操作系统,又用最新的物联技术,窄带物联网这样一个行业解决模块,通过开放的方式,把硬件软件解决方案提供给行业中的硬件制造商 基于这样的认识,我们海尔U+的语音交互平台,愿意将我们这些年来积累的在硬件上、软件上、平台服务上的能力,向第三方合作伙伴开放,我们合作伙伴包括第三方的智能硬件的厂商,也包括了语音助手的设备和软件的研发厂商 对于第三方的智能硬件厂商来说,我们将现在已经成熟的软硬一体的云解决方案全面开放,包括主板的设备,包括终端的算法模块,包括云端的服务,在这个层面上,第三方运营厂商使用我们服务以后,可以迅速形成语音交互设备的研发能力
其亮点在于旗下分别定为智能助手和情感交互的小冰和小娜,目前小娜和小冰的对话水平已经属于语音助手界的顶级水平。 目前负责微软研究院的是执行官Harry Shum。 ? 还推出了一款叫Echo的智能音响兼语音助手。 Matt Wood IBM实验室 IBM最近的超级电脑华生(Watson)安装有IBM研发的“语气分析工具”(Tone Analyzer),这一工具可以对人类的书写文字进行智能识别 华生电脑甚至可以识别出用户的性格特性,比如是内向还是外向。另外其分析工具能够分析整个的句子,而不是零散的几个单词。如果能够识别出用户的情绪,华生电脑自然也能够做出更有针对性的应答服务。 比如通过语音文本转换工具,华生电脑可以以恰当的语气语调回答问题。比如如果某个用户当前的情绪属于愤怒状态,则华生电脑也不会采用兴奋激动的语气回答问题。
百度AI也能打电话了 除了自动驾驶,李彦宏还展示了百度在智能客服上的进展。 李彦宏称,百度智能客服曾经在开发者大会开始前,打出了数百通电话给参会的开发者确认是否参会,并在大会上现场播放了其中两段对答录音。 ? 百度表示,这一语音合成也使用了谷歌的WaveNet等先进的语音生成引擎。 ☟感兴趣的读者可以戳视频收听一下 ? 这样的对答客服需要调用大量的数据进行训练,并且训练基于百度大脑的语音能力。 从去年11月份百度世界大会到现在,仅仅过了半年多的时间,百度大脑的语音能力的调用次数增长了94%,视觉能力的日调用量增长了416%,自然语言处理的日调用次数增长了180%。 2500万…… 在硬件方面,这一年中,DuerOS 推出了首发1万台1分钟售罄的小度在家,还有蔡康永的 AI 徒小度智能音箱等产品;在软件层面,也已经实现了从1.0到2.0版本的升级迭代。
热爱物理学的俞志晨将公司第一款产品命名为“虫洞语音助手”,这款产品支持自然语言理解的人机对话、智能问答应用,可内置于智能手机、智能硬件等平台。 当然,从软到硬的发展路径并不仅仅局限于智能实体机器人,智能电视、智能汽车、智能家居也是虚拟机器人大展宏图的机会。 袁辉介绍道,LG、联想等智能电视中,都搭载了小i机器人的系统,用户完全可以跟遥控器进行语音对话,发出类似“我想看钢铁侠!”式的指令,智能电视便能提供相应的服务。 与小i机器人不同,虫洞语音助手最初的定位就是把手机变成智能化机器人。俞志晨认为,手机除了跟机器人形状不一样,本质并无太大区别。未来,各种硬件不过就是功能硬件而已。 IBM的Watson、谷歌大脑Nao、小i机器人、图灵机器人都在人工智能的认知层上做文章。语音只是认知层的一部分,俞志晨将它比做耳朵, “它只是一个引擎,把这种信号转化成机器可以理解的语言。
资料显示,启英泰伦于2015年11月在成都高新区注册成立,是一家专注于人工智能语音芯片及提供配套应用解决方案的国家高新技术企业,是行业首家同时掌握人工智能语音算法、芯片设计、语音数据处理及训练引擎、软硬件产品应用方案开发全技术链企业 五款芯片都搭载了其自主研发的脑神经网络处理器单元,并已经实现了规模化量产。客户覆盖国内主要家电厂商,以及全国多家知名方案商。 公司目前已申请了100多篇相关知识产权,在集成电路设计技术、本地语音识别技术、语音降噪处理技术等领域均属国内领先水平。 张来表示,端侧智能语音不能完全仅依赖网络,需要针对深度神经网络专用语音芯片。 CI1122是一颗专用于语音处理的人工智能芯片,可广泛应用于家电、家居、照明、玩具、穿戴设备、汽车等产品领域,实现语音交互及控制。 CI1122内置自主研发的脑神经网络处理器BNPU,能以极低的成本及功耗,在端侧完成高算力的智能语音神经网络运算,从而可不依赖网络云端处理,支持本地语音识别。
这个月,阿里巴巴和小米各自推出了智能音箱产品。据透露,腾讯也在研发类似的智能音箱。而百度力推了一套类似亚马逊Alexa的语音系统,用以驱动智能音箱。 (量子位注:DuerOS) 从科技巨头到电子消费品制造商,所有人都把语音智能产品视为一个通往未来的必由之路,届时人工智能将会掌控房间、汽车和办公室。 对于雄心勃勃的创业公司来说,智能音箱是一个机会,就像移动互联网时代的App一样。对于电子制造商来说,智能音箱可能像笔记本电脑、平台电脑、智能手机和无人机一样,让他们的生产线嗡嗡作响。 而且,亚马逊、Google和苹果的智能音箱,都不提供中文语音服务。 历史经验为这种新产品提供了一种可能的成长路径:以更低的价格快速占领市场。就像笔记本电脑和智能手机一样。 智能音箱不仅仅是硬件,它需要复杂的软件来识别和执行语音命令,并提供天气预报、交通路况、音乐、新闻、书籍、购物、支付等服务。智能音箱需要与用户交流互动,并且逐渐掌握用户的喜好。
具有人工智能的处理器的设备将从现在的高端手机扩展到汽车,PC,安全摄像头,智能音箱和主流手机等。 您可能已经将人工智能技术应用于应用程序,设备,服务,通过照片进行人脸识别或者令音箱像人一样说话。 这只是AI的最新发展,这个看似笼统的术语通常指的是基于人脑结构松散地建模的机器学习或神经网络的技术。一旦通过现实世界的数据训练了一个神经网络,它就可以发现垃圾邮件,将口语转录成短信,乃至识别一只猫。 AI芯片:赋能电脑、手机、摄像头、音箱…… 通过采用互联网功能的安全摄像头,可能会给您的家庭网络和宽带连接带来持续不断的视频流。 Gwennap预测,私人电脑虽然可以在相对强大的主处理器上运行AI,但随着更多软件使用这项技术,他们也将获得AI芯片。 像Amazon Echo或Google Home这样的智能音箱现在处于AI领先地位,但他们大部分的大脑依赖于网络连接。
文章指出,3年前创建的谷歌大脑项目表现越来越抢眼,其人工智能系统给谷歌旗下的各个重要产品都带来了助力,从Android语音识别软件到无人驾驶汽车,再到广告和谷歌地图。 除了谷歌地图外,谷歌大脑还给Android的语音识别软件和Google+的图像搜索带来了助力。但据谷歌大脑项目领导者之一杰夫·迪恩(Jeff Dean)称,那还只是个开始。 人工智能即服务 谷歌大脑诞生于2011年。一年后,谷歌将Android的语音识别错误率大幅降低25%。不久后该公司开始不断招兵买马,网罗它能找到的每一位深度学习专家。 谷歌开发了一些人工智能模型,并将它们发布到内部网络上。迪恩及其团队也专门开发了后端软件,让谷歌的服务器进行数据挖掘,然后将结果显示在软件控制面板上,向开发者展示人工智能代码的表现和作用。 对于部分项目,如Android语音识别软件,迪恩的团队需要费一番功夫才能让那些学习模型发挥作用。
办公时间,总得放点音乐,边听歌边工作。外放音乐又不大好,但电脑又没有蓝牙,不能使用蓝牙耳机,使用有线耳机又碍事。于是想到了用手机来当电脑音箱,手机再连接蓝牙,这样就能间接实现电脑连接蓝牙耳机了。 机智如我~ 首先,有问题,当然是Google一下,于是找到了SoundWire这款软件。这软件有两个端,分别是服务端(电脑装)和接收端(手机装)。 记下Server Address的IP地址,这是你电脑的IP地址,一会手机需要用到。 结语 到这里就结束了,更多的可以自己探索下。总的来说,感觉效果还不差,就是音频会延迟一秒左右,听歌的话,是能接受的。音质方面,没感觉。 使用了一会,发现会有广告语,每隔一段时间就会有一个机器女声说SoundWire Free? 如果想降低延迟,可以在接收端的Settings里调整Audio buffer size,值越小延迟越低。
腾讯云小微智能硬件 AI 语音助手(IHAVA)为您提供前沿的 AI 语音全链路能力、硬件方案咨询及认证服务,整合腾讯系优质内容和服务,面向智能硬件行业打造全方位的自然人机交互体验。
扫码关注云+社区
领取腾讯云代金券