使用经过挑选和标记的数据集对人工智能系统进行训练,产生了专门的人工智能模型,擅长对象识别等任务。
编辑:刘光明 【新智元导读】吴恩达在这一年经历了很多,从带领机器人“小度”在《最强大脑》上战胜王峰到离职百度创业,再到创立Landing.ai,宣布与富士康合作,吴恩达的每个动作都是会引发业内热议。无人驾驶方面,北京月底无人驾驶地铁开通,南京无人驾驶公交明年试运行,而百度也即将在明年的CES上亮相Apollo 2.0,其无人车也将从北京五环开到加州。 今日头条 吴恩达的2017年度报告 产业要闻 无人驾驶迷你公交明年亮相南京江北新区 国内首条国产无人驾驶地铁将于本月底在京开通 群策群力可准确预测最高法院裁判
不管你来自哪个城市,相信在你的记忆中,都有自己的「家乡话」:吴语柔软细腻、关中方言质朴厚重、四川方言幽默诙谐、粤语古雅潇洒……
从当前来看,速记神器确实为特定人群所需。 近日,搜狗召开发布会,正式推出其自研的速记神器——搜狗听写。这是一款能够将语音实时转变成文字的速记工具,拥有转写和听写两种模式,主要面向记者、编辑、作家等文字工作者。 由搜索而知名的搜狗 在人工智能领域似乎也玩的风生水起 众所周知,搜狗以搜索业务起家。除搜索业务外,其在近年还因搜狗输入法、搜狗高速浏览器等在行业内颇具名气。 如果仅从以上这些来看,搜狗此次推出“搜狗听写”似乎显得有些无厘头。然而,搜狗CEO王小川曾表示,搜索本身也是一种AI。 回顾搜狗的发展史,除去初
作者 | 鸽子 10月24日,科大讯飞1024开发者节在合肥开幕。 开幕式上,科大讯飞董事长刘庆峰,执行总裁,消费者BG总裁胡郁分别从务虚和务实两个方面,介绍了1024计划,此外,有关AIUI开放平台的具体内容也在文中有详细介绍。 由于信息量比较密集,AI科技大本营第一时间拿到所有素材,希望能给读者带来最新最全的消息。 刘庆峰:人工智能未来像水和电一样,随时可以用 科大讯飞董事长刘庆峰的演讲,保持了一贯的激情澎湃。 刘庆峰在演讲中,总结起来,主要说了三件事: 第一件事:PR。在有关认知智能的三个国际比赛
迁移学习实现将特定领域的模型应用到多个目标领域中,能够促进目标领域模型的学习成长,并降低目标领域内对于数据量和类型的要求,实际上就是利用已有先验信息来优化模型学习内容。迁移学习在小数据环境、智能终端上具有广阔的应用空间,迁移学习需要将在数据量充足的情况下学习到的知识,迁移到数据量小的新环境中,能够通过发现大数据和小数据问题之间的关联,把知识从大数据中迁移到小数据问题中,从而打破人工智能对大数据的依赖。
毫无疑问,智能音箱是今年全球人工智能领域最热的“风口”之一。2014年,亚马逊在官网低调地上线了一款搭载智能助手Alexa的智能音箱—— Amazon Echo,没有高调宣传,甚至没有发布会。
从理论研究到实际应用,从交大教授到AI创业者,苏剑波教授关注手语识别研究近二十年。
整理 | 刘晶晶 Donna 睢岭 润色 | 鸽子 11月9日,科大讯飞2017年度发布会,“顶天立地,AI赋能” 在北京国家会议中心召开,科大讯飞董事长刘庆峰,轮值总裁吴晓如分别在大会就人工智能技术、行业应用做了报告,执行总裁胡郁则向所有人公布了公司在人工智能领域的最新产品。 据刘庆峰透露,12月6号,科大讯飞刚刚创造了一个历史性记录:讯飞智医助手,成为第一个通过国家医师资格证的机器人。据刘庆峰透露,讯飞智医考了456分,超过分数线达96分以上,在安微省2万多考生中,名列前100名。 刘庆峰提到人工
大名鼎鼎的横店影视城有着这么一群人。他们每天穿梭于各大剧组,换上威武的武士服和漂亮的古装,在满满的通告中获取一份相对稳定的收入。有时运气好了可以讲一两句台词,和大明星合个影,也能自豪地给家里人讲自己风光的一面。
5月26日消息,中国电信人工智能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言。据了解,中国电信人工智能研究院已构建超30种,超30万小时的高质量方言数据库,首创“蒸馏+膨胀”联合训练算法,解决超大规模多场景数据集和大规模参数条件下,预训练坍缩的问题,实现1B参数80层模型稳定训练
想一下未来50年或者100年,您的孙子或者孙子的孙子,是否还会花费人生中十几年甚至几十年的时间学习一门外语,甚至还学不好?
今天是1024程序员日,也是科大讯飞的1024开发者节,在合肥奥体中心,科大讯飞把它们的开发者节办成了演唱会的形式。
倪捷,腾讯云高级产品经理。北京邮电大学硕士。现在腾讯云大数据与人工智能产品中心AI应用产品组担任高级产品经理,负责智能语音相关AI产品,拥有互联网、金融等行业人工智能落地的丰富经验。本文来自倪捷在“2018携程技术峰会”上的分享。
“整天都在说人工智能,可人工智能到底在哪里呢,为什么到了2022年,自动倒车入库的功能都没普及,导致科目二考试还是那么难。”除了文字上的抱怨,还特意加了张某自动驾驶企业的宣传图。
在人工智能技术的探索征程里,语音语义识别技术一直扮演着先驱的角色,不管是在技术探索还是商业落地方面都走在了前面。近两年来随着深度学习技术的进一步深入,其识别准确率更是得以大大提升。为教育、客服、电信等传统行业的产业升级带来了一大助力,在车载、家居、医疗、智能硬件等领域又开辟出了新的商业应用探索实践。 会议精彩视频回顾 语音语义技术目前发展到了哪个阶段?NLP技术在企业日常业务中能发挥怎样的作用?在十亿级别日活的微信端有何应用案例?在腾讯云海量客户场景下又为企业带来了怎样的助力?9月13日,TVP AI技术闭
在人工智能技术的探索征程里,语音语义识别技术一直扮演着先驱的角色,不管是在技术探索还是商业落地方面都走在了前面。近两年来随着深度学习技术的进一步深入,其识别准确率更是得以大大提升。为教育、客服、电信等传统行业的产业升级带来了一大助力,在车载、家居、医疗、智能硬件等领域又开辟出了新的商业应用探索实践。
AI助力粤省事更懂你 1 多方言智能识别 依托微信智聆实验室,腾讯云AI语音识别为粤省事语音搜索功能提供强大的技术支持,除普通话和粤语外,还支持23种方言智能识别,满足更多省外来粤人员的使用需求,同时对方言保存使用起到重要的意义。 2 优化语音识别精度 用户说话后,系统将多维度判断用户结束语境,精准提取用户讲话的必要关键词,极速回显文本并智能返回结果。 据悉,“粤省事”是广东省政府推出的集成高频民生服务的移动政务服务平台,目前已覆盖公安、人社、教育、税务等近800项高频民生服务,其中将近700项“零跑动”
最近打车,车里一位哥们在侃侃而谈:现在的互联网+,除了打车,其他都是扯淡,没啥用。 我相信现实生活中,这样忽视人工智能时代已悄然来临的人不是少数,而且还很多。 毕竟,从事数据行业的人连2%都不到,更别说真正理解数据的人了。 你也许会说,人工智能是那么高深的技术,我又不做相关的技术,了解那么多干什么。 其实,今天我们谈的不是什么复杂的人工智能高深技术,请注意文章前面的标题:时代。 是的,我们谈的是一个新时代下的个人选择问题。说的更本质一些,其实是在说,这样一个新时代(人工智能时代),人类的思维发生了怎样的改变?进而,我们思考这种思维改变会给个人未来的成长带来怎样巨大的改变和机会。 进一步,你最后会明白这几个问题的答案: 1)为什么中学老师在许多年之后总是感叹: 最终,真正有出息的,都是当年成绩一般般的... ... 2)从1984年洛杉矶奥运会开始,到尽头,国人关注奥运会已经32年了。当年的金牌得主们,除了李宁和郎平,剩下的谁记得呢? 3)为何以前起作用的死磕思维,在人工智能时代,不是最好的人生策略选择。而理解和解答所有的这些问题的前提是,你要真正明白什么才是人工智能时代的核心? 好了,废话不多说,我们先来看看在没有人工智能之前,人类的思维模式是怎样的? 1.单维度死磕思维 在这之前,计算机并不擅长于解决人类智能的问题,也就是我们现在所说的人工智能。 怎样才算人工智能呢? 真正科学定义这个概念的是电子计算机的奠基人 阿兰·图灵(Alan Turing)。
2017年,围绕人工智能的巨头投资、创业押注不绝于耳,融资额度不断刷新纪录。但无论是图像、语言交互,还是算法、机器学习都不足以与实际场景结合,如何落地应用成为最大难题。另一方面,越来越多新技术、新概念的出现,开始让人工智能逐渐遇冷。2017下半年,随着比特币大涨,其底层技术区块链成功抢占人工智能的舞台,几乎占据了投资人、媒体人的朋友圈。
作为人工智能第一股,在技术研发方面,科大讯飞一直走在前沿,尤其讯飞语音一直是这家公司的王牌业务。
自1962年IBM推出第一台语音识别机器以来,语音识别科学已经走了很长一段路。这已经不是什么秘密了。
最近打车,车里一位哥们在侃侃而谈:现在的互联网+,除了打车,其他都是扯淡,没啥用。
来源 | TechCrunch 编译 | 量子位 陈桦 与许多计算机概念类似,在讨论人工智能、机器学习或深度卷积网络时,人们关注的是数学。这些高性能网络的核心是只有超级计算机才能实现的大量运算,而这样的运算成本也正是阻碍人工智能成为设备大脑的关键。 如果这一成本可以下降几个数量级,那么人工智能将可以被轻易地集成至任何设备。来自艾伦人工智能研究所(Allen Institute for AI,简称“AI2”)的XNOR.ai将使这一目标成为可能。 从本质上来看,XNOR.ai是一种计算机原生的数学,帮助计
---- 新智元报道 来源:Facebook AI 编辑:LRS 【新智元导读】Facebook在语音识别上又出重磅新作,继wav2vec, wav2vec 2.0以来,又出完全不需要监督数据的wav2vec-U,小众语言也能用语音识别啦! 相比显示器、鼠标、键盘这些传统的人机交互方式以外,随着语音识别技术的逐渐成熟,和电子产品进行「对话」也逐渐成为一种稀松平常的人机交互。 无论是给计算机或其他设备下达指示,还是回答用户的问题,语音识别在各个方面让电子产品的使用变得更加容易,无需学习,想要干什么只
李根 假装发自 凹非寺 量子位 报道 | 公众号 QbitAI 一年一度,科大讯飞总会通过年终发布会,披露一年成绩,发布最新战略。 与去往年不同,自AlphaGo在2016年横空出世之后,人工智能狂飙突进,以语音起家的科大讯飞,也成了A股市场最受关注的人工智能公司。 即便伴随一些营收、盈利方面的争议,但讯飞年度发布会,依然是各方关注焦点,讯飞甚至国内AI趋势,也可以在此窥见一二,特别是来自资本市场的直接反馈。 比如去年年度发布会至今年,讯飞股价已从30.6元,上涨至60.10元,涨幅96%,其间最高涨幅一
中国语音巨头科大讯飞2014年8月20日在北京召开规模宏大的发布会,展示语音技术最新成果、发布科大讯飞一揽子软硬件产品、启动讯飞超级大脑计划、宣布科大讯飞1亿元创业基金,并对表现突出的讯飞开发者进行了表彰,以鼓励更多开发者进入讯飞生态。科大讯飞董事长刘庆峰在会上做了近两个小时的演讲,并进行了大量的现场演示,为了演示智能语音车载系统,甚至不惜耗费巨资将一辆MPV轿车从场外吊入位于国际会议中心4层的场馆。台上还有一个模拟智能客厅,核心家电一应俱全。这场发布会耗资不少,一定程度表明科大讯飞高调拥抱智能硬件大潮的
最近打车,车里一位哥们在侃侃而谈:现在的互联网+,除了应用在了打车上,其他都是扯淡,没啥用。
【新智元导读】 所谓“入口”,就是网络大数据汇聚的必经之地。入口历来是各大小公司的必争之地。亚马逊 Echo-Alexa 软硬合体,能够以人工智能的旗号,从智能手机的头上抢来“入口载体”的桂冠吗?作者认为,Alexa不足以形成争夺网络数据入口载体的绝对优势,语音交互尚不具备人机交互范式代际更替的颠覆性力量,语义落地对Alexa的成功具有更加决定性的贡献,不以获取用户数据为目的的端设备都是耍流氓。本文最后讨论了什么样的玩家能够最终胜出。 “入口载体”之争 最近,亚马逊旗下的智能音箱产品 Echo 和出没于 E
1966 年,一个由 MAD-SLIP 程式语言编写,在 36 位元架构的 IBM 7094 大型电脑上运作,所有程式编码仅有 200 行左右的聊天机器人,被 MIT 的德裔电脑科学家 Joseph Weizenbaum 发明出来,名叫“Eliza”。
近日,全球著名的信息技术、电信行业和消费科技咨询公司IDC(国际数据公司, International Data Corporation)发布了《对话式人工智能白皮书》(下文简称《白皮书》)。《白皮书》认为,全球人工智能技术支出到2020年达到2,758亿人民币,未来5年复合增长率达到50%。到2020年,中国人工智能技术支出将达到325亿,占全球整体支出的12%。 随着对话式AI生态系统的不断丰富,新产品、新应用也为金融、零售、医疗、制造、政府、教育等六大传统行业带来了效率和价值的提升
ta不仅颜值高、接地气,能说一口流利的普通话、合肥话以及英语、德语、法语等多国语言,还能及时预警各类电信网络诈骗的作案手法和防范技巧。
人工智能(Artificial Intelligence,AI)是指计算机像人一样拥有智能能力,是一个融合计算机科学、统计学、脑神经学和社会科学的前沿综合学科,可以代替人类实现识别、认知,分析和决策等多种功能。如当你说一句话时,机器能够识别成文字,并理解你话的意思,进行分析和对话等。
将照片翻译成语言、用户消息排序、虚拟助手和聊天机器人……Facebook 的「语言技术组」正在用人工智能改变 Facebook 用户与世界的交互方式。
【新智元导读】当地时间7月7日上午,第七次“16+1”领导人会晤在保加利亚举行,李克强总理应邀到访。在人工智能产品区域的科大讯飞展台,两位总理用翻译机进行了有趣的互动,总理还亲自购买翻译机赠送给保加利亚总理鲍里索夫。
机器之心报道 作者:蒋思源、李泽南 自我们用二进制表征着电路,或与非构建着计算机基石,开发者就再也离不开 2 的指数与 1024。 今日,科大讯飞首届全球 1024 开发者节正式开幕。在这里,我们是一个个最小的编码模块,以最具热情与创造力的方式构建起一个个强大的模型。正如深度学习,每个开发者以二进制(激活或非激活)堆叠出一层层强大的神经网络。在这里,机器之心同样以 2^i(i∈1,2,...,10)的方式构建每一个隐藏层的单元数,为 1024 开发者节定制一个全连接网络(详见文后彩蛋),与所有开发者一起学习
上周,谷歌将Google Assistant下放到Android 6.0,而苹果的Siri、微软的Cortana、亚马逊的Alexa最近也动作频频,一场围绕下智能语音助手的大战正在全面展开。 西雅图艾伦人工智能研究所CEO Oren Etzioni表示,Siri作为最早入场的选手,其语音理解和回答问题的能力并不突出,白白浪费了先发优势。 但Siri并不是一无是处,它仍然有其他语音助手目前无法匹敌的优势:支持36个国家的21种本地语言。由于大多数的智能手机都是在非英语国家销售,对本地语言的支持将是非常重要的一
上周,谷歌将Google Assistant下放到Android 6.0,而苹果的Siri、微软的Cortana、亚马逊的Alexa最近也动作频频,一场围绕下智能语音助手的大战正在全面展开。 西雅图艾伦人工智能研究所CEO Oren Etzioni表示,Siri作为最早入场的选手,其语音理解和回答问题的能力并不突出,白白浪费了先发优势。 但Siri并不是一无是处,它仍然有其他语音助手目前无法匹敌的优势:支持36个国家的21种本地语言。由于大多数的智能手机都是在非英语国家销售,对本地语言的支持将是非常重要
最近拼车,车里一位哥们在侃侃而谈:现在的互联网+,除了打车,其他都是扯淡,没啥用。
第二届网易未来科技峰会在北京悠唐皇冠假日酒店隆重举行。在下午的智能硬件论坛,明势资本创始人黄明明、图灵机器人CEO俞志晨、云迹科技CEO支涛、小鱼儿科技CEO宋晨枫、出门问问CEO李志飞、重创新创始人王冠雄围绕“从家庭服务机器人如何成为大白?”的主题进行了一系列讨论。 对于当前机器人及人工智能领域的现状,俞志晨认为,人工智能目前很多问题都需要解决,还不成熟,创业者需要做的是让这个很难的事情一步步去实现。进一步来讲,”在当前,机器人需要抓的是一些用户的细分需求点,比如小鱼,能把陪伴这种比较小的需求做好,就能解
【新智元导读】巨头都在争相开源,那么彼此之间会不会形成竞争?近日,火狐浏览器的所有者 Mozilla 开源了一个语音数据库,与谷歌所做的数据库高度类似。这篇文章比较了两家公司数据库的构成要素和数据搜集方法。文章认为,那些免费的音频资源更实用,甚至比那些大公司秘而不宣的数据集更有价值。 一个语音虚拟助理,比如Siri、Alexa、Cortana或者Google Home的表现,很大程度上是由驱动其的数据决定的。要训练这些程序来理解你正在说什么,首先要拥有大量关于人类对话的现实案例数据。 这让现有的语音识别公司
本文主要探讨了人工智能的发展历史、应用领域和未来的发展方向。从五六十年代的神经网络到现在的深度学习,人工智能技术不断发展和创新,推动了计算机视觉、语音识别和自然语言处理等领域的进步。未来,人工智能将在游戏 AI、机器人技术、自动驾驶等领域发挥更大的作用,同时,也会在创新、数据安全和知识产权保护等领域提出新的挑战。
论文链接:https://www.researchgate.net/publication/353652910_Dynamic_Multi-scale_Convolution_for_Dialect_Identification
金磊 发自 凹非寺 量子位 | 公众号 QbitAI AI成精,“逼疯”程序员;AI做高数,成绩超过博士;AI写代码,成功调教智能体…… 看多了这种故事,你是不是也觉得,AI太卷了,要上天了。 今天回归本源,讲点不那么玄幻的。AI为什么会进化?底层其实没有秘密,无非是语言、视觉等几大基本功。 其中,语言能力对AI的智能水平有决定性影响。视觉研究怎么“看”,语言研究“听”、“说”和“理解”。 对人类来说,“听”、“说”、“理解”相加,基本等于思维能力,对AI,道理也差不多。 最近,咨询机构Gartner发布《
这四个阶段是人类文明发展的不同阶段,也是不同领域的重要发展时期。在每个阶段,人们都在不断探索和创新,以实现更加高效和智能的生产和生活方式。 工业革命中,英国机器大生产取代了手工劳作,需要大量人力;电气时代的发展,使得以电为基础的电气自动化成为可能,不再需要大量人力。 计算机技术和互联网技术的发展,使得数据处理和分析越来越简单,不再需要大量人工智力。
6月28日,中国人工智能峰会(CAIS 2019)上,腾讯民汉翻译从诸多项目评选中脱颖而出,获得“紫金技术创新奖”。 “CAIS紫金奖”颁奖现场 作为一款定位于贴近用户的民汉信息互译产品,腾讯民汉翻译已经成为国内首个在小语种领域布局维、藏、蒙、哈、朝、彝等多语种全方位同声传译、实时互转的民汉交流工具。腾讯正在用技术践行“科技向善”理念。 腾讯民汉翻译产品整体框架 性能优势明显,各类竞赛获奖无数 经过团队多年对海量民族语音、语言、图像、文本的海量标注,以及多轮功能迭代和用户交互体验优化,使得“腾
领取专属 10元无门槛券
手把手带您无忧上云