前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >斩获23项冠军,日均调用破万亿!百度交出年度AI成绩单:语音语言领衔技术突破,国产自研成大趋势

斩获23项冠军,日均调用破万亿!百度交出年度AI成绩单:语音语言领衔技术突破,国产自研成大趋势

作者头像
量子位
发布2019-12-24 17:05:17
5500
发布2019-12-24 17:05:17
举报
文章被收录于专栏:量子位量子位量子位
乾明 雷刚 发自 凹非寺 量子位 报道 | 公众号 QbitAI

刚刚,百度一年AI成绩单官宣。

作为中国AI头雁,百度的成绩单不止代表巨头公司业绩,也代表了技术前沿现状和产业基本情况。

而且诸多进展,也是全新起跑线上全球AI发展的侧影,比如最明显的4大趋势特点:

  • 语音语言领衔基础技术突破,AI突破从感知智能进入认知智能时代。
  • 巨头玩家忙于打造“底座”优势,搭建生态平台。
  • AI落地进入工业化大生产时代,价值在基础业务中展现,也通过新场景中验证潜力。
  • 自主可控性进一步加强,自研芯片服务器量产,并与国产AI框架、算法产生整合优势。

所以百度这份2019年度成绩单,究竟说了啥?又体现了哪些行业共同趋势?

我们提纲挈领、抓取归纳其中要点,从点到面一文看懂。

百度AI的2019:技术→平台→生产力

整份成绩单中,技术突破与生态建设是重中之重,占据了一半篇幅。

剩下的一半中,应用落地与产业升级占据了很大篇幅。

这也体现出了AI当前发展阶段——技术仍旧占据核心,但落地以及产业应用正在被放到更加重要的位置。

整体上来看,百度的成绩单可以分为三大部分:

  • 一是基础研究。
  • 二是技术生产力转换。
  • 三是生态平台的建设。

首先看基础研究,一年包揽了23项国内外竞赛冠军。

集中于百度大脑,语音、视觉、自然语言处理、知识图谱等方面都有成果出现。

特别是语音语言,在2019年迎来阶段性丰收时刻。

语音识别方面,百度提出了流式多级的截断注意力模型 SMLTA,这是全球范围内首次实现流式注意力建模,超越整句注意力模型的性能,大幅提升了语音识别准确率和速度(15%-20%),也是国际上首次实现在线语音识别大规模使用注意力模型。

语音合成方面,针对风格迁移、音色模拟和情感拟人的三大领域内挑战,百度推出语音合成技术 Meitron ,仅需20句话就可以制作一个人的专属声音

此外,作为认知智能的“奥林匹克”,自然语言处理技术(NLP)的进展在今年最为夺目,全球亮点频出。

代表中国“参赛”的百度,交出了可持续学习的知识增强语义理解框架ERNIE(艾尼),在16 个中英文任务上超越BERT、XLNET,取得SOTA 。

2019年12月,ERNIE在GLUE上登顶第一,并以9个任务平均得分首次突破90大关,刷新榜单历史,超越微软、谷歌提出的一众国际顶级预训练模型。

基于语音和语言方面的突破,百度还提出了基于深度注意网络的多轮响应选择匹配模型——DAM,口语理解能力被大幅提升。

值得一提的是,虽然全球范围内视觉为核心的感知智能已经迈步广泛落地应用期,但在2019年,百度还是秀出了“百尺竿头更进一步”的基础研发实力。

除了形成包括图像、视频、AR/VR、重要垂类、软硬一体化五大方向的特色视觉技术矩阵。

百度还在CVPR 2019豪夺10项冠军,包括OCR、物体检测、视频理解、目标跟踪等图像与视频技术领域。

此次AI复兴,除了算法,另一项重要基础变革在于计算力

百度也在成绩单中详细分享了突破:

2019年12月,基于百度自主研发的中国首款云端全功能AI芯片“昆仑”的云服务器正式上线,在150瓦功耗下能带来260万亿次定数的AI运算,提供512GB/s的内存带宽。

量产了专为远场语音交互打造的百度鸿鹄芯片,100mW 左右平均工作功耗,即可支持远场语音交互核心的阵列信号处理和语音唤醒能力等等。

而且,百度的算力发展并不仅仅只是单点发展,也已经与算法、飞桨框架连点成线,并交织成了坚实的基础层,形成了协同效应。

通过芯片、连接、系统和调度的协同设计和技术创新,对AI计算架构进行升级,可以提供百万TOPS的强大算力。

正在建造的计算集群,基于百度飞桨研发的AI控制系统,设计年均PUE1.15,基础设施能耗降低70%,每个可用区每年节电超过2亿度,相当于10万户居民一年的用电量。

下一代计算——量子计算方面也有新突破。

研发出国际领先、国内第一的云上量子脉冲系统“量脉”,可将量子计算软件指令(逻辑门)转换成控制量子硬件的脉冲序列,算法性能较同类工具实现成倍的提升,是实现量子软硬件连接的关键桥梁。

当然,区别于科研机构,百度作为企业组织,基础技术突破自然不会止步于理论本身。

技术转化成生产力方面,百度展示了一幅AI落地全景图。

百度旗下的多款应用与业务中已经转换成了AI引擎,而且其也正在开放能力,共享产业升级红利。

小度助手5.0 上,成熟应用了全双工免唤醒能力,实现了“一次唤醒,多轮交互”免唤醒词连续对话,这也是全球领先的技术落地。

援引第三方机构数据,第二季度小度系列智能音箱出货量位居全球第二、国内第一,同比增长率高达3700%。

而且技术突破和落地,也进一步打破产品旧边界。作为“音箱”被归类的AI交互硬件,在小度系狂飙突进下,开始真正展现AI时代交互终端的样子——AI音箱不再是音箱。

百度输入法方面,刚才提到的重要基础突破,流式截断的多级注意力模型(SMLTA)已经上线,效果立竿见影,在线语音识别相对准确率,比同领域最优玩家还有高15%。

好消息是,离线语音识别准确率已经达到在线识别水平,且可以实现高精准中英文混合语音输入、方言免切换语音输入,这也是业内首次。

机器翻译方面,继提出了多任务学习、多智能体联合训练等前沿方法,在2019年WMT评测中取得中英翻译第一,提出了首个具有预测和可控时延的同传模型,也是首个语义单元驱动的上下文同传模型,并研发了语音到语音的同传系统,无需经过语音识别转录,同样是业内首次。

而视觉为代表的感知智能落地,最具业内反响的是自动驾驶

在业内“华山论剑”顶会CVPR 2019,百度Apollo公开了国内唯一的纯视觉L4级自动驾驶解决方案——Apollo Lite,能够支持对10路摄像头、200帧/秒数据量的并行处理,单视觉链路最高丢帧率能够控制在5‰以下,实现全方位360°实时环境感知,前向障碍物的稳定检测视距达到240米。

相比旋转式激光雷达感知方案,视觉感知方案价格低廉且便于获得。并以计算机视觉和AR技术研发了一种增强现实的自动驾驶仿真系统(AADS),使用激光雷达(LiDAR)和相机扫描街景。

合成虚拟形象也是今年最“性感”的落地应用之一,并且达到了量产的水平。

百度与央视合作打造AI虚拟主持人小灵,亮相央视2019五四晚会;与澎湃新闻合作打造了第一个真人形象的虚拟主播早晚新闻栏目;与浦发银行合作打造了业内首个“金融数字人”。

基于知识图谱的视频语义理解,则已经在百度视频搜索、推荐、内容生成等多个产品上线。

通过对视频的视觉、语音、文本的多模态知识解析,在多元异构知识图谱上建立关联,并通过计算推理,建立对视频的深度语义理解,大幅度提升视频理解效果。

而且AI落地在今年也不再阳春白雪,更多接地气、可以被寻常百姓家感知的科普式方案也引起反响。

比如百度AI开发者大会上,打造了能说会道的机器臂“茶博士”

利用3D视觉技术,可以对茶杯的位置进行检测和追踪。通过机器人运动规划和控制,可以对工作空间进行碰撞检测,避开障碍物。完成实时规划运动后,可自动生成倒茶轨迹。语音语义联动技术解析,更是让机器人像“人”一般,听得懂,说得好,做得准。

最后,有技术、有落地应用之外,百度更宏大的雄心也徐徐展露——基于技术与应用优势,百度希望更进一步:打造平台,打造生态,成为AI世界的底座。

今年成绩单中,开发生态方面的数据同样非常醒目。

从百度当前的业务布局来看,其已形成了4大底座平台:

  • 百度大脑AI开放平台
  • 飞桨产业级深度学习开源开放平台
  • Apollo自动驾驶开放平台
  • 小度开放平台

并且在2019年都实现了爆发。

百度大脑开放平台已经在语音、视觉、语言等方面实现全面升级,具备深度学习框架、场景化AI能力、定制化训练平台到软硬一体模组和解决方案等。

自2016年以来,百度已开放228项AI能力,开发者数量超过150万,日均调用量突破1万亿次,语音、人脸、NLP、OCR调用量中国第一,是业内最全面、最领先、服务规模最大的AI开放平台。

援引IDC最新报告,百度飞桨与谷歌、Facebook名列前三,领衔中国深度学习平台市场,也是市场份额前五中唯一的国货。

Apollo自动驾驶开放平台已经汇聚了全球156家生态合作伙伴;在全球,有97个国家超过3.6万名开发者使用Apollo开源代码,开源代码数量超过65万,已成为全球最强大、最开放、最活跃的自动驾驶平台。

而且开放能力进一步打破边界,在刚召开的首届Apollo生态大会上,百度Apollo拓展裂变成三大平台:自动驾驶开放平台、车路协同开放平台,智能车联开放平台,成为中国自动驾驶基建国家队代表。

小度技能开放平台上,技能开发者数量已经超过3.7万人,可提供包括游戏、效率工具、网络电台、直播、儿童教育、智能家居等3500多种技能支持。合作伙伴数量已经超过500家,可以控制的IoT智能家居设备已经超过了7000万。

此外,百度还开源了中国首个边缘计算框架BAETYL、自研底层区块链技术,并发布了多个工业级的领域数据集,如大规模自动驾驶数据集、街景图像数据和文字场景数据集、视频精彩片段、场景解析、机器阅读理解、中文句子及相应的开放域信息提取事实数据集等等,来促进算法研究,推动AI发展。

比如下图,就是ApolloScape数据集示例:上半截为彩色图像,下半截是其二位语义标签:

正如百度董事长兼CEO李彦宏所说:“作为一家平台级企业,成就他人、造福社会,这是百度创始初心与能力之所在,更是百度在行业发展关键时刻责无旁贷之所在!”

正是基于如此,百度才能够通过百度智能云的“云+AI”能力,为各行各业大规模输送百度的AI技术成果与平台能力,成效也非常显著。

根据IDC在11月底发布的中国AI云服务市场报告,百度智能云在AI技术、市场和商业上处于中国领先地位,超过了阿里云、AWS等一众厂商。

百度CTO王海峰感慨,百度在2019年提出“人工智能进入工业大生产阶段”,如今他们已经探索了AI进入“工业大生产”的真实路径,推动AI迈入自动化、标准化和模块化的新阶段,并与百度业务以及各行各业的生产实践深入结合,加速产业智能化进程。

在互联网、金融、智能城市、工业制造等行业已经拥有标杆性落地案例。

比如,与中国联通打造的智能客服已经在中国联通三省一基地上线;与央视网共建人工智能研发中心,打造媒体行业的AI软硬件产品;与精研科技打造智能质检车间,提升制造业质检效率,降低用工成本等等。

但百度的技术,并不仅仅希望体现在商业价值上,还希望通过社会价值,展现AI福祉。

成绩单中披露,2019年“百度 AI 寻人”平台,用户发起照片比对超过了36万次,9000多个走失者与家庭重新团聚。

百度还发布了听障儿童无障碍阅读计划,推出了全球首款听障儿童AI手语翻译小程序,能将绘本文字翻译为手语,帮助听障儿童实现无障碍阅读。

此外还将AI应用在了台风路径查询、濒危土家语保护、改造盲人按摩院等方面,进一步发掘AI价值。

所以百度AI如何回答2019?上述种种业绩就是关键要素。

而且巨头玩家年度交卷,自然也是整个AI产业的共性、趋势反映。

正所谓窥一斑见全豹,百度的成绩单又反映出怎样的AI 2019

百度成绩单背后的全球AI六大趋势

或许你会疑惑,百度上述新突破、新进展,为何发生在2019?

背后有百度的技术积累开花结果,但也是AI发展进程使然。

这也是为什么百度的2019更值得被复盘解读,其中展示全球AI领域发展的六大趋势

趋势一:CV之后,NLP领域成为下一个突破频出的领域

在百度交出的AI成绩单中,更多的AI突破与生产力转换都集中在语音语言理解方面。

比如语音识别、语音合成、虚拟主播、机器翻译、人机对话、知识图谱等等,并落地到了小度助手、百度地图、百度视频等等产品与应用之中。

这也体现出了整个人工智能当前的技术突破集中点:自然语言处理方向。

计算机视觉是人工智能产业中最为成熟的方向,人脸识别已经进入了寻常百姓家,整个方向彻底进入落地期。

早年围绕这一技术发展起来的第一波AI独角兽,也已经在想办法向更多的方向拓展。旷视发力IoT供应链,依图做起了芯片,而商汤在教育、AR、自动驾驶方向频频发力等等。

与此形成对应的是,NLP方向突破频频。谷歌的BERT直接催生出了更多的变体,机器在自然语言处理与语义理解上更为突出,GPT-2的问世也进一步彰显出了整个方向的创造力与活力。

众所周知,AI可以被划分为“感知智能”和“认知智能”两大版块。

但2012年ImageNet石破天惊开始,感知智能的进展要遥遥领先于认知领域,直观类比来说,感知就像一个人类能考到95分的试卷,而认知领域,够到及格还挑战连连。

于是2019年,全新气象和里程碑进展频频,以语言语音为代表的认知,进入突破期。

趋势二:落地为王,价值重估,AI发展回归理性

2019年,整个人工智能产业变得更加务实。

绚丽的Demo少了,关于将AI应用到产品、落地到场景中呼声更多了。

这是对前些年人工智能领域“大跃进”的最直接回应,AI发展理性回归,从资本方到企业,整个行业的参与者都在要求AI展示“降本增效”,来转化成真实的生产力。

2019年的百度,在落地与AI生产力转换方面再明显不过。

最典型如自动驾驶领域有L4级视觉感知解决方案Apollo Lite和增强现实的自动驾驶仿真系统,对于自动驾驶落地,全球都在要求进入“平民”时代,依靠堆高精尖传感器的“贵族”玩法,市场空间越来越小。

这也是全球自动驾驶经受重估的一年。

国际上,Waymo模式遭遇质疑和重估,摩根大通将其估值调低40%,而在货运领域自动驾驶落地则热火朝天,两种不同形态一对比,才知道“看不见的手”想要的不再是遥远的迷人图景,它想要的是——少废话,证明价值吧。

趋势三:人工智能进入工业大生产阶段,需要标准化、自动化和模块化

在谈到人工智能的时候,很多人都会将其提为“新一轮的科技革命”,并将其比作蒸汽、电力等等。

但现实给出的种种反馈都颇为直接地展现出,在给出这一结论的时候,要用将来时态。从现在到将来缺了什么?

王海峰在2019年提出观点称,前三次工业革命的核心技术都具有很强的通用性,呈现出标准化、自动化和模块化的工业大生产特征。

而人工智能想要如此,自然也需要具备这些特征。这也是人工智能产业向前发展的根本所在。

前些年的人工智能落地,都体现在一个case接一个case的模式,现在进入工业大生产阶段,则要求人工智能体现出更加通用特征,一个产品能够处理多个case,人工智能的能力要标准化、自动化和模块化。

百度的成绩单中,百度大脑、飞桨、小度助手、Apollo等平台,都是百度对这一趋势给出的回应。

飞桨、Apollo等开放平台被国际知名第三方机构波士顿咨询,作为中国AI发展的代表,并在全球范围内与谷歌相提并论,认为开放平台正是巨头优势和推动智能化变革的关键。

由此第四大趋势也愈加风劲。

趋势四:大公司大平台争夺“底座”愈加激烈

毫无疑问,将人工智能转化为生产力需要生产工具。谁提供的生产工具使用的越多,谁就能在生产力转化中占据上风,毕竟这是人工智能驱动的世界底座。

伴随着2019年人工智能落地提速,大公司大平台争夺“底座”愈加激烈。TensorFlow和PyTorch展开“厮杀”。前者推出2.0版本,后者将目光也进一步强化端侧部署,各不相让。

毕竟以深度学习框架为核心的深度学习平台,下接芯片,上承各种应用,是“智能时代的操作系统”。

百度飞桨也在2019年迎来多次进化,推出多端多平台部署的高性能推理引擎Paddle Lite、发布超大规模深度学习模型训练技术等等动作,也为其更好地展开竞争提供了支撑。

国内竞争中,华为加入战局、阿里从底层芯片和架构出发,腾讯也加大开源力度……

所以争夺的AI时代“底座”,也是新时代的“铁王座”。

趋势五:AI向善、伦理问题更受关注

在人工智能技术产生商业价值的同时,如何更好地利用人工智能技术也成为世界范围内被广泛讨论的话题。

在学界,有今年3月斯坦福大学正式成立以人为本AI研究院,李飞飞担任联合主任,推动人工智能研究、教育、政策和实践,以改善人类状况。在业界,Facebook、谷歌等科技巨头在AI应用方面的做法也屡遭抗议与审查。

国内也不例外,关于AI伦理的探讨、探索也在展开。在百度的成绩单中,AI伦理、安全以及社会责任都被着重强调,并给出了探索成果。

一方面是打造了完整的AI安全体系,另一方面在AI向善方面落地:“百度 AI 寻人”平台帮助超过9000个走失者与家庭重新团聚。

AI在台风路径查询、濒危土家语保护、A改造盲人按摩院等方面也都发挥着重要作用。

此外,另一巨头腾讯,也在AI时代变革思考后,把“科技向善”正式写入公司使命和愿景,体现了对新时代伦理的重视。

全球范围内,谷歌的AI军用代表事件则内外广受争议,Facebook年初开始的数据泄露事件则被批判至今……AI时代面临的新伦理、隐私边界,并非说说而已。

趋势六:自主可控正在成为中国AI热词

最后,全球局势带来作用力,中国呈现反作用力。

2019年的断供危机以及“实体清单”威胁,让自主可控成为新的关键词。

在百度成绩单中,完全自主研发的“百度昆仑云服务器”,让中国AI跑在自主可控的AI芯片上,与飞桨、ERNIE等国产算法形成了软硬件一体的核心竞争力。

而且,百度的努力也不仅仅体现在自身体系之中,飞桨还与华为麒麟、寒武纪等国产芯片深度合作,打通深度学习框架与芯片AI算力,提升中国的AI竞争力。

而且更进一步,所有中国AI公司、科技公司,经此一役,已经明白“原创”、“自主”和“脱钩方案”的必要性和重要性。

AI造芯浪潮复兴,依图等算法公司深入AI芯片腹地,联想等公司也推出自主可控防断供方案,国家层面则在底层技术和基础科研方面,前所未有重视。

虽然短期内对所有技术公司形成了挑战,但长远来看,或许也是历史性机遇:

自强则万强。

中国AI人才培养基地,专利申请重镇

对基础和底层重视,最直接体现就是对人才、专利方面的重视。

这一次百度成绩单中,也有重点展示。

今年是百度创立20年,过去20年中,从人才角度而言,国内以技术著称的百度,直接和间接培养了大批人才,成为名副其实的技术领域的“黄埔军校”。

而更令人欣喜的是,百度在AI发展中主动展现出的人才培养心态。

根据百度成绩单,百度AI已经形成了囊括师资培训、学生赛事、课程共建以及教材出版等多个维度产学融合生态。

推出了“全国高校深度学习师资培训班”、“飞桨博士会”、“AI快车道”、“黄埔学院”、“在线深度学习集训营”等项目,一共培养1000名专业教师,助力200+高校开设深度学习课程,为近1000家企业提供技术和应用培训。

而硬件方面,百度上线AI Studio 教育版,这背后是价值超过千万人民币的上千张GPU卡,作为师资培训配套“教具”,免费提供给高校使用等等。

虽然百度人才培养模式,更多出于“底座”雄心,但客观而言,一定会加快中国AI技术进一步普及,以及更多人才带来星火效应。

从整个产业发展而言,乐见其成,也希望巨头投入更大资源。

人才之外,还有专利

重视基础科研,自然会体现在知识产权能力上。国家工业信息安全发展研究中心12月发布的《人工智能技术专利深度分析报告》中给出例证,百度专利申请数量在国内排名第一,达到5712件,超过第二名近1600件。

在中国专利申请数量超越美国方面,可以说是当为头功。也算是作为国产AI第一大厂的实力和担当。

One more thing…

回顾2019年,正如王海峰所总结的那样,百度AI打造了扎实的底座;推动了真实的改变;创造了值得信赖的未来。

当然,AI突破还在继续、AI落地也还在继续,从这份百度成绩单中我们也能窥见到中国AI领域的一个缩影,让更多人了解AI,也能给大小公司的AI之路提供参考,知晓智能时代变革如今身处何处、未来又走向何方。

不过,每个人都有每个人的AI见证时刻。

所以也想小小互动一下:

2019年里,你印象最深刻的AI事件是哪一个?

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-12-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 百度AI的2019:技术→平台→生产力
  • 百度成绩单背后的全球AI六大趋势
  • 中国AI人才培养基地,专利申请重镇
  • One more thing…
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档