首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

小米AI这一年

“手机×AIoT”双引擎战略下,小米AI 加速。

明年再扩招5000名工程师,小米加速储备人才

小米在招揽人才上再使出 “大招”。

近日,雷军在小米2020年小米开发者大会上宣布,小米在2021年将在十大领域扩张5000名工程师,占小米目前员工总数超20%。

“人才是创新之源,提升技术实力的第一步,就是聚拢最顶尖的人才”,雷军表示,小米目标创造最好的工作环境,以激发工程师的创造力和创新力。“未来十年,我的愿望之一就是,要继续努力将小米打造成工程师们向往的圣地”。

小米在招人上一直不遗余力。雷军以相机技术部门举例,2018年相机部成立时工程师只有122人,目前相机部工程师已达826人,增长了近6倍,这还不包括AI等为相机提供技术支持的350多位工程师。小米相机研发中心的选址也主要以人才聚集地作为主要考虑因素。目前,小米已在北京、巴黎、东京、圣地亚哥等城市设立了九地研发中心,共设立5个国际研发中心。

今年受到疫情黑天鹅影响,不少互联网公司减少或者关闭招聘编制。但小米启动了创业以来规模最大的校园招聘。2020年,小米共入职了2252名大学生,其中研究生以上学历达1470人。

这两年,小米AI引入了不少业界大牛人物。2018年,中国科学院信息工程研究所研究员王斌加盟小米,出任小米AI实验室NLP首席科学家,负责自然语言处理基础平台的构建及前沿技术的探索与创新。2019年2月,小米进行组织架构调整,王斌被任命为AI实验室主任。同年11月,语音识别大牛Kaldi 之父 Daniel Povey 加入小米,出任小米首席语音科学家,将负责开发下一代 Kaldi 。

上周,根据全球三大知名调研机构的数据,小米在全球智能手机市场的份额重回世界第三。这是继小米在2014年后再次回归全球第三。雷军认为,这次回归是6年来积极补课、夯实基础的结果,也反映了小米过硬的技术实力。

雷军提到,今年小米今年研发投入将超过100亿元,研发投入在全国公司中可进入前20名。他表示,小米未来还会继续死磕硬核科技。小米还将在相机、屏幕、充电、IoT、智能制造等多个领域继续加强研发投入。

“手机×AIoT”战略下,小爱同学5.0版本5大升级

小米集团副总裁、技术委主席崔宝秋博士开发者大会上发布了四大新技术:小米同学5.0升级;新一代Kaldi;物联网软件平台Xiaomi Vela;开放三大系统影像能力,包括手机影像能力向第三方APP开放,手机影像处理能力为IoT设备赋能,复眼分布式相机开放协议。

小爱同学5.0版本共有五大升级,包括全场景智能协同、对话式主动智能、多模态融合交互、个性化情感声音和智慧学习助手。

5.0版本发布了“个性化动态语音识别技术”、“就近唤醒技术”等多项自研技术。新版本的小爱同学具备对话式主动智能,在交互上更加自然。

在引导对话方面,小米人工智能部副总经理,小爱同学研发负责人王刚在接受InfoQ等媒体采访时表示,小爱同学开发了“陪我聊聊天”功能。她会更主动与用户进行交互,即便当用户本身没有太强的意愿与小爱同学主动对话时,小爱同学也会主动跟用户聊聊天,在对话过程中,小爱会主动抛出一些带有用户专属信息的话题与用户沟通,拉近与用户的距离。

此外,小爱5.0版本能对家庭中的家居基于用户的意图进行统一决策,多设备协同配合,成为家庭智能生活助理。

小米集团人工智能部总经理、AIoT战略委员会副主席叶航军在采访中表示,这一变化是顺应小米战略升级做出的。今年8月,小米发布了新战略 — “手机×AIoT”战略来构建智能生活。

为配合该战略,小爱同学进行了相应的升级,她现在不只是语音助手,还覆盖了在智能生活上的方方面面,希望降低用户使用智能产品的门槛。

据悉,截止6月30日,小爱同学累计唤醒次数达617亿次,全球激活设备数2.28亿,小爱同学月活跃用户达到7840万。

小米AI的2020

小米AI实验室主任、小米NLP首席科学家王斌介绍了小米AI技术在过去一年来的进展与应用。

王斌表示,小米AI需求主要来自于公司内部,包括硬件产品、电商及新零售、互联网服务等“铁人三项”业务。

基于此需求,小米的AI战略分为两个部分,一是打造核心AI能力,二是通过开放合作建立合作关系,将技术输送给社会。

小米AI目前已经建立了比较完整的技术图谱。

王斌详细介绍了小米在计算机视觉、NLP、智能语音、机器翻译、知识图谱、机器学习等AI技术方面的进展。

在计算机视觉方面,大的技术突破主要为HDR/超级夜景、超级分辨率、文档/OCR、魔法换天、魔法分身、Vlog等。智能语音技术近一年的成果主要体现在唤醒、识别、生成和声纹技术方面。在知识图谱技术上,小米在知识问答,智能坐席辅助、智能外呼、客服机器人等技术获得多项创新。小米在机器学习方面近一年的成果主要体现在端侧深度学习推理框架MACE 、广告推荐系统AutoSparseDL 、深度学习云服务平台CloudML、AutoML等方面。

在自然语音处理技术方面,小米自然语言处理平台MiNLP 平台最新版发布,包括26个模块,落地30多个业务,目前MiNLP每天输出服务80亿次;抗噪机器翻译、统一机器翻译技术取得进展,目前已经落地手机、小爱同学等业务;在多模态内容理解方面,能够联合文本、语音、视频进行联合分析,已落地信息流、广告等业务;人机对话上,改写回复、生成式对话,多样性回复等技术已应用在小爱同学的闲聊技能上。

值得一提的是,MiNLP 平台后续准备开源。

小米集团副总裁、技术委员会主席崔宝秋在开发者大会现场发布了MiNLP平台开源计划,MiNLP的分词功能将于11月中下旬正式对外开源,词性标注功能将于明年一季度开源,命名实体识别功能将于明年二季度开源,语义相关功能将于明年三季度开源。

王斌向InfoQ表示,之所以决定开源MiNLP是因为,小米AI吸收了业界开源的成果,小米希望将自己的开源结果分享给社会。此外也希望更多开发者从使用MiNLP中受益。他提到,团队内部很早就计划开源MiNLP,并为此花了近半年的时间准备。而为什么在这一时间点开源,并没有特殊的安排,碰巧在MIDC大会前一周,该项目在开源委员会评审正式通过。

开源的NLP工具主要分为两类,学术界开源和工业界开源。学术界开源模型多而复杂,能为对学术研究带来很大帮助。工业界开源,目前业内一些公司诸如百度等也开源了一些NLP工具。

王斌介绍,与学术界相比,小米MiNLP 是工业级代码,自上线2年来已历经工业界上线考验,最后才把这个好的版本拿出来。这是工业界开源很好的一个办法,并不是纯学术的。

与工业界开源相比,小米MiNLP在设计时在借鉴业界做法的同时针对具体性能提出了自己的特点,例如在支持的系统上,百度开源的NLP 工具支持某一类底层的系统,小米MiNLP则支持多种标准的分布式系统。此外,针对通用的分支系统难以应对线上各种复杂情况的难点,小米MiNLP在开源过程中采用了随时进行干预的机制,用户可以很灵活地将自己的东西放上去,并在短时间内获得一个更符合线上需求的版本。

目前,小米AI应用以自主研发占据主导,并为全面赋能为小米的各个业务线。

谈到小米人工智能的未来。叶航军表示,小米AI已有了比较明确的短期目标和长期目标。

短期目标目前有两个大方向,一个是AI产品和小爱同学要支持好小米的智能生活战略,即“手机×AIoT”构建智能生活的战略。因为在这个战略中,小爱同学是非常重要的环节,可以认为,她发挥的是一个入口和落地的作用。另一个是AIOT方向,这六大技术方向现在都有非常明确的业务和落地场景。现在大家对AI的期望很高,其实它有非常多的技术问题解决得还很不好。这是我们后面要努力把这个事情做好的一个决心。

长期目标也主要有2个,一个是要把各个环节的智能化做的更深入一些。 现在很多环节其实并不智能,在整个小米的业务体系里面,需要把各个层面的智能做得很深入。除了用户可见的产品体验以外,还有一些不太容易注意得到的场景,比如客服也是需要智能的。现阶段用户对客服的体验可能还不太好,大部分客服的问题其实是相对比较简单的问题,对目前的AI来说,都是能解决的问题。因此,针对这个方面,小米也在加大投入。

第二个长期目标是,往产业的上游去做。例如,小米将智能制造作为非常重要的场景。除了向消费者直接提供产品之外,小米也希望通过技术来帮助整个国内的制造业提升制造水平,智能制造里非常重要的技术就是AI技术。

  • 发表于:
  • 本文为 InfoQ 中文站特供稿件
  • 首发地址https://www.infoq.cn/article/ddQcZowBbRhikNrULXaC
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券