每个用户都值得拥有专属助理。
作者丨郭 思
编辑丨陈彩娴
ChatGPT热潮引发的百模大战,在持续了大半年之后,模型的参数已经卷到极限,越来越多的公司开始意识到,百模大战的下半场,落地应用才是值得卷的地方。
而当聚光灯打在OPPO这个手机厂商之上,我们会发现,下半场才是OPPO的主战场。
Canalys数据显示,2023年OPPO上半年以2400万台的出货量成为国内手机市场第一,表现十分亮眼。而OPPO的全球存量用户,则早已突破5亿。
如此庞大的用户基数,让OPPO没有落地场景之忧。
因为,对OPPO而言,只需要让这已有的5亿用户,每个人都用上搭载了大模型的产品,把用户留在自己的口袋里,胜局便已确定——OPPO给出的答案,是推出安第斯大模型(AndesGPT)。
AndesGPT的表现究竟如何,用户其实早已有了答案。
1
化「鸡肋」为利器
2022年下半年,OPPO小布团队的办公室里有一些担忧的气息。
投入三年,OPPO智能语音助手小布进入发展瓶颈期,与此同时行业对于语音助手这种产品形态的价值的态度越来越怀疑。
「似乎有点鸡肋」,是用户对语音助手近几年使用感受的点评。
而回溯语音助手的发展,也相当「高开低走」,2011年,iPhone 4S发布会上,Siri和iPhone一起亮相,风光无限,此后,语音助手迎来了它的辉煌发展时期。
2014年,微软和亚马逊分别发布了Cortana(小娜)和Alexa;2015年,百度发布「度秘」人工智能助手;2016年,谷歌的Google Assistant也正式上线。
但近几年来,在苹果底牌打光,微软小娜和Alexa也相继表现疲软之后,语音助手的发展其实也遇到了瓶颈。
每个手机必备一个智能助手,但是很少有人会用来解决实质性的问题,大多时候,手机里的语音助手只是躺在那里,至多在用户百般无赖之下充当一下消遣娱乐的工具。
到底有没有必要做下去?再做下去的话怎么做?
对于这些问题,手机厂商都很迷茫。而当ChatGPT横空出世时,一切又有了新的转机。
ChatGPT基于大语言模型的出色对话能力,碾压了市面上所有的语音助手。
这对于众多语音助手团队而言,其实是肉眼可见的危机,本来就用户活跃不高的产品,遇到如此强大的竞争对手,「砍」可能是众多团队深思熟虑之后的选择。
但在OPPO看来,这是危,但其实也是机。
既然无法正面争锋,何不迎潮流而上,借助大模型,给语音助手带来一场新的产业革命?
早在2020年就布局了知识图谱的经验给了OPPO底气。
据小布助手首席研究员杨振宇回忆,OPPO小布是2018年下半年开始研发、2019年正式推出的产品,大概在2020年之际,团队敏锐地注意到,在用户反馈中,存在非常多的信息获取不方便的问题,比如搜很多东西无法返回用户所需要的答案。手机本就是面向C端用户,如此巨大的软肋成为了OPPO团队迫在眉睫的难题。
基于此,OPPO当时采用了调用搜索引擎,通过浏览器输出答案列表,让用户自主选择想要答案的降级措施。这在一定程度能解决用户的一些问题,但是整个体验非常的不自然和繁琐。
语音自然对话的交互流程被打断,就好像平时与人沟通时不时被插话或中断一样令人心情不爽,再回到之前的场景,很难重新衔接上。
难题换了个方式再次摆在OPPO面前。
如何将这些问题闭环?
团队采取了两个措施。
第一步落在知识图谱方向,构建自己的精品知识图谱,解析用户的问题,如果能够命中知识图谱里面的内容,就可以给出直接给出用户想要的答案。
另外一个是从海量的语料数据里面给它自动化,半自动化的去抽取QA数据。当用户在问一个新问题的时候,可以去看它跟库里的是不是哪一个能够匹配的上,然后再去回答用户的一些问题。
回过头来看,知识图谱以及海量语料数据,对于现行的大模型而言都非常重要。
「有了大模型之后,生成式的方式就更加有助于优雅的解决这些问题。」杨振宇坦言。
而主打对话问答的安第斯大模型在8月初就开始随着OPPO智能助理小布启动对外邀测,对传统语音助手进行了内核级升级。
11月与大众亮相的最新版本小布,有着很惊艳的表现。
在全智全能方面,搭载了大模型的小布助手,不仅能帮助用户查询比如查询交通路况、限号信息等,甚至可以在用户输入指令后,自动解析用户的潜在需求,跳转到用户所要的APP。
在有趣贴心与情感陪伴方面,小布的表现也不是简简单单的一问一答,而是有着举一反三的多轮反馈机制,最关键的一点是,每次语音助手发起的对话要兼顾实用性和趣味性。
比如,小布界面内有一个特定的耍心眼功能,当我们现实生活中遇到令人尴尬或者不好意思指出的 现象时,小布也可以充当我们的贴心小助手,为我们提出建议。
今年年初,小布已上线作画能力,展现了在艺术创造方面的神奇魔力,在AndesGPT的技术加持下,小布作画能力有了进一步发展,在稍后的版本上,用户使用小布随意输入想创造的主体,便可创造出想要的画面。
OPPO大模型团队认为,有了大模型技术加持的智能助手,将给用户带来全新的智能体验。
2
始于安第斯,「忠于」安第斯
安第斯山脉是地球上最长的山脉,又高又长,山脉两侧,一侧气候干旱,一侧茂盛,天然的屏障构成了无法逾越的生态壁垒。
2019年的4月,OPPO提出了万物互融的概念,在这以后,随着业务的不断拓展,安第斯智能云逐渐露出版图,2022年OPPO INNO DAY上,安第斯智能云正式发布,提供面向泛终端体系的智能云服务,当时,OPPO就提及安第斯智能云可以实现端云机器学习,提供端云统一的机器学习能力。
而如今安第斯大模型的推出,则更加离不开安第斯原有产品及团队基础的支持。
这个团队构成和协作模式,具备典型的「大模型」特点。
在大模型以前,各个公司也会涉及AI板块,但根据应用的不同,可能会泛化出各类不同的小组,比如,对话一个AI团队,视频一个AI团队。
而在大模型之后,一个通用大模型能解决所有问题。
这也就意味着传统各自为政,相对独立分工的协作模式不再适用,边界变得没有那么清晰,水平的切割划分变成了大家上下游配合的方式。
「现在OPPO大模型团队更多的是在一个平台上面,大家负责不同的环节,这些环节做好后,大家一起产出一个更好的大模型,耦合性十分之高。」OPPO数智工程事业部总裁刘海锋如是说。
除了团队源于安第斯智能云之外,在大模型的规划上,也与安第斯智能云的整体定位息息相关。
刘海锋表示,OPPO大模型在模型的规格方面,希望做由不同规格组成的一系列大模型,既能够跟设备端更紧密的结合解决简单的任务,又可以部署在云端满足一些更复杂的需求。
安第斯大模型基于端云协同架构构建。
云更注重计算,端则代表着交互。
手机作为高度个人化的产品,里面也往往涉及大量的高度敏感的隐私数据,不太适合把隐私数据上传云端,端侧的本地化处理也能更好的保护用户的安全。而对于更为复杂的计算,OPPO安第斯大模型则会交给云端处理。
可以看出,安第斯大模型对于端云一体的注重,与安第斯智能云一脉相承。
安第斯大模型与潘塔纳尔系统是OPPO的核心技术,一直致力于建立起更成熟、全面的全场景生态体系。
资料显示,OPPO目前已经有了广泛的IoT业务布局,搭载OPPO安第斯大模型的智能-助手小布也将成为智能设备的关键AI服务入口,通过智能助手端大模型的融入,将大模型的能力快速扩展到自家的整个软硬件生态体系当中,进而提高日常生活效率。
同时,OPPO宣布将与芯片厂商联发科合作推进轻量化大模型端侧部署,借由此,我们可以想象OPPO安第斯大模型带来的巨大想象力。
「未来,手机的一些形态上其他的软件都没有了,核心的主入口就是一个对话交互的这形态。然后通过这种对话的形态,可以获取手机上的所有软件的服务。人和手机上各种App的交互也不再是频繁的点击,而是通过语音就能进行智能召唤。」
3
大模型时代,
一份来自手机厂商的答卷
据悉,OPPO将于11月OPPO开发者大会(ODC)上正式发布安第斯大模型(AndesGPT)。
在SuperCLUE十大基础能力排行榜上,“知识与百科”能力AndesGPT测试得分高达98.33,大幅度领先其他大模型,仅次于GPT4排名国内第一。
在这背后,除了上文提及的早在2020年的知识图谱布局之外,对预训练和指令精调技术的优化,也是安第斯大模型能取得出色表现的原因。
在预训练方面,安第斯大模型团队主要集中于在有限长度的语料数据上来训练模型,使得模型将来能在实际使用的时候提高外推能力以及上下文窗口的一些拓展能力。
在精调阶段,安第斯大模型团队致力于将指令数据做得更精细,在此前的历史语音处理的对话数据中,提取高质量指令,将这些指令打上不同的标签,同时注重注重指令的问题以及领域类型,以不同的比例来配比,使得整个模型综合表现更好。
可以看出OPPO安第斯大模型主打知识与问答能力,显著提升了大语言模型知识与百科能力的覆盖面和准确性。
图1 CLUE1.1总榜,共9个子任务
图2 KgCLUE1.0,知识图谱问答榜
从结果上,OPPO押注大模型这一战,当前交出的成绩单似乎还不错。
在各项测试榜单上,OPPO安第斯大模型能优于同行表现20%。
大模型加载的小布整个月活超过了1.4亿,每天产生的交互数据以亿计算。
用户对安第斯大模型的反馈在数据上得到了实实在在的反馈。
大家有目共睹,手机厂商做大模型不仅可行,更能交出一份出色的答卷。
谈及OPPO安第斯大模型的表现,刘海锋谦虚地表示:「各种评测都有它的局限性,在一两个评测上取得好成绩,也不代表已经做得非常完美。大模型的技术迭代非常快,且从技术到产品落地,我们还有很长的路要走。」
而放眼至更长远的未来,OPPO也正在规划AGI智能体的研发投入,致力于发展出能在设备帮助用户智能化、自动化完成任务的超级智能体。
自始至终,OPPO都只想让用户协作更方便,这是OPPO的梦想,也是所有手机厂商的共同诉求,同样也是互联网时代各家成功的关键。
如今来到大模型时代,谁能在这波浪潮中占领新一轮高地,答案或许也从来没有改变过。