近几个月来,ChatGPT都是当仁不让的舆论话题。
上一次AI在全球范围内引起轰动,还是谷歌的AI机器人AlphaGO下棋战胜围棋世界冠军的时候。
ChatGPT的出现,让国内外几乎所有的科技巨头都坐立不安。
2月1日,谷歌母公司Alphabet首席执行官桑达尔·皮查伊(Sundar Pichai)透露,谷歌将在“未来几周或几个月”推出类似ChatGPT的基于人工智能的大型语言模型,用户很快就能以“搜索伴侣”的形式使用语言模型。
根据外媒最新报道,谷歌正在要求员工测试ChatGPT的竞争对手——“红色代码”计划,于去年12月发布,以紧急应对ChatGPT的崛起所带来的威胁。
其中,包括一个名为“学徒吟游诗人”(Apprentice Bard)的聊天机器人,并探索嵌入搜索引擎。
由于围绕 ChatGPT 的关注激增,Meta内部压力也在增大。
在Meta,员工最近分享了内部备忘录,敦促公司加快AI项目的审批流程,以便利用最新技术。
而在2月1日当天,百度也宣布将于3月在国内推出类似ChatGPT的智能聊天程序,引爆了整个国内科技行业。
事实上,业内与ChatGPT相似的AI技术并不缺乏,与ChatGPT同类的聊天机器人也很普遍,但为什么ChatGPT的出现让科技巨头们都如芒在刺?
ChatGPT到底带来了什么样的冲击?
ChatGPT导致搜索引擎之争
在ChatGPT发布的第一天,就有生成式AI要取代搜索引擎的声音出现,而这也是被业内人士讨论最多的问题,不少人认为ChatGPT将有望撼动谷歌搜索的地位。
当然,也有不少分析指出,当前ChatGPT还不能取代传统的搜索引擎。
“从测试情况来看,回答的内容里出错的概率还是挺高的,机器人经常自信满满地说一些错话。”一位用ChatGPT进行天文知识测试的使用者表示。
尽管ChatGPT暂且无法取代传统搜索引擎,但不代表没有丝毫威胁。
亿万富翁Chamath Palihapitiya预测,随着人工智能的崛起,谷歌今年将受到最大的影响,因为人工智能开始让谷歌搜索功能变得不那么重要。
这位风险投资家表示,谷歌可能不会失去其全球顶级搜索引擎的地位,但随着其他网站的加入(ChatGPT),谷歌仍可能失去相当大的使用量。
简单来说,Chamath认为从盈利能力和参与度的角度看,谷歌搜索是失败者:
- 其他公司将能够产生高质量搜索结果。
- ChatGPT直接给你答案,为什么还要搜索?
- 哪怕只流失10%-15%的使用量,是谷歌的巨大损失。
从国外大厂的动作来看,这种观点也比较有说服力。譬如瞅准机会想要挑战谷歌地位的微软。
据外媒报道,微软公司打算将OpenAI的ChatGPT聊天机器人引入其搜索引擎Bing(必应),以从强大的竞争对手谷歌那里抢夺市场份额。
有知情人士透露,微软相信,聊天机器人提供的更对话化、情境化的回复,会使搜索用户更乐意使用Bing,因为通过这种方式提供的答案毫无疑问要比直接抛出网页链接要更加优质。
作为回击,谷歌紧急发布“红色警报”。一攻一防之中,道理其实很浅显。
巨头们不愿错过任何机会,特别是随着人工智能技术进一步成熟,确实有再次错失良机的风险,而这是谷歌最不愿意看到的。
对于有着同样处境的全球最大的中文搜索引擎百度而言,此番出击也成了必然。
说白了,ChatGPT能否取代搜索引擎,是未知的,但风险是已知的。因此,最稳妥的策略便是攻防兼备、抢先布局。
ChatGPT带来
AI技术范式革新
ChatGPT的诞生,对于谷歌、百度等科技巨头而言是很焦虑,但ChatGPT的冲击力不仅止于此。它真正让所有人都感到吃惊的,是背后大模型的创建和学习能力。
事实上,在ChatGPT推出之前,国内外已有不少大模型。
但相比其他大模型,ChatGPT在AI的技术路线和训练方式上的变革,带来了业界意料之外的突破。
首先,ChatGPT有一个非常强大的技术底座,也就是InstructGPT模型。这个模型的论文刚发出来时,没有引起特别大的反响。
此前,GPT与BERT模型路线一直在竞争,2018年时BERT模型先赢了,但GPT模型路线一直没放弃,模型参数和数据规模越做越大,最终结合人工反馈增强学习(RLHF),在ChatGPT上取得了重大突破,效果上反超了BERT模型路线。
其次,ChatGPT引入了强化学习机制,在新版本上引入了人工标注的数据,通过人类的反馈,有针对性地进行优化。
其中的难度在于,建立怎样的强化学习机制。
此前,在下围棋的AI中,强化学习是用胜负做反馈。但对于ChatGPT如此开放的系统,是没有明确的反馈机制的。
过去业界也尝试了强化学习机制,但很多都不太成功,ChatGPT在这件事上取得了突破。
第三,ChatGPT在数据质量和多样性上非常讲究。
OpenAI雇佣了一个数十人的数据团队,其实ChatGPT强化学习的数据量并不大,但对数据多样性、标注体系都有精巧的设计,让数据发挥出了强大的作用,这是非常值得业界借鉴的地方。
虽然一些业内人士认为,在ChatGPT所涉及的技术上,中美是“平级”的,但华为诺亚方舟实验室语音语义首席科学家刘群坦承,中国在技术上还是有差距的。
其中一个是基础模型本身的差距,虽然国内训练了很多万亿模型或者是几千亿的模型,但训练的充分程度,是远远不够的。
有人用同样的问题向国内某厂商的大模型和ChatGPT同时发问,ChatGPT从回答的逻辑性和完整度上都远超国内大模型,国内大模型的答案带有明显的拼凑感,夹杂着不少主题之外的胡编内容。
而且在回复速度上,ChatGPT也领先一截。
换句话说,国内与ChatGPT相似的AI技术并不缺乏,但多年来精进能力却并不突出,实现不了ChatGPT这样多轮对话且极其贴合人类语感的回复。
所以,当ChatGPT出现时,内行来看的震惊程度跟外行一模一样。
这也给中国互联网很多公司带来思考,例如:AI的应用现有的技术是不是做到了极致?单纯的技术领先和大模型的打磨有没有到位?利用现有技术可不可以通过一个更加庞大准确的大模型实现之前无法想象的应用?
这些问题的回答,对于中国互联网企业来说,有着无法估量的意义。
中国版ChatGPT还有多远?
珠玉在前,但模仿却仍然不是容易之事。
尽管近日百度宣布将于3月在国内推出类似ChatGPT的智能聊天程序,但可能差距也会比较明显。
特看科技CEO乐乘认为,目前全球还没有能跟ChatGPT抗衡的大模型,业界共识是差距在两年以上。国内先不谈弯道超车,趁早追赶反而是更重要的。
除此之外,业界人士都提到了算力问题。由于GPU芯片等问题,在一定程度上,国内算力已被卡脖子了。
即使国内头部公司,从算力上跟谷歌等相比,差距也是比较明显的。
从数据质量来说,整个互联网的中文数据质量,相比于英文也有明显差距。
此外,几乎所有业内人士都提到了OpenAI这家人工智能组织,所体现的纯碎创新精神和长期主义。
它可能是业界唯二的两家机构,无论在创新性、投入、决心,还是在顶尖人才储备上,都是一如既往坚持的。
即便是在看不到前景和没有明显效果的阶段,OpenAI仍非常坚定地做了投入,相反国内倾向于在技术出现突破后,快速追随。
值得注意的是,国内科技企业和ChatGPT的追求方向也并不相同。
ChatGPT的重点在于创造,通过大量的语料训练和强大的纠错能力,对素材进行消化、整理和再输出,这和过去国内关注的云计算或视觉技术是完全不同的思考方式。
而导致上述分别的原因也很直接,那就是成本。
ChatGPT背后有着海量的资料库和庞大的算力做支撑,变现方式目前来看却只有向企业提供服务,替代部分人工作业这一种。
但微软小冰负责人李笛在媒体采访时指出:“小冰框架当前所支撑的对话交互量,一天就达到14个人类一辈子的对话交互量。若使用ChatGPT的方法,每天成本将高达3亿元,一年成本将超过1000亿元。”
对于产品化而言,即使再将成本下降10倍,这个商业模式也是无法成立的,因为这个成本与人类相比没有优势。
不过,也有业界资深人士提出,当下ChatGPT在行业里要真正落地还面临困难。调用ChatGPT的成本和它当下所带来的回报可能并不成正比。
但可以预见的是,随着竞争加剧,大模型会像水电煤一样,成为大家都用得起的状态。
留给中国AI企业的时间或许不多了。
【科技云报道原创】
转载请注明“科技云报道”并附本文链接