前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ChatGPT全球赛开场,李彦宏已无退路,百度文心一言今日正式开始邀请测试!

ChatGPT全球赛开场,李彦宏已无退路,百度文心一言今日正式开始邀请测试!

作者头像
新智元
发布2023-03-29 15:27:13
2150
发布2023-03-29 15:27:13
举报
文章被收录于专栏:新智元


新智元报道  

编辑:编辑部

【新智元导读】ChatGPT全球赛,百度文心一言今日正式开始邀请测试!

ChatGPT国内赛,已有选手冲刺到终点了。

在全球大厂中,百度第一个做出了对标ChatGPT的AI产品——文心一言。

就在前一天,OpenAI忽然出人意料地官宣了多模态大模型GPT4.0,震惊全世界。

这个时间上的巧合,让人们对于今天文心一言的出场,更是期待值拉满了。

正式开启邀请测试

3月16日下午2点,万众瞩目的邀请测试展示如期召开。

一上来,李彦宏就直言,文心一言对标ChatGPT,但不能叫完美。但因为有市场需求,所有人都在等着百度发布这个技术。

文心一言有多强 ?

现场,李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。

文学创作

首先,李彦宏就考验了文心一言《三体》作者是谁。(理由是大刘也是山西阳泉人,是他的老乡)

文心一言准确、详细地介绍了《三体》作者刘慈欣。

紧接着,文心一言总结了《三体》核心内容,条理分明地列出了3大点,并且还给出了5个续写的角度,下一个刘慈欣可能就是你了。

然后,对于「于和伟和张鲁一有哪些共同点」、「于和伟和张鲁一谁更高」这两个问题,文心一言基于推理能力得出了正确答案。

上下滑动查看全部

商业文案创作

在商业文案创作场景中,文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。

在连续3次内容创作生成中,文心一言既能准确理解人类意图,又能清晰地表达,这是基于庞大数据规模而发生的「智能涌现」。

上下滑动查看全部

李彦宏称,「这些训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。」

数理推算

那文心一言在完成数学推演及逻辑推理等复杂任务时的表现如何呢?让我们看看它会不会解鸡兔同笼问题。

下面演示可以看出,文心一言能理解题意,还有正确的解题思路,可以像学生做题一样,按正确的步骤,一步步算出正确答案。

中文理解

此外,文心一言具备中文领域最先进的自然语言处理能力,在中文语言和中国文化上有更好的表现。

在现场展示中,文心一言正确解释了成语「洛阳纸贵」的含义、「洛阳纸贵」对应的经济学理论,还用「洛阳纸贵」四个字创作了一首藏头诗。

当然了,文心一言在英文理解方面能力还不是很好,因为训练数据比较少,这也是接下来文心一言要努力的方向。

多模态生成

在多模态生成方面,李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力。

比如,让文心一言为2023世界智能交通大会创作一张海报。

还没等几秒钟,一张赛博风格的图片就生成了。

有趣的是,文心一言还能根据内容生成四川话等方言的语音。

这还不算什么,文心一言甚至还能将一段话生成视频。

然而由于视频生成能力成本较高,现阶段还未对所有用户开放。

但遗憾的是,这些都不是实时演示……

有大佬评论道,在GPT-4发布后的第一天,不论是谁发布类似的产品,似乎都变得索然无味了。

整体来看,文心一言某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。

但目前还远未到发展完善的阶段,还有赖于通过真实的用户反馈而逐步迭代。

百度CTO王海峰表示,文心一言,是新一代知识增强大语言模型,是在ERNIE及PLATO系列模型的基础上研发的。

它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。

其中,前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中也已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。

李彦宏表示,「文心一言将建立起真实用户反馈、开发者调用和模型迭代之间的飞轮,效果会迅速提升,给你『士别三日,当刮目相看』的惊喜。」

百度为什么是第一个?

全球大厂都在冲刺对标ChatGPT产品,为什么百度拿下了第一?

李彦宏的话,解答了我们的疑问:「无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。」

可以说,文心一言是百度过去多年努力的延续,百度早已在深度计算领域深耕多年。

早在2012年,百度就注意到了深度学习的风向。2013年,百度建立了中国第一个深度学习研究院(IDL)。

2016年,百度开源首个国产深度学习框架PaddlePaddle(飞桨),而飞桨是国内至今唯一能与TensorFlow 和 PyTorch两大主流框架正面交锋的深度学习框架。

目前,飞桨已经凝聚了535万开发者,创建了67万个模型,构建起一个繁荣的深度学习生态。

而2020年,当GPT-3出现后,百度就更加开始加注大模型。2021年,百度发布了百亿参数中英双语大模型PLATO-X、千亿参数大模型「鹏城-百度·文心」,2022年,又发布了知识增强大模型Ernie 3.0。

上下滑动查看全部

在研发上,百度也是毫不吝啬,在过去十年里的研发投入已经达到了1000亿。

其中核心研发投入占核心收入比例连续8个季度超过了20%。

据统计,百度在2020年的研发投入强度为18.22%,位列民营企业500强第一。2021年为20.03%,位列民营企业500强第二。

在本周一,微软特意在官博上自曝,自己耗资数亿美元,用了英伟达数万颗A100,才在Azure云服务中,造出了符合OpenAI要求的超级计算机。

同样,在AI国内赛中,云计算需求激增,而百度智能云也很早就开始在云上布局AI。

在2012年,百度就在李彦宏的老家山西阳泉建了一个计算中心,包含「冰山」冷存储服务器和X-MAN超级AI计算平台等自研计算系统,每秒可以完成2000万亿次深度神经网络计算。

而在2022年12月底,百度将其正式升级为「智算中心」,对外提供智算需求服务。现在,百度智算中心可以在千卡并行环境下可以实现加速比90%,做到单机群万卡规模,有效支持大规模训练场景,算力可达4EFLOPS。

据称,文心一言也是部分在阳泉中心计算的。

四层全栈布局

人类进入人工智能时代,IT技术的技术栈发生了根本性变化过去基本分为三层:芯片层,操作系统层和应用层。而现在可以分为四层:芯片层、框架层、模型层和应用层。

今天,百度是全球为数不多、在这四层进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,到搜索、智能云、自动驾驶、小度等应用,各个层面都有领先业界的自研技术。

文心一言的训练,离不开庞大的真实数据。

现在,ERNIE 3.0每天接受数十亿次用户的搜索请求,这让文心一言能够基于一个庞大的、高效的数据池,快速地学习和改进。

百度的搜索服务,每天响应几十亿次真实的用户使用需求,每天进行1万亿次深度语义推理与匹配,能够提供最真实、最及时的反馈,从而倒逼大模型、深度学习框架和芯片的优化。

就像百度昆仑芯片之所以在AI芯片中拥有领先的性能,正是因为它已经为百度的搜索服务优化了十年。

李彦宏描述道,大模型训练堪称暴力美学,需要有大算力、大数据和大模型,每一次训练任务都耗资巨大。

而全栈布局的优势在于,可以在技术栈的四层架构中,实现端到端优化,大幅提升效率。

尤其是框架层和模型层之间很强的协同作用,可以帮助构建更高效的模型,并显著降低成本。

事实上,超大规模模型的训练和推理,给深度学习框架带来了很大考验。比如,为了支持千亿参数模型的高效分布式训练,百度飞桨专门研发了 4D 混合并行技术。

另外,芯片、框架、大模型、和终端应用场景,可以形成一个高效的反馈闭环,帮助大模型不断去调优迭代,让用户体验不断升级。

李彦宏还特别强调,目前在全球范围内,在四层架构的每一层都有领先产品的公司几乎没有,百度的优势非常独特,在后续文心的迭代速度上,我们应该会有明显感受。

文心一言如何定位?

百度认为,文心一言是一个通用的赋能平台,金融、能源、媒体、政务等千行百业,都可以基于这个平台来实现智能化变革,实现效率提升,创造巨大的商业价值。

它超强的自然语言理解和表达能力,可以让任何公司都有机会离自己的客户更近,去创建最好的客户体验。

自2月份百度官宣「文心一言」以来,已有超过650家企业宣布接入文心一言生态。

另外,文心一言对个人也会有巨大的改变。有机构预测,到2030年,人工智能可以将每一个知识工作者的生产力提高4倍以上。

很显然,我们中很多人的工作性质,会发生不可逆转的改变。

催生哪些新机会?

在李彦宏看来,生成式AI会催生新产品、新业态,乃至很多的创业和投资机会。

而对大部分企业来说,所谓的机会并不是从头做ChatGPT这类大模型,这既不现实,也不经济。

而真正的机会应该是,基于通用大语言模型,抢先开发重要的应用服务。

就好比移动互联网时代,最成功的商业产品不见得是安卓和IOS,而是基于安卓和IOS开发的微信、淘宝、抖音等应用。

李彦宏在现场预测到,大模型时代将产生三大产业机会。

第一类是新型云计算公司,主流商业模式从IaaS变为MaaS。

文心一言将根本性改变云计算行业的游戏规则。

以前,企业选择云厂商,更多看算力、存储等基础云服务。而在未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用之间的协同。

第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们具有行业Know how,调用通用大模型能力,为行业客户提供解决方案。

而文心大模型,已经在电力、金融、媒体等领域,发布了10多个行业大模型。

第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。

今天,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,很可能就是未来的新巨头。

更多的杀手级应用、现象级产品、里程碑事件,即将诞生。

最后,李彦宏强调说,文心一言并不是中美科技对抗的工具,而是一代代百度技术人员追逐科技改变世界的梦想的产物,是百度服务亿万用户、赋能千行百业的全新平台,是创新驱动发展的最佳证明。

One More Thing

最后,是大家最关心的问题:怎么用上文心一言?

对此百度表示,3月16日起,首批用户将可通过邀请测试码在官网体验产品,后续会陆续开放更多名额。

企业方面,则可以通过搜索「百度智能云」进入官网,申请加入文心一言云服务测试。

直播结束后,科技圈掀起了狂欢,各类点评纷纷出现。

而巨头财经点评道——

GDP4.0和文心一言,完全是两种不同的外向气质。 一个是典型的美式英雄主义,一出场就是王炸完全的颠覆式创新,魔法级的技能让全球瞠目结舌; 一个是典型的中式实用主义,没有英雄,没有浪漫,很务实的市场需求理解,把十多年的积累组合升级,一点都不酷,还显得有点生涩。 我们渴望前者,我们习惯后者。

大家催来了文心一言,虽然不完美,也是一小步。

抗万钧之压,顶千夫之笑,走出这一小步,已经值得侧目。

参考资料:

https://live.baidu.com/m/media/pclive/pchome/live.html?room_id=8117393980

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-03-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 【新智元导读】ChatGPT全球赛,百度文心一言今日正式开始邀请测试!
相关产品与服务
腾讯云服务器利旧
云服务器(Cloud Virtual Machine,CVM)提供安全可靠的弹性计算服务。 您可以实时扩展或缩减计算资源,适应变化的业务需求,并只需按实际使用的资源计费。使用 CVM 可以极大降低您的软硬件采购成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档