2023 年 3 月 27 日,百度文心一言正式发布,李彦宏开场即言,百度是首个做出可以对标 ChatGPT 的产品的大厂,作为“国产版 ChatGPT”、百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。在 2022 年 11 月 30 日 美国 OpenAI 研发的聊天机器人程序 ChatGPT 一经发布,就瞬间爆火全网,作为人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,“真正”像人类一样来聊天交流,随着不同版本的迭代和更新,我们可以看到众多使用者甚至能在其帮助下完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。百度文心一言能否与 ChatGPT “掰掰手腕”,在二者的背后又是什么技术趋势促使其火爆全网呢?本文我们一探究竟。
生成式 AI(Generative AI) 是指计算机通过机器学习从现有数据中学习一个对象(物品、产品或任务)的要素,进而生成一个全新的、原创的、真实的、与原来内容相似的对象。作为重要的战略技术,在 2025 年 10+% 的数据将由 AI 创造。
根据 Gartner《2021 年预测:人工智能对人类和社会的影响》 中预测:
对于生成式 AI 的发展趋势预测,具体如下图所示:
在不含 AI 生成代码的情况下,AI 生成内容的业务场景和分类已经囊括众多的技术领域,AIGC 技术场景具体如下图所示:
AI 创作能力在未来短时间内的进步速度,也将取决于各行各业收集和训练行业优质数据的工作。
开发人员使用 AI 生成宠物小精灵,在初期使用“写实”数据集后发现运行效果不理想,重新使用 26 张新数据集训练 20 分钟,我们根据二者之间的对比,可以看到 AI 学习和生成效果是非常棒的,具体如下图所示:
AI 目前最大的问题不是“不够聪明”,而是“书读得太少"。 在 AI 新范式下创作,要考虑什么样的内容更利于 AI 学习和 AI 生成使用。
如果我们将艺术家关键词对生成图像的贡献视为艺术家本/的贡献,我们从原理上就可以为艺术家的创意价值定价了。
今天的 AI 从底层改变了游戏规则,接下来会看到以下变化:
根据英特尔(Intel)创始人之一戈登·摩尔(Gordon Moore)提出的 “摩尔定律”:当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。换言之,每一美元所能买到的电脑性能,将每隔 18 个月翻两倍以上。
而现在由于高效数据、高效算力、高效模型、高效知识需求的增长,摩尔定律原来中的 2 倍将增长至现在的 10 倍,具体如下图所示:
在 “The blessings of scale”中,根据趋势我们可以明确得知:同等条件下,随着模型参数量的增加,更大的模型会带来更好的结果,且目前的趋势并未饱和,故目前阶段大模型的投资依然会增加以获得更高的效益,具体如下图所示:
多模态融合打破边界,模型越来越大,模型走向行业,模型走向融合,具体如下表所示:
大模型趋势 | 内容 |
---|---|
模型越来越大 | 探索极限,目前到 5000 亿仍然保持线性增长。越来越接近人脑神经元连接数,甚至超过。例:OpenAl GPT-3(175B) 、谷歌 PaLM(540B) |
模型走向行业 | 在通用预训练大校型(L0)的基础上,在行业数据上更新训练后,适用于行业特征拍取的模型族(L1)。例:煤矿模型,电力大模型,药物分子大模型等。商汤:INTFRN 系统(初学者-专家-通才);百度:行业大模型。 |
模型走向融合 | 未来 2~3 年,视觉和语言大模型统一到多模态大模型,架构上也实现基本统一。各种校态大模型进行充分融合。例:文本 + 视觉,语音 + 文本,文本 + 视频等 OpenAI DALL*E/E2;谷歌 Imagen;微软 GLIP 等。 |
生成式 AI 技术的发展更趋向于:可控、高精度;更快、更好、更便宜。
可控和高精度重建成为技术突破口,带来了超乎想象的结果,得益于 Diffusion model、语言大模型、跨模特大模型、Nerf 等技术的突破,具体如下图所示:
生成式 AI,可控生成于机器而言,是不同语义的重组,于人而言,就是创意!在绘画领域,AIGC 是将绘画的三要素(构图、纹理、着色)进行重组从而产生创意。但是他并不能真的产生创意的基本元素,举例具体如下图所示:
图像生成,反事实是创意,但是对于语言生成,反事实却是灾难,可谓“恐怖如斯”,具体如下图所示:
百度文心一言发布,股价盘中跌超 10%,也看到很多小伙伴们在试用文心一言后发出的吐槽,基于 Generative AI 的发展不是一朝一夕,这个问题的本质也并不是仅在文心一言中存在的,而 ChatGPT 确实在自然语言理解、自然语言处理等方面有进步的地方,同时,在算法、数据、算力上推进了有效结合。而面对 ChatGPT 的热潮,我们应有的态度正如科技部部长王志刚说所说,我们国家对于任何一个新的技术,包括 AI 技术出来以后,在伦理方面都采取了一些相应的措施,对科学技术发展趋利避害,让“利”更好地发挥出来。
我是白鹿,一个不懈奋斗的程序猿。望本文能对你有所裨益,欢迎大家的一键三连!若有其他问题、建议或者补充可以留言在文章下方,感谢大家的支持!