首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

OpenAI首席科学家演讲重要信息解读

最近被OPENAI,ChatGPT刷屏,让人应接不暇,喘不过气。老黄(黄仁勋,NVIDIA CEO)讲到,现在是AI的iPhone Moment,而我决定现在正是AGI(Artifical General Intelligence)的发明时刻,而AGI的发明,至少是比肩互联网的发明、电力的发明一样的,人类历史重大事件。

巨浪已至,我们何去何从?

在消息满天飞的时间里,最重要的,是一手信息。接下来几周,我会为大家从业内的角度来解读最近OpenAI的演讲和Paper。

今天这篇是3月23日NVIDIA GTC大会中,老黄和OPEN AI首席科学家,GPT之父Ilya Sutskever的对谈(完整视频见文末链接):

【什么是GPT系列模型】: 全知全能

1. GPT系列模型的设计原则,自始自终都是向着AGI为目标的:GPT从来都不是为了完成某种特殊任务/应用,而是为了实现完整的、全能的智能。

2. GPT模型在训练中分为2个主要阶段:

目的是压缩(compress)和学习到世界上所有的知识。GPT系列模型的主要做法——“学习下一个单词 (learning the next word)” 并不是传统意义的语言模型的“学习”,而是"对世界的映射(projection of the world)" [22'30"]

(Reinforced Learning from Human Feedback)。这个阶段模型并不是在“学习(learn)”新的知识,因此RLHF不是“教导(teach)”模型,而是与模型“交流communicate” :让模型知道如何用人的方式来表达和回答人的问题[24‘36"]

3. 图像素材对于GPT4并不是为了加强它的图像识别能力,而仅仅是“有用(simply useful)”:图像作为文本以外的,另一种信息形式来加强模型理解世界的能力[37’50”]

【有关GPT模型能力】:加速进化

4. GPT4 和ChatGPT相比是非常巨大、根本性的进步: 对于世界的理解能力、预测能力不是在一个层级的 [28'00"]

5. 由模型产生出来的数据,对于进一步训练提升模型的能力,是有作用的[46’40”]

>>这点尤其重要,因为如果上一代模型产生出来的数据可以用在下一代模型的训练当中,会极大加速模型的演进速度

6. 思考(Reasoning)的能力会照常(Business Usual)向前演进,目前没有瓶颈,也未看到天花板[32‘39“]

7. GPT当前还没有很好的检索(Retrieval)能力,而仅仅是单词预测(word prediction);但未来是很容易做到的[36‘00“]

8. Ilya 对于GPT4的效果是“惊讶的”,尤其对于其“出错显著降低”,例子:数学能力、写藏头诗、理解memes 等[51‘00“]

>> 说明似乎确实有“智能涌现 Surge”的现象,那就意味着我们不能精确预测GPT们都有了哪些技能,不管是展现给我们的,还是没展现给我们的。

【有关安全】:不好说……

9. GPT大模型的重要问题在于“reliability”;在提到安全性的问题时,视频被生硬截断,推测是说了重要而又令人担忧的信息[25’50”;33’54”]

【一些Ilya的技术信仰】

- 监督学习Supervised-learning 是极端重要的[7'20"]

- DEEP & LARGE 模型的神经网络要又深又大 [7'20"]

- Reasoning 并没有明确的定义(可能也并不是人类特有的东西)[32'00"]

Generated by Dall-E

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230326A02PNL00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券