首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

OpenAI首次开发者大会,GPT-4 Turbo首秀,价格直降

距离ChatGPT的首次亮相即将满一年,在这近一年的时间里OpenAI一直是全球科技圈当之无愧的“当红炸子鸡”,推动着全球进入了AIGC与大模型时代,并开启了新一轮的技术创新与创业热潮。7日凌晨两点,OpenAI首次发布会由CEO,Sam Altman(山姆·奥尔特曼)主讲并配合现场演示,展示了多款新产品。整场发布会45分钟,内容紧凑而真诚。想想上周苹果的半小时发布会,果然是字越少事越大。

发布会亮点摘要:

1.OpenAI公布开发者数据:全球目前已有超过200万开发者在使用OpenAI的开发者服务,其中90%来自世界500强企业,OpenAI的周活跃用户数目前突破一亿;

2.GPT-4 Turbo:发布产品GPT-4 Turbo,支持128K上下文窗口,Token的费用比GPT-4更便宜,输入低至之前的1/3,输出则是1/2;知识库更新至2023年4月;API现在支持图片和文本输入;新版本中的JSON模式可以强制GPT以纯JSON格式响应;集成DALL-E 3、语音合成等新能力。

3.版权保护功能:承诺为 API 用户与企业客户提供版权保护服务及侵权赔偿服务。

4.定制化 GPT & GPTs 应用商店:每个人都可以构建自己的 GPT,GPTs 应用商店即将于本月晚些时候正式发布,开发者可上传自己的 GPT 并获得收入。

5.辅助性API:开发者可以通过辅助性API提供的各类工具如检索、代码解释器、Python、提供沙箱环境构建等,高效创建AI Agents。

6.多模态能力提升:GPT-4 Turbo with Vision、DALL-E 3和TextToSpeech工具现已上线,发布语音合成模型tts-1、tts-1-hd和语音转文字模型Whisper 3。

一、GPT-4 Turbo正式亮相

GPT-4 Turbo最大的亮点在于知识库的更新至今年四月,这比过去截止到2021年九月的知识库无疑是一大进步。另外GPT-4 Turbo也支持128k的上下文窗口,相当于300多页文本的内容。奥尔特曼还强调经过本次优化性能后,GPT-4 Turbo相比前作还极大的压缩了Token的使用成本,输入端压缩至1/3,输出端则是1/2。

此前网络中一直有传言,说OpenAI将在本次开发者大会上正式发布GPT-5,最终的事实是GPT-4 Turbo。虽然不能打消网上对GPT-5的遗憾与猜疑,但是也能感受到OpenAI在重大版本更新上的谨慎,这点倒是与苹果颇为相似,即从来不干赔本赚吆喝的事情。

二、GPT版应用商店即将上线

自ChatGPT去年底亮相以来,很多人就拿它与苹果的iPhone作对比。iPhone不是手机的发明者却开创了智能机时代,ChatGPT不是AI时代的第一款程序却可能是实现AGI的第一步,这也是有此类比的主要原因之一。在今年早些时候,OpenAI就曾放风说要开发应用商店。在这次发布会的GPTs这部分,就能够感受到OpenAI想通过AIGC与大模型技术建立更大生态的雄心壮志。

按照奥尔特曼的解释,GPTs是针对特定目的,或特定领域进行自定义的ChatGPT版本,即使没有任何写代码的经验,完全靠自然语言的输入,就可以创造出属于自己的GPTs。目前已有部分自定义GPTs,支持ChatGPT Plus和企业版用户试用。在本月晚些时候,OpenAI将会正式推出GPT商店功能,主要用于分享用户构建的自定义GPT助手。

和苹果App Store一样,用户可以搜索自己感兴趣的应用并下载,开发者也可以将自己的GPTs在商店中上架。最受欢迎的应用不仅能登上排行榜,开发者还能与OpenAI进行收入分成。

三、Assistants API(辅助性API)

Assistants API是帮助开发者在自己的程序中构建Agent的第一步,是一种专门构建的AI产品,具有特定的指令,利用额外的知识,并且可以调用大模型和工具来执行任务。全新的Assistants API提供了代码解释器和检索以及函数调用等新功能,可以处理过去必须自己亲自完成的大量繁重工作,并允许开发者能够构建高质量的AI应用程序。

代码解释器:在沙盒执行环境中编写和运行 Python 代码,可以生成图形和图表,并处理具有不同数据和格式的文件。它允许开发者迭代运行代码来解决复杂的代码和数学问题等等。

检索:利用模型之外的知识来增强助手,例如专有领域数据、产品信息或用户提供的文档。这意味着开发者不需要计算和存储文档的嵌入,或实现分块和搜索算法。Assistants API 根据在 ChatGPT 中构建知识检索的经验,优化了要使用的检索技术。

函数调用:使助手能够调用你定义的函数并将函数响应合并到其消息中。

目前Assistants API Beta版可以通过Assistants Playground试用。

四、多模态能力的持续演进

多模态与跨模态的交互融合能力,作为当前各家AIGC相关企业重点关注和发展的技术,受到的重视正与日俱增,OpenAI自己也开发了用于文生图的DALL-E并且不断推进。在此次发布会上,OpenAI允许开发者可以利用文本转语音API,从文本生成人类质量的语音,也可以通过图像API将 DALL-E 3直接集成到他们的APP和其他产品中,并将DALL-E 3指定为默认大模型。与之前版本的DALL-E类似,该API内置OpenAI官方的审核功能,可帮助开发人员保护其APP免遭滥用。目前提供不同的格式和质量选项,每生成一张图像的起价为四美分。

此外还有GPT-4 Turbo with vision,开发者可以通过API中的GPT-4-vision-preview来访问。OpenAI打算为新发布的GPT-4 Turbo提供视觉支持,具体价格取决于输入图像的大小,例如像素1080×1080的图像需要的成本为0.00765美元。另外,OpenAI本次新发布的文生语音模型提供六种预设声音可供选择,以及两种模型变体tts-1和tts-1-hd,都针对实时用例进行了优化,tts-1-hd还针对质量进行了优化。

发布会结束后,网上很快就有人说,虽然只有短短四十多分钟,但这个夜晚足够令很多AIGC与大模型开发者、从业者甚至企业都彻夜无眠。开发者大会上的一系列产品亮相或升级,OpenAI再次以实际行动告诉世人,距离每个人都能有一个甚至多个专属私人助理、使用自然语言就能开发软件、还能像浏览应用一样,这样的一个未来,在加速向人们走来。

ChatGPT,经过一场发布会后就将裂变成无数个GPT。近期有不少传言说OpenAI与微软不合,在许多事情上矛盾丛生的传闻,为此OpenAI也特意拉来了微软CEO纳德拉站台表态。纳德拉在现场亲口表示,微软与OpenAI两家公司有着科技圈里最好的关系:“我们负责做最好的基础设施,你们负责做最好的大模型。”但对两家未来可能的合作动向,两位掌门人在现场都未提及。

从GPT-4到GPT-4 Turbo和GPT Store,OpenAI只用了半年多的时间。而也就在这半年多内,全球的科技和AIGC行业,已经发生了多轮洗牌,说是天翻地覆也毫不过分。与开发者大会同步的,是美股科技股集体上涨,也可能影响太平洋的对岸。尽管从长期来看,OpenAI不甘于做大模型厂商,将逐步在应用端下沉,浅层的AI应用开发商或面临退出风险,但短期来看,此次开发者大会为AI行业打开了空间,推动行业情绪高涨。

当长文本、多模态交互、跨模态融合等技术特征,以及更便宜、自定义等等这些其他企业旨在和OpenAI大模型错位竞争的特点,现在都被OpenAI拿来率先完成自我革命。当GPT在B端和C端都体现出强大的吸引力与生命力、并且还将利用GPT Store率先笼络住全球的开发者时,不知道它的对手们的会做何感想?作为旁观者,亲眼看着技术进步总是令人兴奋的,而OpenAI所采用的商业策略,又有着超出一般创业公司的成熟。我们正目睹着一个行业的兴起,也可能正在见证一个新巨头的诞生。时代潮来潮往,科学技术是第一生产力仍是至理。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OF3tFuLJdIMFygg4cvwZF1GA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券