首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

ChatGPT 4O 来了,使用之后发现似乎没有 OpenAI 官网声称的那么强大

今天早晨,当我像往常一样,打开 GPT 网页版,准备开始新一天工作时,意外地收到了试用 GPT 最新的 4O 模型的邀请。

在可选模型的下拉列表里,出现了一条新的可选项:GPT-4o

在我账号的 subscription plan 里,也能看到 GPT-4O 的访问权限了:

GPT-4o 的 o 代表了 Omni(model),源自拉丁语中的词 omnis,意思是"所有的","每一个的"。

在英语中,这个前缀被用来形容无所不包、全面或普遍的含义,即全能模型。

在 ChatGPT 4O 诞生之前,过去的 ChatGPT 模型的各项能力是单独训练的。

以之前的 ChatGPT App 中提供的语音对话功能为例,其工作流程按顺序如下:

1. Whisper 语音转文字

2. GPT-4 回复文字内容

3. TTS 生成对话语音

这三个串行步骤,类似 Unix 操作系统设计的管道机制,前一个步骤的输出,作为下一个步骤的输入。

GPT-4o 则是完全重新训练的,是一个原生的支持文字、视频和音频的端到端模型。该模型所有的输入和输出都由同一神经网络处理,工作方式同之前的 GPT 模型有着本质的区别。

举个实际的例子。

ABAP 是一门编程语言,是 Advanced Business Application Programming 的缩写。

我曾经使用 DALL-E 模型为这门语言生成一些海报。详见之前这篇文章:用 ChatGPT 生成 ABAP 海报,失败作品远远多于成功作品

因为 DALL-E 无法准确识别文字,所以尽管我仔细维护 Prompt,一次又一次的要求它生成包含 ABAP 四个大写字母的海报,DALL-E 也经常给我生成一些让我啼笑皆非的作品。

根据 OpenAI 官网资料的介绍,我个人认为现在这个的 ChatGPT 4O,可以直接精确生成包含文字的图像。

切换成 ChatGPT 4O,使用下列 Prompt:

帮我生成一张具有编程和未来世界风格的海报,要求海报正中,包含 ABAP 四个大写字母。ABAP 是 Advanced Business Application Programming 四个单词首字母的缩写。

然而生成的海报仍然不能让我满意。是我的 Prompt 哪里有问题吗?

既然大写字母的生成不够精确,我们再来试试简单的英文单词吧。

Prompt 如下:

same exact image(same text on page), include:

1. I am Jerry. I enjoying writting in SAP Community.

2. I would like to continue write stories here.

sheet of paper is now taller. the field of view thus now wider, so that the scene is visible.

结果仍然不能让我满意。大家可以看到,生成的图片里面的文字,同我 Prompt 里提供的文本相比,准确率只有 10% 左右。

不过,OpenAI 官网上给出的一些 demo,效果看起来令人惊叹。

比如使用者提供一张图片,ChatGPT 4O 就可以将 OpenAI 的 logo,叠加到这张图片上。这意味着以后使用 PhotoShop 的美工人员们,都要面临失业了吗?

然后是把一首诗转换成手写体:

效果非常完美:

然而我选了一小段,亲自动手试试:

To see, to hear, to speak, to sing-

Oh, the richness these senses bring!

In harmony, they blend and weave,

A tapestry of what I perceive.

用的与 demo 完全一样的 Prompt,最后结果如下,文本的匹配准确率仍然很低。

不过知乎上有朋友做了推测,这是因为目前我们使用的 ChatGPT 4O,demo 里包含的那些能力,还没有真正上线。当然这个说法,目前也暂时无法验证。

OpenAI 技术团队成员在 X 上表示,之前在 LMSYS Chatbot Arena 上引起广泛热议的神秘模型「im-also-a-good-gpt2-chatbot」就是 GPT-4o 的一个版本。

在比较困难的 prompt 集上 —— 特别是编码方面:GPT-4o 相比于 OpenAI 之前的最佳模型,性能提升幅度尤其显著。

具体来说,在多项基准测试中,GPT-4o 在文本、推理和编码智能方面实现了 GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉功能上实现了新高。

总之我们期待 ChatGPT 4O 在接下来一段时间内,随着自身的迭代,会变得越来越好。让我们拭目以待吧。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OnwQ8z8o9MST543ju09qQivQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券