期待已久的OpenAI春季发布会如期举行
虽然像奥特曼说的那样
暂时不会发布GPT5
但是新发布的GPT-4o
依然给到我们不少的震撼
发布会中,技术人员展示了GPT-4o的实时语音互动,改音色音调语气,同声传译,指导数学解题、辅助编程、分析图表,并实时分析现实中的人物表情动作等新功能,这不就是2013年上映的AI电影《她》吗?GPT-4o俨然已经成为电影中里面由美女斯嘉丽配音的智能AI了。
尽管发布会展示的功能已经相当震撼了,但这里还是将Openai及其开发人员刚刚在社交平台分享的新应用整理分享给大家。
1
视力障碍人士的解说引导员
不难想象,借助摄像头、网络和语音交互,GPT能很出色地弥补导盲犬不能话说引导的问题。
官方视频中可以看到,GPT4o辅助盲人解读现实风景信息,网上约车后能观察的士是否已经到来,并引导上车。这个功能也有软肋,就是当网络信息太差的时候,GPT的延迟或停止响应会成为问题,同时服务流量过大对OpenAI来说也是个严峻的考验。
2
会议主持人兼助理
目前该功能已应用到Openai的内部员工会议中,可以看到Gpt4o在其中起到的会议主持以及参与话题讨论互动的作用,激发更多灵感的同时,使会议更加有条理逻辑,不用担心10分钟会议最后开大半天的问题。
当然也包括整理会议过程录音和讨论文稿这种在腾讯会议已经实现的基本功能。
3
在图片中插入文字
若觉得图片需要增加文字描述,可以让GPT对图片直接进行编辑修改,无需再用软件自己编辑,Photoshop可弃用了。
4
对图片进行3D渲染
这种功能应用应该只会开放给付费用户,毕竟这玩意就是烧算力,给全球免费用户都用不现实。
5
图片处理
这里包括一些AI图片处理的基本功能,如文生图制作海报,将图片转换其他风格,比如人物照变换成漫画贴图:
还有品牌礼品的处理,将logo和礼品两个图片整合在一起等。
6
将文本变换为字体
这个可以通过GPT将特定的文字字符整合成类似于签名印章的字体,使用时直接调用字体就可以,不过看着实用性不大。
领取专属 10元无门槛券
私享最新 技术干货