OpenAI发布了正式版的o1推理大模型,一经发布啊,今天国内就沸腾了。搜一下o1大模型相关关键词,我们会看到,不少人动不动配上最强大、或者地表最强大,首批王炸之类的溢美之词,甚至有个别在视频里说是颠覆性的。
可见不少国内用户,对这个O1或者说openai很崇拜。不过与之形成鲜明对比的,倒是国外用户很平淡。平淡在哪里呢?
第一点,不像chatgpt出来时那么轰动了,甚至关注的人很少,openai12日活动第一天直播的时候,我是全程观看的,最高也就3000人在线观看,目前他的直播视频还在油管挂着,截至晚上10点多我说这个事时,也就27万人看了。要知道他是有130多万订阅者的,说明本土对其关注度低。
第二点,很多国外用户质疑最多是200美元每月这个费用是不是不值当,或者说这个模型套餐他们认为不值这个钱,也可以反应出,这次发布的新模型对国外用户没有吸引力。
当然了,这次正式版的 o1升级的地方也挺多,首先肯定比他们自己此前推出的o1预览版更聪明、更快,平均响应速度提升了约60%;在困难的现实问题上减少了 34%的重大错误;增加了多模态能力,可以识别图像。
以上升级的这些,都是较大的一进步,可以说,他的一些基础技术含量还是可以的,毕竟在大模型方面、计算能力方面openai有着先天优势,他不缺算力的。
但是,国内过分沸腾,和国外用户形成反向对比,也是一个不得不说的“乱象”啊。
就举个例子说,o1增加了多模态能力后,测试人员拿他手绘的一张太空数据中心极为简化的示意图,让其根据要求计算出数据中心所需散热器表面积的下限。o1展现出较强的推理能力,也算出面积约242万平方米。
这可把一些不懂的、只会沸腾国外技术的人高兴坏了。说什么o1超过了人类博士,是最聪明最智慧的。这些都可以认同一下,确实智慧。但是,这些人同时还表示对国内的大模型感到失落,说他们只能做高中题目或者简单的大学题目。
唉~,这些人捧外国臭脚就算了,非得数落一下国内大模型干啥?其实我们好多大模型在多模态上也是不赖的,而且我们在计算方面差点是却算力,但不代表推理也差。
如果这些人要是能够自己测试一下国内大模型多模态能力,也不会完全否定和失落。你看我随便测试的一个国内的,拿的是同样图,还是截图,问题也用openai一样的问题,得到的答案是不是也是242万平方米。其实,我们不差的。
可以概括来说,这次openai发布的新品,更多的是常规升级,而且还是一种延后性常规升级了,没有真正颠覆性的东西。当然,人家确实是AI领域里的领先代表之一。
不是承认别人优秀难,而是部分人盲目追捧国外技术,太容易主观认为国外新品就一定很厉害、很颠覆。事实上,通过国内外用户对比来看,这类产品更新没太多突破性亮点,不像ChatGPT刚推出时那样带来极大新鲜感和震撼了。
所以啊,更理性看待其实际价值和升级程度,很重要,别像一些人吹嘘的那么沸腾,更不要被这种扭曲的价值观带偏了。
领取专属 10元无门槛券
私享最新 技术干货