谷歌 Gemini 1.5 Pro ：OpenAI Sora生成视频虽美但存逻辑瑕疵

文章来源：企鹅号 - 网界

近日，科技巨头谷歌与OpenAI在人工智能领域的竞争再掀波澜。谷歌的人工智能模型Gemini 1.5对OpenAI新推出的文本转视频工具Sora生成的一段视频进行了深入评价，指出视频在视觉效果上引人入胜，但存在多处不合逻辑之处，揭示出其非真实性。

此前，两家公司分别发布了各自的最新技术成果：谷歌推出了Gemini 1.5 Pro，而OpenAI则发布了备受瞩目的Sora。Sora的发布时间引发了外界的猜测，有人认为OpenAI此举旨在转移公众对谷歌Gemini 1.5的关注度。

谷歌一位高管在社交媒体平台上详细分享了Gemini 1.5 Pro对Sora生成视频的分析结果。以一段日本街道视频为例，视频中既有大雪纷飞的场景，又有樱花盛开的画面。然而，Gemini 1.5 Pro指出，这种景象在现实中是不可能出现的，因为樱花通常在春季绽放，而那时并不会有降雪。此外，视频中的雪花下落方式过于均匀，与真实降雪场景存在明显差异。同时，视频中的人物在大雪中却未穿着任何冬装，这也与实际情况相悖。

Gemini 1.5在分析中总结道：“虽然这段视频在视觉上具有很强的吸引力，但其中的逻辑矛盾表明它并非来自现实生活。”

Sora作为一款能够生成长达60秒视频的文本转视频工具，具备创建细节丰富场景、复杂摄像机运动以及多个人物画面的能力。这一突破性技术的出现被许多人誉为视频生成领域的“ChatGPT时刻”。

与此同时，谷歌的Gemini 1.5也展现出了强大的实力。它拥有惊人的100万词条上下文窗口，远超其他竞争对手如GPT-4 Turbo和Anthropic Claude 2.1。这意味着Gemini 1.5能够一次性处理大量信息，包括长达1小时的视频、11小时的音频以及超过30000行代码或70万字的代码库。这一特性使其在信息处理能力上达到了新的高度。

发表于: 2024-02-192024-02-19 17:26:29
原文链接：https://page.om.qq.com/page/OcuTwRpr8NazogVKeVF2eyBQ0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

谷歌 Gemini 1.5 Pro ：OpenAI Sora生成视频虽美但存逻辑瑕疵

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐