首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

谷歌 Gemini 1.5 Pro :OpenAI Sora生成视频虽美但存逻辑瑕疵

近日,科技巨头谷歌与OpenAI在人工智能领域的竞争再掀波澜。谷歌的人工智能模型Gemini 1.5对OpenAI新推出的文本转视频工具Sora生成的一段视频进行了深入评价,指出视频在视觉效果上引人入胜,但存在多处不合逻辑之处,揭示出其非真实性。

此前,两家公司分别发布了各自的最新技术成果:谷歌推出了Gemini 1.5 Pro,而OpenAI则发布了备受瞩目的Sora。Sora的发布时间引发了外界的猜测,有人认为OpenAI此举旨在转移公众对谷歌Gemini 1.5的关注度。

谷歌一位高管在社交媒体平台上详细分享了Gemini 1.5 Pro对Sora生成视频的分析结果。以一段日本街道视频为例,视频中既有大雪纷飞的场景,又有樱花盛开的画面。然而,Gemini 1.5 Pro指出,这种景象在现实中是不可能出现的,因为樱花通常在春季绽放,而那时并不会有降雪。此外,视频中的雪花下落方式过于均匀,与真实降雪场景存在明显差异。同时,视频中的人物在大雪中却未穿着任何冬装,这也与实际情况相悖。

Gemini 1.5在分析中总结道:“虽然这段视频在视觉上具有很强的吸引力,但其中的逻辑矛盾表明它并非来自现实生活。”

Sora作为一款能够生成长达60秒视频的文本转视频工具,具备创建细节丰富场景、复杂摄像机运动以及多个人物画面的能力。这一突破性技术的出现被许多人誉为视频生成领域的“ChatGPT时刻”。

与此同时,谷歌的Gemini 1.5也展现出了强大的实力。它拥有惊人的100万词条上下文窗口,远超其他竞争对手如GPT-4 Turbo和Anthropic Claude 2.1。这意味着Gemini 1.5能够一次性处理大量信息,包括长达1小时的视频、11小时的音频以及超过30000行代码或70万字的代码库。这一特性使其在信息处理能力上达到了新的高度。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OcuTwRpr8NazogVKeVF2eyBQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券