首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

1800元/月谷歌Veo3终结默片时代,可灵2.0败给会说话的青蛙?

作者|沐风

来源|AI先锋官

就在日前的Google I/O 2025开发者大会上,谷歌用一系列AI黑科技再次震撼全球。

相关阅读:Google I/O 2025:用AI重做了所有产品,从工具进化为“行动者”

其中最引人瞩目的,莫过于新一代视频生成模型Veo3。

Veo3在Veo2的基础上扩展了很多新的能力,包括:参考图视频生成、参考风格视频生成、参考目标视频生成、相机控制视频生成、首尾帧视频生成、视频外扩、视频编辑、音视同步生成等等。

为了获得更大的真实感和保真度,Veo3中新增了4k输出和Veo 3的真实物理世界和音频。

同时,Voe3还提高了模型的即时遵守提示的能力,这意味着对您的指示做出了更准确的回应。

其中,备受网友关注的功能非“音视同步生成”莫属。

只需要输入一段文字描述,就能得到一个包含完美口型同步对话、精准环境音效、电影级运镜的完整视频。

例如下方这个由网友生成的视频,简直和影视切片毫无差别。

要想实现这项功能,关键离不开DeepMind过去的一项底层技术“V2A”( Video-to-Audio )。

2023年6月,DeepMind就首次提到过他们正开发一套AI系统,能从视频像素 + 文本提示中,自动生成完整音轨。包括对白、动作音效、环境音、背景音乐……

它的原理是将视频视觉信息编码为语义信号,与文本提示一同输入扩散模型,生成匹配的音频波形。

这意味着AI视频的"默片时代"将彻底终结。

现在,Veo3的能力被深度整合进了谷歌全新推出的Flow平台,一个专为视频创作者打造的AI制片厂。

目前仅面向美国Ultra订阅用户开放,定价为 249.99 美元/月(约1800元人民币)。

在X上也已经有不少网友晒出了自己使用Veo3生成的视频。

例如,这位博主使用Veo3耗时2小时制作的花式“We can talk!”让一众网友直呼"不敢相信这是AI生成的"。

一只会说话的青蛙;

车祸;

一匹马走进酒吧......

谷歌首席创意技术专家还利用Veo 3首尾帧功能,连续生成了几个视频,最终制作了下面这个1分钟左右的视频:

虽然背景音乐不是由Veo 3生成的,但其中的画面和男主角的自白确实有电影内味儿。

那么抛开音频,只看视频效果,小编不仅好奇,使用Veo 3官方示例的提示词,可灵2.0能与其掰掰腕子吗?

话不多说,开干!

提示词:

A delicate feather rests on a fence post. A gust of wind lifts it, sending it dancing over rooftops. lt floats and spins, finally caught in a spiderweb on a high balcony.

Veo 3

可灵2.0

提示词:

In rural Ireland, circa 1860s, two women, their long, modest dresses of homespun fabric whipping gently in the strong coastal wind, walk with determined strides across a windswept cliff top. The ground is carpeted with hardy wildflowers in muted hues. They move steadily towards the precipitous edge, where the vast, turbulent grey-green ocean roars and crashes against the sheer rock face far below, sending plumes of white spray into the air.

Veo 3

可灵2.0

提示词:

A woman, classical violinist with intense focus plays a complex, rapid passage from a Vivaldi concerto in an ornate, sunlit baroque hall during a rehearsal. Their bow dances across the strings with virtuosic speed and precision. Audio: Bright, virtuosic violin playing, resonant acoustics of the hall, distant footsteps of crew, conductor's occasional soft count-in (muffled), rustling sheet music.

Veo 3

可灵2.0

提示词:

A medium shot frames an old sailor, his knitted blue sailor hat casting a shadow over his eyes, a thick grey beard obscuring his chin. He holds his pipe in one hand, gesturing with it towards the churning, grey sea beyond the ship's railing. "This ocean, it's a force, a wild, untamed might. And she commands your awe, with every breaking light"

Veo 3

可灵2.0

你认为Veo 3与可灵2.0谁的表现更好呢?

以小编的审美来看,可灵与Veo 3平分秋色,但从画面质感、生成的人物、运镜上看,这次小编要说,对不起可灵,我喜欢Veo 3。

小编发现,可灵AI在生成视频后也可以选择给视频添加音效,只不过现在还不能视频+声音一体化生成。

但小编绝对相信,要不了多久可灵也将迎风赶上,1800/月的Veo 3实在太贵了。

.END.

往期文章回顾

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OvvXuyDI0voOs_QiFbJwTrNg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券