作者|沐风
来源|AI先锋官
就在日前的Google I/O 2025开发者大会上,谷歌用一系列AI黑科技再次震撼全球。
相关阅读:Google I/O 2025:用AI重做了所有产品,从工具进化为“行动者”
其中最引人瞩目的,莫过于新一代视频生成模型Veo3。
Veo3在Veo2的基础上扩展了很多新的能力,包括:参考图视频生成、参考风格视频生成、参考目标视频生成、相机控制视频生成、首尾帧视频生成、视频外扩、视频编辑、音视同步生成等等。
为了获得更大的真实感和保真度,Veo3中新增了4k输出和Veo 3的真实物理世界和音频。
同时,Voe3还提高了模型的即时遵守提示的能力,这意味着对您的指示做出了更准确的回应。
其中,备受网友关注的功能非“音视同步生成”莫属。
只需要输入一段文字描述,就能得到一个包含完美口型同步对话、精准环境音效、电影级运镜的完整视频。
例如下方这个由网友生成的视频,简直和影视切片毫无差别。
要想实现这项功能,关键离不开DeepMind过去的一项底层技术“V2A”( Video-to-Audio )。
2023年6月,DeepMind就首次提到过他们正开发一套AI系统,能从视频像素 + 文本提示中,自动生成完整音轨。包括对白、动作音效、环境音、背景音乐……
它的原理是将视频视觉信息编码为语义信号,与文本提示一同输入扩散模型,生成匹配的音频波形。
这意味着AI视频的"默片时代"将彻底终结。
现在,Veo3的能力被深度整合进了谷歌全新推出的Flow平台,一个专为视频创作者打造的AI制片厂。
目前仅面向美国Ultra订阅用户开放,定价为 249.99 美元/月(约1800元人民币)。
在X上也已经有不少网友晒出了自己使用Veo3生成的视频。
例如,这位博主使用Veo3耗时2小时制作的花式“We can talk!”让一众网友直呼"不敢相信这是AI生成的"。
一只会说话的青蛙;
车祸;
一匹马走进酒吧......
谷歌首席创意技术专家还利用Veo 3首尾帧功能,连续生成了几个视频,最终制作了下面这个1分钟左右的视频:
虽然背景音乐不是由Veo 3生成的,但其中的画面和男主角的自白确实有电影内味儿。
那么抛开音频,只看视频效果,小编不仅好奇,使用Veo 3官方示例的提示词,可灵2.0能与其掰掰腕子吗?
话不多说,开干!
提示词:
A delicate feather rests on a fence post. A gust of wind lifts it, sending it dancing over rooftops. lt floats and spins, finally caught in a spiderweb on a high balcony.
Veo 3
可灵2.0
提示词:
In rural Ireland, circa 1860s, two women, their long, modest dresses of homespun fabric whipping gently in the strong coastal wind, walk with determined strides across a windswept cliff top. The ground is carpeted with hardy wildflowers in muted hues. They move steadily towards the precipitous edge, where the vast, turbulent grey-green ocean roars and crashes against the sheer rock face far below, sending plumes of white spray into the air.
Veo 3
可灵2.0
提示词:
A woman, classical violinist with intense focus plays a complex, rapid passage from a Vivaldi concerto in an ornate, sunlit baroque hall during a rehearsal. Their bow dances across the strings with virtuosic speed and precision. Audio: Bright, virtuosic violin playing, resonant acoustics of the hall, distant footsteps of crew, conductor's occasional soft count-in (muffled), rustling sheet music.
Veo 3
可灵2.0
提示词:
A medium shot frames an old sailor, his knitted blue sailor hat casting a shadow over his eyes, a thick grey beard obscuring his chin. He holds his pipe in one hand, gesturing with it towards the churning, grey sea beyond the ship's railing. "This ocean, it's a force, a wild, untamed might. And she commands your awe, with every breaking light"
Veo 3
可灵2.0
你认为Veo 3与可灵2.0谁的表现更好呢?
以小编的审美来看,可灵与Veo 3平分秋色,但从画面质感、生成的人物、运镜上看,这次小编要说,对不起可灵,我喜欢Veo 3。
小编发现,可灵AI在生成视频后也可以选择给视频添加音效,只不过现在还不能视频+声音一体化生成。
但小编绝对相信,要不了多久可灵也将迎风赶上,1800/月的Veo 3实在太贵了。
.END.
往期文章回顾
领取专属 10元无门槛券
私享最新 技术干货