发表于 2026年4月15日 by shridharathi
试用 Seedance 2.0
AI 视频曾经非常糟糕。(我们都见过威尔·史密斯吃意大利面的次数多到数不清,所以我就不赘述了。)
然而,去年我们真正开始看到 AI 视频起飞,出现了像某机构的 Veo 3 系列和某机构的 Kling 这样的领跑者。随着每个新模型的发布,我们在提示词遵循度、音频集成和解决“AI 感”方面逐步改进。
Seedance 2.0 是数月来我们看到的最大变革。你可以用这个东西制作电影。
近地轨道上两个巨大空间站的灾难性碰撞。金属在慢动作中剪切开来,空间站相互碾压,碎片如冰雹般向外螺旋飞散。整个模块像锡罐一样 crumpled。加压舱在剧烈爆发中爆裂,大气结晶化。太阳能电池板破碎并翻入虚空。摄像机在残骸中翻滚,一名宇航员像布偶一样飘过,手臂挥舞。爆炸沿着空间站主干蔓延。地球在背景中巨大而 looming,宁静而冷漠。超写实,灾难性规模,ISO 碎片场,8k,《地心引力》碰撞序列能量。
一只胆大的空中盗贼骑着一架生物力学滑翔机穿越混乱的浮岛集市,轻松穿梭于空中商人之间,躲避经过的飞艇、成群的狮鹫和系泊的贸易站。他急速掠过 crumbling 的石拱门、繁忙的绳索桥和 cascading 的瀑布,以精确和风格桶滚穿过狭窄的缝隙。电影般的跟拍镜头跟随他的下降,增强的动态模糊和斑驳的阳光从晶体结构和薄雾中反射出来。天空之城 pulsates 着充满活力的奇幻氛围——扇动的翅膀、叫卖的商人和不间断的垂直运动。超写实细节,史诗级高幻想动作美学,捕捉速度、敏捷性和穿越云层的无畏 momentum。
在夜间大雨滂沱的高速公路上高速追逐。两辆肌肉车以 140 英里/小时的速度穿梭在密集车流中,车头灯刺穿暴雨。一辆车擦过一辆半挂卡车,火花飞溅过六个车道。摄像机安装在前车的引擎盖上,雨水敲击镜头。霓虹高速公路标志在头顶模糊。追逐车在两个巴士之间甩尾穿过。轮胎在积水上打滑。超写实,动态模糊,湿沥青上的反射,8k,迈克尔·曼摄影风格。
一群巨大的恐龙穿越茂密的丛林。数十只腕龙和副栉龙冲破林线,它们巨大的身体像折断树枝一样折断树干。摄像机在地面高度,随着每个雷霆般的脚步震动。灰尘和碎片填满空气。一群翼龙从头顶的树冠中 burst out。恐龙群绕过一棵倒下的树,摄像机 narrowly 避免被踩踏。超写实,丛林 foliage 四处飞扬,《侏罗纪公园》能量,8k,斯皮尔伯格摄影风格。
一架战斗机在日落时从航空母舰起飞。弹射器发射,战斗机在两秒内从零加速到 170 英里/小时,加力燃烧器 blazing 蓝白色。蒸汽从弹射轨道喷出。摄像机从甲板跟随,战斗机越过船头,微微下沉,然后陡峭爬升入橙色天空,留下双尾迹。甲板 crew 对抗喷气 blast。海洋延伸到地平线。超写实,《壮志凌云》摄影风格,8k,双涡扇发动机的尖叫 roar 和弹射器的金属 slam。
一名孤独的探险者穿越丛林深处一座古老、长满藤蔓的寺庙。巨大的石柱被藤蔓包裹,高耸 overhead。金色光线从 crumbling 天花板的缝隙中穿透,照亮悬浮的灰尘和昆虫。探险者推开垂下的树根 curtain,发现一个巨大的地下 chamber,有一个静止的水池,倒映着上方的废墟。萤火虫飘过空间。超写实,《夺宝奇兵》氛围,8k,史诗发现时刻,滴水声在 chamber 中回响。
巨大的潮汐 wave 冲击沿海城市。当水墙涌过街道时,建筑物 crumble。汽车被卷起并在洪水中翻滚。摄像机从屋顶捕捉破坏,wave 在下方经过,水 explosion 冲击摩天大楼。碎片和泡沫在每个方向 churn。天空布满乌云。超写实,灾难性规模,8k,罗兰·艾默里奇灾难电影,一百万吨水的震耳欲聋 roar。
金色时刻峡谷中的戏剧性骑马追逐。一名骑手骑着黑色种马沿着狭窄 ledge 全速 gallop,红色灰尘在他们身后 billowing。峡谷壁在两侧 towering,在低垂的阳光下 glowing 琥珀色。马跳过小径上的一个 gap,四个蹄子离地,鬃毛和尾巴飘动。摄像机从平行的山脊跟踪。岩石从 ledge 边缘 crumbling。骑手回头看向肩膀。超写实,史诗西部片摄影风格,8k,蹄声在峡谷壁上回响。
这是一个相当革命性的视频模型。
这篇文章将讨论 Seedance 2.0 的一些实用和最酷的功能,以便你理解如何使用这个 incredible 的技术工具。阅读后,你将掌握所有技巧,帮助你生成真正精彩的视频。
大多数视频模型接受文本提示并给你一个片段。Seedance 2.0 的工作方式不同。你可以向其输入最多 9 张图像、3 个视频片段、3 个音频文件和一段文本提示。模型理解如何使用每个部分。你可以从照片中提取构图,从视频片段中提取摄像机运动,从音轨中提取节奏,并用文字描述它们如何协同工作。
这个过程更接近于导演而不是提示。
以下是一个示例。让我们将这个角色放入这个室内场景:
并让他说出这段音频:
要在提示中参考任何输入素材(图像、视频或音频),我们将每个称为 Image1 或 Audio1。例如:
Image2 在 Image1 的室内,其中保留了 Image2 的风格,但 Image1 的真实感保持不变。他说 Audio1。
使用此技巧的一些提示——在提示中打出输入音频的文字会有所帮助,并且将视频 duration 设置为与音频相同的长度也会有所帮助。
借助参考能力,你可以在视频中保持风格一致性。看看这个示例,我输入了几张特定风格的图像,并要求 Seedance 2.0 将它们融合成一个视频。视频编辑可能需要几天才能完成。
在所有照片之间创建流畅的 morph
甚至不需要要求背景音乐,但它对我效果很好!
你可以看到 Seedance 2.0 中的参考如何扩展到几个常见工作流程:
Seedance 2.0 不是先生成视频再配音。音频和视频来自同一统一架构,这意味着它们在毫秒级别上同步。
该模型生成带有多个分层轨道的双通道立体声。这意味着你可以获得背景音乐、环境音效和角色旁白的混音。
一位爵士钢琴家的双手在烟雾缭绕的夜总会中快速扫过三角钢琴琴键的特写。每次击键都会在钢琴的漆面上产生可见的暖琥珀色光 ripple。摄像机慢慢拉远,露出完整的乐队——低音提琴、带刷子的鼓、次中音萨克斯。音乐家们互相点头,交换独奏。香烟烟雾在一个聚光灯束中卷曲。超写实,亲密爵士俱乐部氛围,8k,钢琴键的 crisp 击键声,行走低音线,刷子军鼓,气息浓郁的萨克斯旋律。
每种乐器 individually 可听,并与音乐家的动作同步。钢琴键、行走低音线、刷子军鼓——全部与视觉一起生成,而不是事后叠加。
对话也是如此。每个词都 crisp 清晰,精确固定在嘴唇动作上。通常,单次生成甚至长而复杂的对话也很容易完成。
一个 tight 中景镜头,两位 eccentric 成年人穿着典型的日常服装——一位穿着稍微 oversized 的风衣,另一位穿着 weathered 牛仔夹克——在雨中的西村街角进行 heated、animated 的对话。穿风衣的那位 wildly 打手势,词语“SOURDOUGH PRETZEL”以 pulsing 电蓝色出现:“这不只是椒盐卷饼,Arthur!这是酸面团椒盐卷饼!”第二个人说:“谁在乎。椒盐卷饼就是椒盐卷饼!”
我最喜欢这个模型的是它处理复杂物理的能力。这是以前视频模型的一个大问题。任何复杂运动或交互都充满了 artifact。使用 Seedance 2.0,东西就是能 work。甚至是疯狂的东西。
我痴迷于在这个模型上制作高能太空视频,因为这些碰撞看起来 incredible 且真实。
近地轨道上两个巨大空间站的灾难性碰撞。金属在慢动作中剪切,空间站相互碾压,碎片如冰雹般向外螺旋飞散。整个模块像锡罐一样 crumple。加压舱在剧烈爆发中爆裂,大气结晶化。太阳能电池板破碎并翻入虚空。摄像机在残骸中翻滚,一名穿着白色 EVA 服的孤立宇航员像布偶一样飘过,手臂 helplessly 挥舞。爆炸沿着空间站主干 ripple。地球在背景中巨大而 looming,宁静而冷漠。超写实,灾难性规模,轨道碎片场,8k,《地心引力》碰撞序列能量。
看看这个示例。我们从一个输入图像开始,只要求 Seedance 2.0 动画化场景。典型的视频模型只会让车辆作为刚体向前移动,但我们看到 Seedance 2.0 采取了额外的步骤,让车辆在 navigating 崎岖地形时上下浮动。这更像是我们期望从高预算电影中看到的质量。
动画化此图像
同样的物理理解也适用于风格化输出。这里,我们从某机构的 Dreamina 3.1 的一个输入图像开始。即使渲染为油画,流体动力学仍然准确——水以正确的粘度移动,splashes 正确破裂,表面表现得像表面。
动画化此图像
Seedance 2.0 生成最长 15 秒的视频,包含多镜头构图。模型根据你的提示规划摄像机语言——剪辑、过渡、跟拍镜头、推进——而无需你指定每个摄像机运动。
你可以通过在提示中写入时间戳来指导单个 15 秒生成中的各个镜头。
示例格式:
undefined
undefined
undefined
你甚至可以只列出你想要的场景,但这种时间编码方法允许你真正调整片段的长度。令人惊讶的是,即使在提示中有如此密集和具体的信息,它也不会产生幻觉。
每个镜头应指定摄像机位置、主体动作和光照状态。镜头之间的过渡语言(如“硬切到”、“无缝 morph 成”)给模型明确的剪辑指令,而不是让它即兴发挥。
以下是四个示例,展示了时间编码提示的能力:
日落武士——变焦推拉和起重机镜头:
undefined
4-8秒: 对武士脸部的变焦推拉,当 realization 袭来时——背景伸展和扭曲,而主体锁定在画面中,希区柯克眩晕效果,鼓声渐强。
8-12秒: 快速 pan 到 sweeping 的起重机镜头,上升到山脊上方,revealing 一支由一千个火炬组成的军队在山谷中前进,战角 blaring,烟雾飘过 landscape。12-15秒: 快切到 extreme 特写,武士的手 gripping 武士刀刀柄,指节发白,一滴汗水以慢动作落下,刀被拔出的声音响起,然后死寂。超写实,8k,黑泽明摄影风格,汉斯·季默声音设计。
香水广告——产品视频、用户生成内容等:
(0-3秒) 散布的粉色 peonies 中奢侈香水瓶的微距镜头,浅景深,花瓣在温暖的午后光线中飘浮,柔和的环境音乐。
(3-7秒) 摄像机滑近,一只女性的手从右侧进入画面,手指 gently 触摸玻璃瓶,丝绸沙沙声。
(7-12秒) 硬切到慢动作喷雾,金色薄雾 diffuses 通过空气,粒子在黑暗背景下捕捉边缘光,雾化器的嘶嘶声。
(12-15秒) 无缝拉出到英雄画面,产品居中,体积光,极简奶油背景,优雅的沉默。超写实,8k,时尚商业广告摄影风格。
火星着陆——《星际穿越》风格孤立:
0-4秒: 广角镜头,静态三脚架,一名孤独的宇航员在黄昏时分站在红色火星平原上,灰尘在靴子处 swirl,沙漠中风的低沉嗡嗡声。
undefined
8-12秒: 硬切到戴手套的手的特写,抓起一把红色灰尘,颗粒在低重力慢动作中落下,每个粒子捕捉 fading 光线。
12-15秒: 面罩反射的 extreme 特写,显示地球为一个小小的蓝点,静态保持,一次心跳,然后沉默。超写实,8k,《地心引力》摄影风格,《星际穿越》声音设计。
霓虹东京——《银翼杀手》雨景序列:
0-4秒: 广角定场镜头,静态摄像机,夜晚的霓虹浸染东京小巷,雨倾盆而下,湿沥青上的反射 pooling,城市交通的远处喃喃声和雨打金属遮篷的声音。
4-8秒: 中景镜头,缓慢 dolly 向前,一个穿着黑色风衣的身影在红色纸伞下向摄像机走来,霓虹灯 sign 在他们的脸上 flickering。
8-12秒: 无缝 morph 成特写跟拍镜头,身影的手放下伞,雨打在脸上,他们仰望天空,雨声 intensifies。
12-15秒: 硬切到雨滴撞击霓虹水坑的 extreme 特写慢动作,每滴 explosion 成反射颜色的环,低音 rumble fading 到沉默。超写实,8k,《银翼杀手2049》摄影风格,罗杰·迪金斯 lighting。
所有四个都遵循电影制作的相同升级模式:广角 > 中景 > 特写 > extreme 特写。这种 progression 自然地映射到 15 秒的窗口,并为模型提供了清晰的结构。
以下是如何使用 Seedance 2.0 生成视频:
import replicate
output = replicate.run(
"bytedance/seedance-2.0",
input={
"prompt": "一架战斗机在日落时从航空母舰起飞。弹射器发射,战斗机加速,加力燃烧器 blazing。蒸汽从弹射轨道喷出。摄像机从甲板跟随,战斗机越过船头,陡峭爬升入橙色天空。超写实,《壮志凌云》摄影风格,8k。",
"duration": 10,
"resolution": "720p",
"aspect_ratio": "16:9",
"generate_audio": True,
# "reference_images": ["https://..."] 用于角色/风格参考
# "reference_videos": ["https://..."] 用于运动迁移
# "reference_audios": ["https://..."] 用于音频驱动生成
}
)
print(output)import Replicate from "replicate";
const replicate = new Replicate();
const output = await replicate.run(
"bytedance/seedance-2.0",
{
input: {
prompt: "一架战斗机在日落时从航空母舰起飞。弹射器发射,战斗机加速,加力燃烧器 blazing。蒸汽从弹射轨道喷出。摄像机从甲板跟随,战斗机越过船头,陡峭爬升入橙色天空。超写实,《壮志凌云》摄影风格,8k。",
duration: 10,
resolution: "720p",
aspect_ratio: "16:9",
generate_audio: true,
}
}
);
console.log(output);以下是从这个模型中榨取最多效果的最终提示技巧:
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。