01
轻松万粉:古风育儿视频
古风育儿赛道万粉博主扎堆,我随便搜了一下就有这么多,起号率是真的高!今天就给大家拆解一下古风育儿视频工作流,先来看看效果:
可以看到视频由文案字幕、配音、图片和BGM组成,这些都是可以用大模型和插件实现的,下面从0开始教大家如何搭建。
02
0基础-新建coze工作流
这一部分讲解如何进入空间并新建一个工作流,熟悉的朋友可以跳过,直接去03工作流搭建部分。
1. 首先搜索coze进入官网,点击<快速开始>,进入主页。
2. 点击 工作空间 资源库 +资源<工作流>
3. 输入名称和描述,注意名称只能用英文和英文符号,描述可以写中文。
点击确认进入工作流界面,自带开始和结束节点,通过添加一个个节点来进行搭建。
每个节点有其对应的功能,连接起来就能完成预设好的、较为复杂的任务。
添加节点有两种方式,一种是点击下方“+添加节点”按钮:
第二种是点击节点后或者线中的小+号:
03
工作流搭建
视频的脚本逻辑很简单,就是一句文案一张图片,图片与文案对应,搭起“骨架”了,然后每句文案加上配音、字幕,最后整体加上背景音乐。
因为是视频工作流,节点比较多,给大家拆分了一下功能(如图),接下来分成这几个部分给大家讲解:
3.1 文案生成
3.1.1 大模型生成文案
这个部分包括开始、大模型、代码三个节点,开始节点输入主题,代码节点整理数据格式,核心功能(文案生成)就是由大模型完成。
大模型这类节点功能强大,但使用起来很简单,主要依靠提示词。
完整提示词:
# 角色
你是一个专业的视频文案创作者,擅长生成紧密连贯、且约100字左右的文案,以满足视频内容创作的需求。
# 要求
{{input}}
## 技能
### 技能 1: 生成文案
1. 当用户要求生成文案时,根据用户提供的主题方向,快速生成一段约100字的文案。
2. 如果用户未明确主题,则自己选定一个主题生成文案
3.文案以数组的形式输出,每句话为一个数组成员,每句话以人类的阅读习惯分割,而不是标点符号,数组成员内容不包含任何标点,每句话会作为字幕并且配音
4.太长的句子中间不用空格分割,而是直接放到新的数组项里面
### 技能2:分析文案风格,推荐背景音乐类型
根据生成的文案内容,推荐一种风格、节奏和情感氛围相匹配的背景音乐类型
例如输出:
励志、温馨、神秘、古风、现代、悲伤
## 限制:
- 仅生成符合要求的文案,拒绝回答与文案生成无关的话题。
- 文案不包含人名,工作室名称
- 文案需满足约100字要求且没有换行符,不能偏离此框架。
注意输出要设置三个变量,分别输出主题、文案数组和背景音乐关键词。
3.1.2 代码:组合文案
这里是将数组形式的数据转换成简单的字符串形式。大概完成这样的效果:
所以输入文案数组,需要注意的是,后续的配音和字幕生成,使用的是原始的句子列表(outputList),而不是这个合并后的长字符串。
这样做是为了能够逐句生成音频和字幕,从而实现音画和字幕的精确同步。
完整代码(Python):
import asyncio
import json
from typing import Any, Dict, List
async def main(args: Args) -> Output:
params = args.params
input = params['input']
result = join_strings(input)
# 构建输出对象
ret: Output = {
"res": result
}
return ret
def join_strings(string_array):
return ' '.join(string_array)
3.2 AI配音
配音直接使用官方的插件<语音合成>,可以选择音色,根据文本AI配音。
需要设置4个地方:
(1)选择批处理
(2)<批处理-item1>输入文案数组
(3)<输出-text>输入本身的<批处理-item1>
(4)选择音色
我也详细讲解过批处理的概念和两种使用方式,感兴趣的朋友可以回顾一下。
3.3 搜索背景音乐
添加一个大模型节点,模型可以自行选择,不同模型生成的建立风格不同,我这里选的是deepseek-v3。
keyword选择前面大模型输出的背景音乐关键词。
3.4 图像生成
这部分由一个大模型和一个循环体组成,大模型编写提示词数组,循环体批量生成图片。
3.4.1 图片提示词大模型
设置两个输入变量:
input:文案-output
abstract:文案-outputList
注意输出要选择数组格式(Array)
完整提示词:
你是一个专业的文生图的提示词专家以下是输入的文本:
{{input}}
摘要:
{{abstract}}
任务描述:
从用户输入的文本文案结合故事简洁的摘要,生成图片的提示词:为摘要列表中每个摘要结合原文生成一组相关的图片提示词,每组提示词用于生成与摘要和文案内容主题相关的图片。模型有足够的思考时间。根据文案内容固定时代背景,以统一的时代为前提,提示词应涵盖不同方面,如场景、角色、情感等,以丰富图片生成的可能性,必须包含已经确定的时代背景。
以下是示例:
在一个遥远的森林里,住着一只勇敢的小兔子。它每天都会在森林里探险,寻找新的朋友和宝藏。有一天,它发现了一片神秘的花园,里面开满了五彩斑斓的花朵。小兔子决定邀请它的朋友们一起来欣赏这片美丽的花园。
提取摘要:
勇敢的小兔子在森林中探险,发现了一片美丽的花园并邀请朋友们一起欣赏。
输出了3张图片提示词:
["现代、森林、小兔子、探险",
"现代、五彩斑斓的花朵、花园、朋友、宝藏",
"现代、五彩斑斓的花朵、花园、朋友、欣赏、开心"]
输出:
图片提示词列表
## 限制
列表中提示词数组必须与{{abstract}}列表size一致,不能为空
图片提示词中图片的风格需要统一
3.4.2 图像生成循环体
循环节点设置如下:
图像生成节点比例根据自己需要选择,我这里选的3:4,提示词如图:
现在我们的素材都准备好了,先处理一下数据格式,就能创建剪映草稿文件了!
3.5 数据格式处理
这个阶段包含一系列工具节点,它们的作用是将前面生成的零散素材(文字/音频/图片)进行处理,为导入视频编辑器做准备。
3.5.1 提取与转换
get_url提取纯净链接,objs_to_str_list转对象列表为字符串列表。
3.5.2 计算时间线
audio_timelines节点是实现音画同步的关键:获取每个配音音频文件的时长,并计算出它们在视频轨道上的开始和结束时间点。
3.5.3 格式化素材信息
将所有素材(配音、字幕、图片、背景音乐)与其对应的时间线信息组合,打包成剪映能够识别的特定数据格式。
输入分别对应前面的生成的素材,timelines都选择audio_timelines节点。
字幕和图片数据都可以设置样式:
3.6 视频自动化剪辑
先创建一个剪映草稿,把处理好的数据都添加进去,最后保存并输出就完成了。
04
结语
这篇带大家搭建了AI一键生成古风育儿视频的工作流,有收获的朋友一键三连支持一下~
有问题也可以留言,看到了都会回复,快来试一试吧!
往期工作流/智能体教程回顾:
VEO3插件:ASMR解压床视频
Veo3插件无需科技:coze工作流一键制作Veo3解压床视频(coze工作流教程+获取)
小红书图文创作系列:
多Agents模式
多智能体合作:小红书图文创作+违禁词检测与修改(coze智能体教程+获取)
输入主题AI创作图文
AI小红书图文创作:输入主题,一键生成图文(coze工作流教程+获取)
小红书违禁词检测与修改
图片系列:
批处理讲解:电商图批量换背景
口红电商图模板