首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AI辅助研究和工具实践04-自动化的AI写作和出图文视频工作流

AI辅助研究和工具实践04-自动化的AI写作和出图文视频工作流

作者头像
人月聊IT
发布2026-03-26 19:47:57
发布2026-03-26 19:47:57
450
举报

大家好,我是人月聊IT。

今天继续整理和分享AI工具使用方面的话题。即如何简单的构建一个关于写作或自动化出图文视频的工作流。

在这里所有工具全部采用Google的全家桶工具来进行完成,其中包括了Google Antigravity的IDE编程工具,Google AI Studio,也包括了Google提供的深度研究功能和我前面多次提到的Notebooklm AI笔记。

在前面我就多次提到了,实际我们大部分的自动化工作都可以采用类似构建Skills技能包或者AI编程的方式来完成。这个实际并不需要你有相应太多的编程经验就可以完成。特别是最近类似minMax,天工AI,阿里的Qoder,腾讯的CodeWork都推出了自己的AI桌面端工具,更加加快了普通人通过AI工具提升效率的速度。

通过AI输出图文并茂的文章

首先大家可以看下我2月4日公众号发布了一篇文章,即意识的本质,这篇文章即是通过我构建的Skills技能包自动化工作流自动完成,输出了一篇图文并茂的文章。

对于这个工作流核心的思路,我将其分为三个关键步骤。第1步是互联网爬取意识相关的关键文章,存储到本地;第2步是基于我给出的关键写作要点和提纲,调用AI工具对文章重新进行归纳输出;第3步是对输出的文章进行配图,调用Google Nano Banala的API来输出图片。

如何来完成上面的关键步骤呢?

实际我仅仅是给出我的写作思路,给出数据采集指定的网站和关键字,其余的工作基本全部由AI来自动完成。类似我前面文章谈过的热点文章写作Skills也是同样的道理。

这个Skills技能包里面不仅仅是提示词和参考模板,更加重要的是执行我的数据采集任务,文章配图任务等的源代码片段。对于这种文章的输出实际我并不会经常应用到个人文章写作,但是通过该例子,我基本验证了一个关键的内容。就是我经常谈到的,构建了原子技能+方法论技能的两个关键技能分层

再简单点来说,就是对于个人AI辅助来说,我只是需要将我个人的原子技能全部梳理和定义清楚,再基于需要定义我的上层方法论技能,那么AI基本就可以完全复刻一个具备同样能力的我。即使对于现在火热的OpenClaw,实际核心思路仍然和我上面思路一致。

这个也是我经常谈到的,AI辅助的时候首先是让AI能够复刻你已有的技能,其次才是面对千变万化的场景,让AI具备基于你的原子技能,进行自我组装,自我进化的能力。

通过AI输出图文并茂的视频

请帮我做一份中国古代木质建筑构建结构分析的深度研究,需要对类似古塔(宋代应县木塔,晋祠),古寺庙(唐代五台山佛光寺,南禅寺),辽金华严寺,善化寺。清代故宫太和殿,天坛等。当然你也可以增加我没有谈到的代表性建筑。我需要你深度研究各个时期木质简直的特点,内部构建,框架结构,构建方式等。形成一篇完整的深度研究报告给我,注意体现关键的构建细节,因为后续我需要用该深度研究文章进行ppt配图。因此深度研究文章要能够讲清楚内部构建细节。注意重点要参考梁思成的中国建筑史。字数8000到10000字。

大家可以看下我2月7日发布的《中国古代木质建筑框架研究》的文章和视频,整个视频全部基于AI输出。核心思路是:

首先是基于Google的DeepResearch深度研究功能输出完整的1万字左右的深度研究报告。然后再让Gemini基于报告输出一个35页的分页绘制ppt图片的绘制提示词。并输出和35页内容对应的语音播客的讲解逐字稿件。接着再调用Notebooklm输出具体的图片信息。

在上面内容都做完成后,实际我得到的两个关键内容。一个是完整的35页ppt的内容,一个是基于这个ppt内容解读的语音文字稿内容。但是我现在需要基于这两个内容输出一个图文讲解的视频。

接着我使用Google AI Studio来帮我生成一个简单的应用APP来完成该任务,具体的提示词如下:

我会提供两个文件给你,一个是有35页ppt的pdf文件,一个是按这个ppt顺序的语音播客文案,你是否可以基于这两个文件帮我生成一个完整的视频,视频就是讲解ppt的内容,同时讲解到某页的时候就显示该页的图片?

基于这个内容,AI帮我输出一个完整的APP界面如下:

我只需要上传我提供的ppt和解说稿件,AI帮我自动完成合成。

由于Google API调用次数限制,我后面又将其源代码下载,基于AI辅助编程,将TTS的语音API替换为GLM的大模型重新进行输出。

整个过程当前还没有实现基于一个关键主题完全一键自动化,但是我们基本可以看到整个过程是完全可以做到的。这个也给了我们一个制作PPT图文解说视频的自动化思路,供大家参考。

今天的分享就到这里,希望对大家有所启发。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-02-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人月聊IT 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档