全流程演示如何用智能体(Agent)打造你的自媒体工作素材库
视频详细演示了利用AI智能体构建自媒体自动化工作流的全过程,涵盖素材抓取、文案生成、视频合成及AI绘图等环节。
UP主: 迪哥有点愁 · 时长: 7:58 · 🔗 B站原视频
发布: 2024-10-28 · 收录: 2025-02-13
标签: AI智能体 · 自动化工作流 · 自媒体创作 · 大模型应用 · Stable Diffusion
这套智能体要做什么
全流程演示一下怎么用智能体构建自媒体素材库。别人卖你成千上万的软件,我们自己照样能做出来。
我们的智能体主要做一件事:你给它一个对标同行的链接(比如要模仿谁),标题它来写,大纲它来写,内容也它来写。不光写文案,还包括每个章节配什么图、配什么视频文案,全部一条龙自动化做好。
我的输入只需要传进来一个视频链接,或者对标同行的主页信息就可以。
全流程怎么搭起来(都能用开源替代)
这件事我会按步骤捋一遍,而且其中每个环节都可以用开源插件和工具来替代。
第一步:抓取短视频文案信息
我先配一个插件,让它自动抓短视频信息。
运行的时候,我只需要传一个抖音分享链接就行。无论你是讲电视剧的、讲电影的、剪视频的、讲小说的,还是发种草文案的,随便传个视频链接就可以,这是第一步。
第二步:用大模型生成标题、大纲和正文
我配了两个大模型:
- 第一个大模型:写文案标题和章节大纲。也就是先生成大纲,再根据大纲写内容。
- 第二个大模型:根据这个大纲,完成正文写作。
这里大家注意:配合大模型时,我要自己设计好怎么“解大纲”、怎么写标题、怎么写内容。每一步都可以结合你的业务场景、工作经验,把你对业务的理解加进去。
这也是它跟你平时用工具软件最大的区别:每个环节我都可以自己打造、自己控风格。
第三步:生成视频(提示词 + 开源视频生成)
你可能会问,视频怎么生成?
在任务里我又配了一个大模型,专门用来构建“生成视频”的提示词:视频生成时要传什么提示词、按什么方式写,这块是我自己写的规则。
接下来我配了一个插件,叫 Code Video,是一个开源工具(开源项目)。
如果你的电脑配置够高(比如能跑《黑神话:悟空》那种级别),可以把这些服务直接接到本地,用自己的电脑生成视频,就不需要买付费软件。纯开源技术也能做。
我把它封装成一个插件,通过 API 形式调用;你要写 Python 接口来调也可以。
生成视频需要时间,所以我加了一段代码让它等 45 秒,等生成完成后,再配一个插件把视频取回来返回。
第四步:按章节生成配图(Stable Diffusion)
每个章节还要配图的话,我会再配一个大模型:让它根据刚才写的大纲内容,把每个章节的主题写出来,并生成每个章节配图的提示词。
然后用 Stable Diffusion 画图。Stable Diffusion 是开源的 AI 画图软件,也可以装在自己电脑上,而且自带 API 方便调用。
我这里调用四个小插件,分别跑四个 Stable Diffusion 程序,把四个章节的图都画出来。
最后汇总输出(表格/飞书/本地都行)
最后把各个分支的输出接口汇总起来。你想写到表格里,比如写到 Excel 里也可以;这些不用你自己配插件,很多都是现成工具,写飞书、写本地都行。
最后你看,下面这个表格就能自动生成出来。
实战演示:传一个视频链接,跑完整套流程
我们最后演示一遍它怎么跑。
日常运营里我随便找一个例子,比如对标一个“哈尔滨旅游攻略”的视频:小土豆来了之后怎么旅游好。我传进一个视频链接,执行一下,看结果。
运行过程中,每个节点有的已经运行好,有的还在运行,我们一个个打开看。
1)抓文案
第一步先抓视频文案信息。传进来的就是视频链接,然后它把所有视频文案信息都抓取到了,文字信息全有。
而且以后你还能让它定时定点抓:比如每天早上 9 点帮我抓同行文案信息。
2)写标题和大纲
第二步写标题:根据人家文案生成标题和行程结构,比如“哈尔滨旅游攻略,不看后悔”,再分第一天、第二天、第三天、第四天做什么。
这里边最大的特点是:智能体怎么写标题、怎么写大纲,完全按我设计的风格来。
3)写正文内容
写完标题之后,接下来就是写具体内容。这个节点执行中会稍微等一下,等它跑完就能看到结果。
它会根据你前面生成的标题/大纲,把第一章讲什么、第二章讲什么都写出来。比如我在设计时要求加 Emo 小表情符号,它也会按这个规则加进去。
4)生成每章配图提示词 + 出图
同时我让它根据这些标题生成每个章节要做什么配图,把每章配图的提示词都做好。
然后走四个插件,分别把四个章节的配图画出来,这是画图分支。
5)生成小视频
文案内容有了之后,再做一个小视频。
我这块写好了规则,比如运镜、每个镜头做什么。智能体会根据上面的内容,生成视频提示词,传给 Code Video 去生成。
如果你不跑这个开源项目,也可以用调用 API 的方式,比如用智谱清言这类平台的 API 也可以。
6)查看输出结果
最后结果里会有:
- C1、C2、C3、C4:每个章节对应生成的一张配图
- output:全部文案内容
- video:生成的视频
视频里就是根据“哈尔滨攻略”生成的相关画面,比如哈尔滨小吃、中央大街附近的感觉。这块我只是生成了一个小片段;如果你想生成多个片段,也可以,像做图一样把视频拆成多个片段随你配。
配图这边也是一样:第一章、第二章、第三章、第四章对应的图都能画出来。
这套做法的最大好处
以前你可能要用不同的软件、不同的工具分别做这些东西;现在可以把全部环节整合到一个流程里。
最大的好处就是全流程自动化:我只要传个视频链接,接下来标题、大纲、正文、配图、视频、表格汇总,全都自动帮我完成。你再想把它写进 Excel 里,也完全可以。