全流程演示如何用智能体(Agent)打造你的自媒体工作素材库

视频详细演示了利用AI智能体构建自媒体自动化工作流的全过程，涵盖素材抓取、文案生成、视频合成及AI绘图等环节。

UP主: 迪哥有点愁 · 时长: 7:58 · 🔗 B站原视频

发布: 2024-10-28 · 收录: 2025-02-13

标签: AI智能体 · 自动化工作流 · 自媒体创作 · 大模型应用 · Stable Diffusion

这套智能体要做什么

全流程演示一下怎么用智能体构建自媒体素材库。别人卖你成千上万的软件，我们自己照样能做出来。

我们的智能体主要做一件事：你给它一个对标同行的链接（比如要模仿谁），标题它来写，大纲它来写，内容也它来写。不光写文案，还包括每个章节配什么图、配什么视频文案，全部一条龙自动化做好。

我的输入只需要传进来一个视频链接，或者对标同行的主页信息就可以。

全流程怎么搭起来（都能用开源替代）

这件事我会按步骤捋一遍，而且其中每个环节都可以用开源插件和工具来替代。

第一步：抓取短视频文案信息

我先配一个插件，让它自动抓短视频信息。

运行的时候，我只需要传一个抖音分享链接就行。无论你是讲电视剧的、讲电影的、剪视频的、讲小说的，还是发种草文案的，随便传个视频链接就可以，这是第一步。

第二步：用大模型生成标题、大纲和正文

我配了两个大模型：

第一个大模型：写文案标题和章节大纲。也就是先生成大纲，再根据大纲写内容。
第二个大模型：根据这个大纲，完成正文写作。

这里大家注意：配合大模型时，我要自己设计好怎么“解大纲”、怎么写标题、怎么写内容。每一步都可以结合你的业务场景、工作经验，把你对业务的理解加进去。

这也是它跟你平时用工具软件最大的区别：每个环节我都可以自己打造、自己控风格。

第三步：生成视频（提示词 + 开源视频生成）

你可能会问，视频怎么生成？

在任务里我又配了一个大模型，专门用来构建“生成视频”的提示词：视频生成时要传什么提示词、按什么方式写，这块是我自己写的规则。

接下来我配了一个插件，叫 Code Video，是一个开源工具（开源项目）。

如果你的电脑配置够高（比如能跑《黑神话：悟空》那种级别），可以把这些服务直接接到本地，用自己的电脑生成视频，就不需要买付费软件。纯开源技术也能做。

我把它封装成一个插件，通过 API 形式调用；你要写 Python 接口来调也可以。

生成视频需要时间，所以我加了一段代码让它等 45 秒，等生成完成后，再配一个插件把视频取回来返回。

第四步：按章节生成配图（Stable Diffusion）

每个章节还要配图的话，我会再配一个大模型：让它根据刚才写的大纲内容，把每个章节的主题写出来，并生成每个章节配图的提示词。

然后用 Stable Diffusion 画图。Stable Diffusion 是开源的 AI 画图软件，也可以装在自己电脑上，而且自带 API 方便调用。

我这里调用四个小插件，分别跑四个 Stable Diffusion 程序，把四个章节的图都画出来。

最后汇总输出（表格/飞书/本地都行）

最后把各个分支的输出接口汇总起来。你想写到表格里，比如写到 Excel 里也可以；这些不用你自己配插件，很多都是现成工具，写飞书、写本地都行。

最后你看，下面这个表格就能自动生成出来。

实战演示：传一个视频链接，跑完整套流程

我们最后演示一遍它怎么跑。

日常运营里我随便找一个例子，比如对标一个“哈尔滨旅游攻略”的视频：小土豆来了之后怎么旅游好。我传进一个视频链接，执行一下，看结果。

运行过程中，每个节点有的已经运行好，有的还在运行，我们一个个打开看。

1）抓文案

第一步先抓视频文案信息。传进来的就是视频链接，然后它把所有视频文案信息都抓取到了，文字信息全有。

而且以后你还能让它定时定点抓：比如每天早上 9 点帮我抓同行文案信息。

2）写标题和大纲

第二步写标题：根据人家文案生成标题和行程结构，比如“哈尔滨旅游攻略，不看后悔”，再分第一天、第二天、第三天、第四天做什么。

这里边最大的特点是：智能体怎么写标题、怎么写大纲，完全按我设计的风格来。

3）写正文内容

写完标题之后，接下来就是写具体内容。这个节点执行中会稍微等一下，等它跑完就能看到结果。

它会根据你前面生成的标题/大纲，把第一章讲什么、第二章讲什么都写出来。比如我在设计时要求加 Emo 小表情符号，它也会按这个规则加进去。

4）生成每章配图提示词 + 出图

同时我让它根据这些标题生成每个章节要做什么配图，把每章配图的提示词都做好。

然后走四个插件，分别把四个章节的配图画出来，这是画图分支。

5）生成小视频

文案内容有了之后，再做一个小视频。

我这块写好了规则，比如运镜、每个镜头做什么。智能体会根据上面的内容，生成视频提示词，传给 Code Video 去生成。

如果你不跑这个开源项目，也可以用调用 API 的方式，比如用智谱清言这类平台的 API 也可以。

6）查看输出结果

最后结果里会有：

C1、C2、C3、C4：每个章节对应生成的一张配图
output：全部文案内容
video：生成的视频

视频里就是根据“哈尔滨攻略”生成的相关画面，比如哈尔滨小吃、中央大街附近的感觉。这块我只是生成了一个小片段；如果你想生成多个片段，也可以，像做图一样把视频拆成多个片段随你配。

配图这边也是一样：第一章、第二章、第三章、第四章对应的图都能画出来。

这套做法的最大好处

以前你可能要用不同的软件、不同的工具分别做这些东西；现在可以把全部环节整合到一个流程里。

最大的好处就是全流程自动化：我只要传个视频链接，接下来标题、大纲、正文、配图、视频、表格汇总，全都自动帮我完成。你再想把它写进 Excel 里，也完全可以。

全流程演示如何用智能体(Agent)打造你的自媒体工作素材库

On this page