Bili-Docs
技术工具AI 应用

三个技巧,把微软Copilot智商提升200%。AI进化论-花生

视频分享了优化微软Copilot使用体验的三个技巧,通过提示词调教使其摆脱低质量搜索依赖,提升逻辑与创作能力。

UP主: AI进化论-花生 · 时长: 14:08 · 🔗 B站原视频

发布: 2023-12-12 · 收录: 2024-03-31

标签: Copilot · AI工具 · 提示词工程 · GPT-4

Copilot 改名后火了,但实际体验很拉胯

最近一段时间,微软把 Bing in the chat 改成 Copilot 之后又实实在在地火了一把。很多博主都在推荐,毕竟微软打出了“免费 GPT-4”这样的噱头。

其实我也推荐过,但当你真正用了 Copilot 之后,你会觉得它简直像个智障。大家对它的评价也没有冤枉它:它在对话的时候实在是太依赖直接搜索提供的答案,尤其是中文对话时,它提供的几乎全都是知乎的回答,仅仅相当于一个搜索完之后帮你做总结的机器人,比 GPT-4 差太多了,常常也比 GPT-3.5 还弱。

但这两天我好好研究了一番 Copilot 之后,我发现它还是属于可用的。经过我一番调教,它完全能够比 GPT-3.5 更强,可以作为 GPT 使用次数超限的替代。

我目前对于 GPT-4、Google Bard、微软 Copilot、GPT-3.5 的排序是这样的。微软 Copilot 相比 Bard 的主要优势是可以直接进行中文对话,并且能够生成图片;相比 GPT-3.5 的优势是可以识别图片、生成图片,以及联网搜索新的互联网内容。

用同一个写作任务对比:GPT-3.5、GPT-4、Copilot

接下来我会给你实际展示一下,把 Copilot 的智商提升 200% 的技巧。

我们先来尝试一个比较简单常见的文本生成任务:让 AI 帮我们写一个讣告,因为最近查理·芒格去世了。我先让 GPT-3.5 和 GPT-4 都写了一下。

GPT-3.5 写的还不错。我给了提示词之后它就直接帮我写了。虽然肯定不到 5000 字,因为 AI 模型现在对字数的计算以及生成长内容都有问题,但结构清晰之后,我们是随时可以让 GPT 去扩写某个模块,然后逐渐把不同模块拼接成需要的字数。

再看 GPT-4,你会发现它和 GPT-3.5 有个不一样:在文章最开始,它会先描述一下给它的任务,以及它接下来要怎么帮你完成任务。这是 GPT-4 和 GPT-3.5 的差异之一,可以记住这个差异,后面会用到。至于底下内容,我目前没看出特别明显的差异,但如果让 GPT-4 继续扩写,我相信质量会更上一层楼。

接着看 Copilot 正常情况下的表现:前面开始写得还比较正常,但会出现一些简体中文夹杂繁体中文,这跟它搜索到的语料有关系。到后面它就完全变傻了,不断重复“你将永远被我们怀念”之类的内容,进入非常愚蠢的循环。

它的写作内容也跟我们平时正常使用 Copilot 的感受一样:几乎全都是知乎内容的总结,并且越写越差。这种表现既不像 GPT-4,也不像 GPT-3.5。

我认为微软 Copilot 在某些情况下是有用 GPT-4 的,但总的来说它是一个拼凑过的模型。我们不知道它在特定场景下到底会怎么组合,所以一旦生成长内容、同时又搜索了一些语料,质量可能会越来越差。

技巧一:用指令锁死搜索,让它像 GPT 一样直接写

如果我们想提升 Copilot 的能力,有两点很关键:

  1. 尽量使用它能力比较强的那个模型时刻。
  2. 很多任务里我们不希望它进行搜索,希望它直接像 GPT 一样给答案。

这里就是我调整过的提示词:在同样任务下面,我加了一段类似“系统指令”的说明,你也可以把它当作 Prompt。核心要求是:不要搜索、不要引用网页资料,直接回答用户问题;回答要结构清晰、层次分明、专业完整且详尽。

结果你会发现它生成的内容跟之前完全不一样,非常像 GPT-3.5。也就是说,把搜索锁了以后,它已经很像一个 3.5 的表现了。

但接下来我让它继续扩写“职业生涯”部分,刚开始写得也不错:律师经历、商业热情、投资天赋这些都有。不过写着写着还是出现重复,最后又进入“查理芒格是一个伟大的投资者、伟大的领导者”这种越来越傻的状态。

所以,这个提示词确实解决了一个问题:减少引用知乎资料,让开头输出更像 GPT。但当内容变长时,它仍可能变差。

技巧二:选“创造力模式”,更像 GPT-4 的输出

Copilot 有三种对话模式:创造力模式、平衡模式、精准模式。

在创造力模式下,它会先说“你好,这是 Bing……很抱歉听到这个消息”,先理解任务信息,再告诉你它要怎么完成任务。你有没有回想起前面 GPT-4 和 GPT-3.5 的差别?它不是立刻给文章,而是先解读任务,这其实更像 GPT-4 的表现。

从现在看到的情况,可以认为 Copilot 在创造力模式下更有可能使用 GPT-4 的模型。

再看它后面写的内容:先整体介绍芒格的情况,结构也清晰。里面有个信息是错的,比如说他不是 12 月 9 号去世的,但这个错误可以理解,因为我们要求它不要搜索。

继续写的时候,它开始写投资兴趣、律师生涯、投资生涯、加入巴菲特公司、与巴菲特合作等内容,总体没有出现刚才那种越写越长就开始疯狂重复的情况。

综合来说,我觉得在创造力模式下,Copilot 很大程度上用的是 GPT-4 模型;并且如果我们完全限制掉它使用搜索的能力,得到的结果跟 GPT-4 非常接近,能力相当不错。

到这里我们已经有两个技巧:

  1. 用指令词限制搜索。
  2. 新主题开始时,优先选“创造力模式”,会得到更好的回答。

技巧三:需要联网时,用“精准模式”或让它用英文关键词搜

有些情况下我们还是希望 Copilot 联网找信息,因为这才是它比 GPT-3.5 最大的优势。

我让它完成一个需要联网的任务:问它 Google 的 AI 模型 Gemini 怎么样,现在怎么才能用到。

在平衡模式下,它给的信息很不对。它很蠢的一点是:我们问什么问题,它就直接去搜索我们的整句问题,甚至没有提取关键词去搜,所以结果非常糟糕,信息也不够新,还能搜到一些过时内容。这也是大多数人平时看到的 Copilot 状态:50 分的智商,真的很差。

再看精准模式:同样的问题,它搜索的是“谷歌 AI 模型”这种更准确的关键词,结果就还不错,基础信息基本是对的。只是信息不够结构化,但整体已经比平衡模式强很多。它提到 Gemini 分为三个不同模型、多模态训练、会用在 Bard 和 Pixel 8 上等内容。

然后看创造力模式:它也会先打招呼,很像 GPT-4。回答内容层次更清楚,比如分三个版本、亮点是什么、怎么使用等。创造力模式下,它的搜索表现已经不错了。

但还有一个技巧可以让它更好:我做了提示词优化。Copilot 很多时候表现差,是因为它搜索的是中文语料,总是知乎那些文章。所以我要求它:

  • 作为英文搜索领域的专家
  • 先理解用户问题,再思考最可能有用的搜索词
  • 搜索完获取完备信息后,再组织并翻译成中文提交

在这种情况下,它确实会用英文搜索词进行搜索,并且把问题拆成两块:Gemini 怎么样,以及怎么用到。最后引用的资料也基本都是英文语料,输出更清晰、更结构化:先讲 Gemini 是什么模型,有什么使用场景;再讲要用的话有哪些使用方式。

经过这种“搜索词加工”,效果就好很多。

结尾:Copilot 适合当 GPT-3.5 的增强替代

如果你还没有购买 ChatGPT Plus 会员,GPT-3.5 没法完全满足你的需要,比如你需要联网、需要生成图片、需要识别图片,我建议你可以试试 Copilot。

我会把这几个技巧以及对应的提示词放到简介和评论区,欢迎取用。今天先到这,拜拜。

On this page