Bili-Docs
技术工具AI 应用

DeepClaude:使用DeepSeek r1的规划plan能力结合claude sonnet的代码执行act能力,组成史上最强的AI程序员

介绍如何结合 DeepSeek R1 的推理规划与 Claude Sonnet 的代码执行能力,构建高效 AI 程序员助手并讲解其配置与原理。

UP主: AIGCLINK · 时长: 16:48 · 🔗 B站原视频

发布: 2025-02-11 · 收录: 2025-02-13

标签: DeepSeek · Claude · AI编程 · DeepClaude · 大模型应用

各行业应用案例与引入

大家好,这里是 AI GC Link。我们今天来看一个项目叫 DeepClaude。

我们都知道近期 DeepSeek 有一个很重要的能力,就是深度思考能力。如何用深度思考来促进业务应用,也是现在所有行业都在探讨或寻找的方向。

目前它在搜索领域已经用在 OpenAI 发布的 Deep Search 里面,表现出了比传统 AI 1.0 搜索更强的能力。今天要介绍的是它的深度思考能力在编程领域发挥出的更强作用,这是以往非推理模型没有覆盖到的地方。

DeepClaude 的核心思路:Plan + Act

DeepClaude 的思路是:用 DeepSeek R1 的规划能力(Plan)来做规划,再结合 Claude Sonnet 的代码执行能力(Act)来完成实现,组成一个“史上最强的 AI 程序员”。

也就是让 DeepSeek 来做规划,让 Claude Sonnet 来写代码,而且成本也下降了非常多。最后也会介绍在 client 里结合 R1 和 Claude,怎么玩。

项目目标与测评表现

DeepClaude 这个项目很有意思,它做的事情就是把 DeepSeek 和 Claude 结合起来,实现两个目标:

  1. 写代码效果更好:你扔给它一个任务后,它给你的结果会比你直接用单一的 DeepSeek,或者单独用 Sonnet 写出来更好。
  2. 在国际 SOTA 的标准测评数据集上,表现比 O1、R1 Sonnet、还有 DeepSeek V3 单独使用都要好,这个已经得到了验证。

执行原理:客户端请求 → R1 推理 → Sonnet 执行

我简单说一下它的原理:

由客户端发送请求,这个请求首先给 DeepSeek,DeepSeek 返回推理结果。拿到推理结果之后,把推理的思考过程(得到方案的过程)扔给 Claude,然后由 Claude 返回对应的响应。

它有两种方式:

  • 流式:上面是流式的响应方式。
  • 非流式:下面是非流式的方式。非流式就是先发送推理请求,返回推理结果,再发送给 Claude 请求,最后返回完整响应。

整体流程就是:把 DeepSeek 的推理深度思考结果交给 Claude 做执行。

示例效果:设计一个 AI 音乐生成应用

比如我让它帮我设计一个 AI 音乐生成应用。因为生成过程中响应速度有点慢,我在它响应的时候顺便说一下官方使用要做哪些配置:

  1. 需要 DeepSeek 官方的 API Key:到官方去拿对应的 API Key,复制到配置里。
  2. Claude API Key 也是官方的。
  3. 还有系统提示词、以及下载相关配置,下面会有简单描述。

生成出来一般有两个部分:

  • 第一部分会先出现一个 thinking 过程:它会先弄清楚需求,考虑核心功能、检索部分、排序、呈现、技术架构、增强功能、部署、应用场景等。
  • 然后把 DeepSeek 的 thinking 扔给 Claude,由 Claude 针对每个部分执行:比如系统架构、技术路线、核心功能模块等,按步骤把一整个项目的框架写得很完整。

整体看起来就是你做项目的第一步、第二步、第三步它都给你写好了。我觉得这是一个非常好用的应用。

不过我这边可能网络问题,每次请求反应都特别慢,像刚才那个响应了很长时间才有反应。

本地化部署:拉代码、安装依赖、配置环境变量

本地化使用流程是这样的:

  1. 先把代码下载下来。
  2. 然后用 uv sync 之类的命令安装依赖(我已经装过了,很快)。
  3. 激活虚拟环境:Mac 用一套命令,Windows 用另一套命令。
  4. 把环境变量文件(.env)复制一份并配置。

这里有几个配置关键点:

  • ALLOWED_API_KEY:可以自己随便配。它相当于你创建了一个 API 请求服务,未来如果有客户端要请求你这个服务,就要把这个配置给客户端。
  • 允许哪些域名访问。
  • DeepSeek 的官方 API 配置:可以用官方的,也可以用 Groq、CD、Ollama 之类的。
  • Claude:可以用官方的,也可以用 OpenRouter。
    • 如果用 OpenRouter,需要把 PROVIDER 换成 oneapi,底下的配置也要对应调整。

配置完之后就可以执行启动服务。启动后服务会托管到 8000 端口上。

注意:这是一套 API 服务,并不是直接就能聊天的。

连接第三方客户端:NextChat / Chatbox 等

如果要聊天,你需要一个客户端。可以自己构建聊天服务,也可以下载现成客户端,比如 NextChat、Chatbox 等。

下载后在设置里添加自定义配置:

  • 名称自己填
  • base_url 换成你的服务地址
  • API 路径不动
  • API 密钥填写你刚才配置的 ALLOWED_API_KEY
  • 模型名称随便写,没什么限制
  • 其他参数比如上下文消息量、严谨程度、top_p 等按需设置

保存后就可以聊天了。

你也可以把它封装成其他服务,或者用 Docker 去部署。这就是本地化部署的过程。

方法论:一个负责思考,一个负责执行

我觉得这个思路非常好:用 DeepSeek 的深度思考和规划能力,再用 Claude 的代码执行能力。

这会为未来提供一个思路:在很多细分领域,都可以把 DeepSeek R1 这种深度思考/推理能力用起来,然后在执行部分用另一个模型去做执行,比如垂直模型或小模型。

未来可能形成一种分工:DeepSeek 专门负责思考,像战略思考家一样;Claude 或垂直小模型负责执行。一个思考,一个执行,两者结合就是很好的组合。

Claude Code / Client 的 Plan 与 Act:更直接的编程工作流

还有一个我认为非常好的结合方式,对很多程序员写代码很有用:client 也做了更新。

下面你会看到有 planact

比如在 play 模式下,我让它帮我设计一个 AI 音乐生成应用。它会先用 plan 调用 DeepSeek R1 做规划,你会看到 thinking 过程:收集信息、技术选择、现有 MCP 工具、查看已连接的 MCP 服务、架构设计、依赖和部署、环境变量、以及需求不明确的点会列出来让你确认。

思考完成后,它会给出一个规划:技术栈建议、关键功能模块等都规划出来。

接着我们切到 act 模式,让 Claude 去执行,这是最简单、最实用的一种方式。它会先确认一些细节,比如是否需要用户身份系统、音乐存储、前端复杂度等,并建议先实现最小版本。你确认“同意”之后,它就会开始自动执行,请求 Claude,然后开始写代码。

整体体验就是:上面让模型负责思考和规划,下面让 Claude 负责执行。这其实就是 DeepClaude 的思路,在编程场景里非常直接可用。

近期 AI 工具与项目快讯

最后过一下最近两天的新东西:

  • 小红书开了一个 ASR 的东西,擅长识别中英文、方言、歌词,在普通话标准上达到了很高水平。
  • 港大和字节的广告生成:生成广告视频,也可以用于数字人,能生成 20 秒以上。代码还没完全对外,论文已经出来了。
  • Cursor 的增强工具:相当于给 Cursor 配了一个技能增强包,不光写代码,还会查资料等,集成了 Perplexity、Gemini 2.0 等,增强搜索理解、网页操作等能力。不过这些能力在 client 里之前基本也都有。
  • 构建 RAG 的 AI 聊天工具 React 插件:在 Next.js 应用中快速添加智能聊天助手。比如你有刚才那个 API,用它就能快速构建聊天,不需要第三方客户端。
  • 医疗应用:帮助医生分析 X 光的 AI 助手 MADRex,可以推理思考、回答复杂问题。
  • 腾讯的音频驱动肖像工具:给图片和音频生成视频。
  • 基于 RAG 的智能对话系统 Web UI:构建自有知识库的智能问答系统。
  • 高保真实时语音翻译模型:保留原声特点进行实时翻译,用于同声传译。
  • 理解超长视频的 RAG 框架:之前讲过。

希望对大家有帮助和启发。如果您觉得不错,请帮我们一键三连,谢谢。

On this page