DeepClaude:使用DeepSeek r1的规划plan能力结合claude sonnet的代码执行act能力,组成史上最强的AI程序员
介绍如何结合 DeepSeek R1 的推理规划与 Claude Sonnet 的代码执行能力,构建高效 AI 程序员助手并讲解其配置与原理。
UP主: AIGCLINK · 时长: 16:48 · 🔗 B站原视频
发布: 2025-02-11 · 收录: 2025-02-13
标签: DeepSeek · Claude · AI编程 · DeepClaude · 大模型应用
各行业应用案例与引入
大家好,这里是 AI GC Link。我们今天来看一个项目叫 DeepClaude。
我们都知道近期 DeepSeek 有一个很重要的能力,就是深度思考能力。如何用深度思考来促进业务应用,也是现在所有行业都在探讨或寻找的方向。
目前它在搜索领域已经用在 OpenAI 发布的 Deep Search 里面,表现出了比传统 AI 1.0 搜索更强的能力。今天要介绍的是它的深度思考能力在编程领域发挥出的更强作用,这是以往非推理模型没有覆盖到的地方。
DeepClaude 的核心思路:Plan + Act
DeepClaude 的思路是:用 DeepSeek R1 的规划能力(Plan)来做规划,再结合 Claude Sonnet 的代码执行能力(Act)来完成实现,组成一个“史上最强的 AI 程序员”。
也就是让 DeepSeek 来做规划,让 Claude Sonnet 来写代码,而且成本也下降了非常多。最后也会介绍在 client 里结合 R1 和 Claude,怎么玩。
项目目标与测评表现
DeepClaude 这个项目很有意思,它做的事情就是把 DeepSeek 和 Claude 结合起来,实现两个目标:
- 写代码效果更好:你扔给它一个任务后,它给你的结果会比你直接用单一的 DeepSeek,或者单独用 Sonnet 写出来更好。
- 在国际 SOTA 的标准测评数据集上,表现比 O1、R1 Sonnet、还有 DeepSeek V3 单独使用都要好,这个已经得到了验证。
执行原理:客户端请求 → R1 推理 → Sonnet 执行
我简单说一下它的原理:
由客户端发送请求,这个请求首先给 DeepSeek,DeepSeek 返回推理结果。拿到推理结果之后,把推理的思考过程(得到方案的过程)扔给 Claude,然后由 Claude 返回对应的响应。
它有两种方式:
- 流式:上面是流式的响应方式。
- 非流式:下面是非流式的方式。非流式就是先发送推理请求,返回推理结果,再发送给 Claude 请求,最后返回完整响应。
整体流程就是:把 DeepSeek 的推理深度思考结果交给 Claude 做执行。
示例效果:设计一个 AI 音乐生成应用
比如我让它帮我设计一个 AI 音乐生成应用。因为生成过程中响应速度有点慢,我在它响应的时候顺便说一下官方使用要做哪些配置:
- 需要 DeepSeek 官方的 API Key:到官方去拿对应的 API Key,复制到配置里。
- Claude API Key 也是官方的。
- 还有系统提示词、以及下载相关配置,下面会有简单描述。
生成出来一般有两个部分:
- 第一部分会先出现一个 thinking 过程:它会先弄清楚需求,考虑核心功能、检索部分、排序、呈现、技术架构、增强功能、部署、应用场景等。
- 然后把 DeepSeek 的 thinking 扔给 Claude,由 Claude 针对每个部分执行:比如系统架构、技术路线、核心功能模块等,按步骤把一整个项目的框架写得很完整。
整体看起来就是你做项目的第一步、第二步、第三步它都给你写好了。我觉得这是一个非常好用的应用。
不过我这边可能网络问题,每次请求反应都特别慢,像刚才那个响应了很长时间才有反应。
本地化部署:拉代码、安装依赖、配置环境变量
本地化使用流程是这样的:
- 先把代码下载下来。
- 然后用
uv sync之类的命令安装依赖(我已经装过了,很快)。 - 激活虚拟环境:Mac 用一套命令,Windows 用另一套命令。
- 把环境变量文件(
.env)复制一份并配置。
这里有几个配置关键点:
ALLOWED_API_KEY:可以自己随便配。它相当于你创建了一个 API 请求服务,未来如果有客户端要请求你这个服务,就要把这个配置给客户端。- 允许哪些域名访问。
- DeepSeek 的官方 API 配置:可以用官方的,也可以用 Groq、CD、Ollama 之类的。
- Claude:可以用官方的,也可以用 OpenRouter。
- 如果用 OpenRouter,需要把
PROVIDER换成oneapi,底下的配置也要对应调整。
- 如果用 OpenRouter,需要把
配置完之后就可以执行启动服务。启动后服务会托管到 8000 端口上。
注意:这是一套 API 服务,并不是直接就能聊天的。
连接第三方客户端:NextChat / Chatbox 等
如果要聊天,你需要一个客户端。可以自己构建聊天服务,也可以下载现成客户端,比如 NextChat、Chatbox 等。
下载后在设置里添加自定义配置:
- 名称自己填
base_url换成你的服务地址- API 路径不动
- API 密钥填写你刚才配置的
ALLOWED_API_KEY - 模型名称随便写,没什么限制
- 其他参数比如上下文消息量、严谨程度、top_p 等按需设置
保存后就可以聊天了。
你也可以把它封装成其他服务,或者用 Docker 去部署。这就是本地化部署的过程。
方法论:一个负责思考,一个负责执行
我觉得这个思路非常好:用 DeepSeek 的深度思考和规划能力,再用 Claude 的代码执行能力。
这会为未来提供一个思路:在很多细分领域,都可以把 DeepSeek R1 这种深度思考/推理能力用起来,然后在执行部分用另一个模型去做执行,比如垂直模型或小模型。
未来可能形成一种分工:DeepSeek 专门负责思考,像战略思考家一样;Claude 或垂直小模型负责执行。一个思考,一个执行,两者结合就是很好的组合。
Claude Code / Client 的 Plan 与 Act:更直接的编程工作流
还有一个我认为非常好的结合方式,对很多程序员写代码很有用:client 也做了更新。
下面你会看到有 plan 和 act。
比如在 play 模式下,我让它帮我设计一个 AI 音乐生成应用。它会先用 plan 调用 DeepSeek R1 做规划,你会看到 thinking 过程:收集信息、技术选择、现有 MCP 工具、查看已连接的 MCP 服务、架构设计、依赖和部署、环境变量、以及需求不明确的点会列出来让你确认。
思考完成后,它会给出一个规划:技术栈建议、关键功能模块等都规划出来。
接着我们切到 act 模式,让 Claude 去执行,这是最简单、最实用的一种方式。它会先确认一些细节,比如是否需要用户身份系统、音乐存储、前端复杂度等,并建议先实现最小版本。你确认“同意”之后,它就会开始自动执行,请求 Claude,然后开始写代码。
整体体验就是:上面让模型负责思考和规划,下面让 Claude 负责执行。这其实就是 DeepClaude 的思路,在编程场景里非常直接可用。
近期 AI 工具与项目快讯
最后过一下最近两天的新东西:
- 小红书开了一个 ASR 的东西,擅长识别中英文、方言、歌词,在普通话标准上达到了很高水平。
- 港大和字节的广告生成:生成广告视频,也可以用于数字人,能生成 20 秒以上。代码还没完全对外,论文已经出来了。
- Cursor 的增强工具:相当于给 Cursor 配了一个技能增强包,不光写代码,还会查资料等,集成了 Perplexity、Gemini 2.0 等,增强搜索理解、网页操作等能力。不过这些能力在 client 里之前基本也都有。
- 构建 RAG 的 AI 聊天工具 React 插件:在 Next.js 应用中快速添加智能聊天助手。比如你有刚才那个 API,用它就能快速构建聊天,不需要第三方客户端。
- 医疗应用:帮助医生分析 X 光的 AI 助手 MADRex,可以推理思考、回答复杂问题。
- 腾讯的音频驱动肖像工具:给图片和音频生成视频。
- 基于 RAG 的智能对话系统 Web UI:构建自有知识库的智能问答系统。
- 高保真实时语音翻译模型:保留原声特点进行实时翻译,用于同声传译。
- 理解超长视频的 RAG 框架:之前讲过。
希望对大家有帮助和启发。如果您觉得不错,请帮我们一键三连,谢谢。