DeepSeek缝合Claude，比单用R1/o1效果都好！GitHub揽星3k

今天小编(賁芳蕤)要和大家分享的是DeepSeek缝合Claude，比单用R1/o1效果都好！GitHub揽星3k,欢迎阅读~

让DeepSeek 代替 Claude 思考，缝合怪玩法火了。

原因无它：比单独使用 DeepSeek R1、Claude Sonnet 3.5、OpenAI o1 模型的效果更好。

先来看一段 VCR：

再来看一个测评结果：

在代码编辑基准Polyglot Benchmark 上，缝合模型效果小超 o1-high 和 R1 一头。

在这个测试中，R1 扮演架构师，描述如何解决代码问题。

而Claude 扮演程式员，按要求生成特定的代码编辑指令，以便把改动应用到源檔案中。

除此之外，实验过程中还得出还有几个有意思的结论：

o1 与 Claude Sonnet 搭配效果并不如单独使用 o1。

使用 R1 或 o1 当架构师，Claude 之外的其他模型当程式员，效果都不如单独使用 R1 或 o1。

但o1-preview 和 o1-mini 当架构师，使用很多不同的模型当程式员都能提高组合的成绩。

使用 R1 的推理过程 token 效果不如使用 R1 的最终输出 token。

这样看来，R1 和 Claude Sonnet 还真是一对绝配啊～

DeepClaude 应用本身 100% 免费且开源，在 GitHub 上已揽获 3k 星星（当然 API 要用自己的）。

网友测试后总结到：Claude 擅长撰写清晰、结构良好的文本和代码，因此它能将 DeepSeek-R1 的想法转化为精炼的回复。

DeepClaude 作者之一对此有感而发：

AI 智能体和智能体应用正在展示出一种 " 数字世界优先 " 的范式转变，智能系统正在成为主动的合作者，而不仅仅是被动的工具。

DeepSeek 和 Claude 的混血儿

具体来说，DeepClaude 是一个 LLM 推理 API，通过 Rust 编写。

它提供了一个统一的接口，将 DeepSeek R1 的 CoT 逻辑推理能力和 Claude 的回复在单一流中无缝衔接。

开发者可以通过这个 API 同时调用两种模型的功能，还能完全掌控自己的 API 密钥和数据。

打造它的团队名为Asterisk，团队成员具有安全研究 &CTF（Capture The Flag）背景，致力于利用 AI 让检查代码安全这事儿变得更加高效。

团队认为，DeepSeek R1 的 CoT 深度推理甚至达到了 LLM 具有反省认知（metacognition）的程度，它能够自我纠正、思考不常见 / 极端 / 特殊的情况，并在自然语言中进行类似蒙特卡洛树搜索（MCTS）的推理。

不过 R1 在代码生成、创造力和对话技巧方面有所欠缺，Claude 3.5 Sonnet 在这些方面表现出色，刚好可以作补充。

何不将两者结合起来？取两者之长，打造出 DeepClaude～

对话中，Claude 回应之前，系统会显示 "<thinging>" 这样的预填充文本。

DeepClaude 结合了这两种模型，具有以下特性：

托管 API 完全免费，允许用户使用自己的密钥，并将 DeepSeek 和 Claude 的流式 API 整合在一起，提供计算组合使用量和价格等便利功能。

代码是开源的，用户可以自由托管、修改和重新分发。团队表示它已经在 Asterisk 的生产环境中大规模使用，每天处理数百万 token，至今尚未出现故障，只要不滥用就行。

One More Thing

你以为两个模型缝合就是极限了吗？

No no no

还有网友开发出了三缝合玩法，将 DeepSeek-R1 和 Gemini 2.0 Flash 的思考结果组合起来，在让 Claude Sonnet 去回答问题。

在 GPQA 测试（谷歌搜不到的理化生博士级选择题）中也取得了好成绩。

Github 地址：https://github.com/getasterisk/deepclaude

参考链接：

[ 1 ] https://aider.chat/2025/01/24/r1-sonnet.html

[ 2 ] https://x.com/deepclaude_/status/1886911416478642279

[ 3 ] https://x.com/omercelik/status/1883510797193937278

[ 4 ] https://x.com/mufeedvh/status/1883620781583901011

关于DeepSeek缝合Claude，比单用R1/o1效果都好！GitHub揽星3k就分享完了，您有什么想法可以联系小编(賁芳蕤)。