高马尔
一个信息发布的网站

Claude 4被曝发布在即!DeepSeek把大招都给逼出来了

今天小编(嬴覓晴)要和大家分享的是Claude 4被曝发布在即!DeepSeek把大招都给逼出来了,欢迎阅读~

终于!终于!Claude 4 被曝将在未来几周内发布

高亮重点,最新的它采取了一个与之前模型路线不同的办法:

是个混合型大模型。

简单来说,就是既带有推理能力,会使用更多的算力来思考和解决难题;在面对简单问题的时候,又能像传统大模型一样短平快地轻巧处理,无需多费不必要的功夫。

怎么样,听起来是不是和昨天奥特曼透露的 GPT-5 非常类似(doge)。

都是不再把传统通用模型和推理模型分开推出,直接融合在一起。

据透露,Anthropic 计划在未来几周内发布该模型。

而翻遍互联网发现,4 天前就有人按捺不住,在推特上剧透过:

Anthropic 内部员工告诉我,他们将在本周内发布 Claude 4,以及一个推理模型。

至于性能嘛,超过满血 o3!

俗话说得好:传言有出入,期待需谨慎。

但还是禁不住狠狠期待一下!

下面一起来看更详细的剧透——

Claude 4 不走老路,可控制使用时的推理成本

如前所述,Claude 4 与此前的通用大模型不同。

把通用模型和推理模型融合到一起去了,会根据具体任务,调整所需算力和所需功能

遇到复杂的问题,就启用推理能力;遇到简单的问题,就用通用模型处理。

而且用户可以自行控制,每个问题需要耗费多少 token——表现出来就是我可以规定它在每个具体的问题上思考推理多长时间。

具体操作,是使用者可以通过一个游标刻度尺来调整,刻度上标注的是 " 完成任务所需的 token 数 "。

如果将游标滑动到 "0",那么 Claude 4 就是一个传统的、不带推理能力的 AI 大模型。

滑动到的数值越大,所调用的算力就越多,思考推理过程就越长。

其实呢,OpenAI 现在的模型也有类似功能。

不过OpenAI 只分了 " 低 - 中 - 高 " 三档,供用户选择推理强度。

但讲道理,很难预测模型在每一档位实际上会用掉多少 tokens,所以很多用户反馈 " 三个档位并不能很好地控制使用成本 "。

不过,这可能和 OpenAI 和 Anthropic 的市场定位有关系。

OpenAI 更多针对的是普通用户和个人开发者,三档式更简单易懂,方便操作。

而 Anthropic 更注重企业级市场,相对来说 toB 一些,所以采用了游标刻度尺来调整,让使用者控制成本、速度等。

推理通用二合一,下一个大趋势?

可以看到,国外大模型的两个最强玩家,Anthropic 和 OpenAI,都明确了下一步道路:

让通用模型和推理模型合二为一。

几周内将发布的 Claude 4 如此,数月内将发布的 GPT-5 也是如此。

这或许是所有基座大模型玩家的下一步共同选择也未可知——

当传统 Scaling Law 撞墙成为一个强共识,而后训练、推理、CoT 的重要性与日俱增时,推理变成通用模型的必需技能,似乎是大势所趋。

不过在这中间,Anthropic 有属于自己的牢固生态位,那就是它旗下的 Claude 系列,编程能力一直站在第一梯队的顶尖

而且它擅长的是大厂工程师所需级别的编程任务。

举个例子,Claude 系列更擅长理解由数千个檔案组成的复杂代码库,并生成就能正常运行的完整代码,且一次成功。

这就非常有意思了~

因为在面对复杂编程问题时,AI 大模型往往会偷懒,仅提供注释,而不是吐出实际代码。

不过,现在还不清楚 Claude 4 将如何定价。

会比 o3-mini 便宜吗?会比 DeepSeek-R1 便宜吗?会比 Google 2.0 Flash-Lite 便宜吗?

暂时还没人知道。

不过有网友说出了大多数人的心声:

如果花 1000 美元还解决不了我想解决的问题,那不是纯纯浪费钱吗。

说白了,如果不是在某项实用能力上有「傲视群雄的拔尖实力」,或许所有模型玩家在定价这一 part 上能做的,就是像 DeepSeek 和 Google 2.0 Flash-Lite 一样。

(忍痛)对着价格先狠狠砍一刀,然后再砍一刀,再砍一刀……

参考资料:

[ 1 ] https://x.com/iruletheworldmo/status/1888978299159756878

[ 2 ] https://x.com/kimmonismus/status/1890056488774676697

关于Claude 4被曝发布在即!DeepSeek把大招都给逼出来了就分享完了,您有什么想法可以联系小编(嬴覓晴)。