高馬爾
一個信息發佈的網站

Claude 4被曝發布在即!DeepSeek把大招都給逼出來了

今天小編(嬴覓晴)要和大家分享的是Claude 4被曝發布在即!DeepSeek把大招都給逼出來了,歡迎閱讀~

終于!終于!Claude 4 被曝将在未來幾周内發布

高亮重點,最新的它采取了一個與之前模型路線不同的辦法:

是個混合型大模型。

簡單來說,就是既帶有推理能力,會使用更多的算力來思考和解決難題;在面對簡單問題的時候,又能像傳統大模型一樣短平快地輕巧處理,無需多費不必要的功夫。

怎麼樣,聽起來是不是和昨天奧特曼透露的 GPT-5 非常類似(doge)。

都是不再把傳統通用模型和推理模型分開推出,直接融合在一起。

據透露,Anthropic 計劃在未來幾周内發布該模型。

而翻遍互聯網發現,4 天前就有人按捺不住,在推特上劇透過:

Anthropic 内部員工告訴我,他們将在本周内發布 Claude 4,以及一個推理模型。

至于性能嘛,超過滿血 o3!

俗話說得好:傳言有出入,期待需謹慎。

但還是禁不住狠狠期待一下!

下面一起來看更詳細的劇透——

Claude 4 不走老路,可控制使用時的推理成本

如前所述,Claude 4 與此前的通用大模型不同。

把通用模型和推理模型融合到一起去了,會根據具體任務,調整所需算力和所需功能

遇到復雜的問題,就啟用推理能力;遇到簡單的問題,就用通用模型處理。

而且用戶可以自行控制,每個問題需要耗費多少 token——表現出來就是我可以規定它在每個具體的問題上思考推理多長時間。

具體操作,是使用者可以通過一個遊标刻度尺來調整,刻度上标注的是 " 完成任務所需的 token 數 "。

如果将遊标滑動到 "0",那麼 Claude 4 就是一個傳統的、不帶推理能力的 AI 大模型。

滑動到的數值越大,所調用的算力就越多,思考推理過程就越長。

其實呢,OpenAI 現在的模型也有類似功能。

不過OpenAI 只分了 " 低 - 中 - 高 " 三檔,供用戶選擇推理強度。

但講道理,很難預測模型在每一檔位實際上會用掉多少 tokens,所以很多用戶反饋 " 三個檔位并不能很好地控制使用成本 "。

不過,這可能和 OpenAI 和 Anthropic 的市場定位有關系。

OpenAI 更多針對的是普通用戶和個人開發者,三檔式更簡單易懂,方便操作。

而 Anthropic 更注重企業級市場,相對來說 toB 一些,所以采用了遊标刻度尺來調整,讓使用者控制成本、速度等。

推理通用二合一,下一個大趨勢?

可以看到,國外大模型的兩個最強玩家,Anthropic 和 OpenAI,都明确了下一步道路:

讓通用模型和推理模型合二為一。

幾周内将發布的 Claude 4 如此,數月内将發布的 GPT-5 也是如此。

這或許是所有基座大模型玩家的下一步共同選擇也未可知——

當傳統 Scaling Law 撞牆成為一個強共識,而後訓練、推理、CoT 的重要性與日俱增時,推理變成通用模型的必需技能,似乎是大勢所趨。

不過在這中間,Anthropic 有屬于自己的牢固生态位,那就是它旗下的 Claude 系列,編程能力一直站在第一梯隊的頂尖

而且它擅長的是大廠工程師所需級别的編程任務。

舉個例子,Claude 系列更擅長理解由數千個檔案組成的復雜代碼庫,并生成就能正常運行的完整代碼,且一次成功。

這就非常有意思了~

因為在面對復雜編程問題時,AI 大模型往往會偷懶,僅提供注釋,而不是吐出實際代碼。

不過,現在還不清楚 Claude 4 将如何定價。

會比 o3-mini 便宜嗎?會比 DeepSeek-R1 便宜嗎?會比 Google 2.0 Flash-Lite 便宜嗎?

暫時還沒人知道。

不過有網友說出了大多數人的心聲:

如果花 1000 美元還解決不了我想解決的問題,那不是純純浪費錢嗎。

說白了,如果不是在某項實用能力上有「傲視群雄的拔尖實力」,或許所有模型玩家在定價這一 part 上能做的,就是像 DeepSeek 和 Google 2.0 Flash-Lite 一樣。

(忍痛)對着價格先狠狠砍一刀,然後再砍一刀,再砍一刀……

參考資料:

[ 1 ] https://x.com/iruletheworldmo/status/1888978299159756878

[ 2 ] https://x.com/kimmonismus/status/1890056488774676697

關于Claude 4被曝發布在即!DeepSeek把大招都給逼出來了就分享完了,您有什麼想法可以聯系小編(嬴覓晴)。