今天小編(郜萌運)要和大家分享的是DeepSeek V3“小版本更新”實測堪比V3.5,非推理模型也有“啊哈時刻”,7米甘蔗過2米門想通了,歡迎閱讀~
DeepSeek V3 更新了,新版本 V3-0324。
官方輕描淡寫只說是 " 小版本更新 ",但很多人實測下來可一點也不小。
把流行的小球彈跳測試,提升難度到 4 維空間超立方體也沒問題。
天哪,如果這只是一個小更新,那我想象不出大更新會是什麼樣子。
編程這塊,只需一句提示詞開發一個完整產品着陸頁,帶自适應布局帶動效,被評價為與 Claude 3.7 Sonnet 同一水平。
由于發布時間太短,還沒有正式測評結果,不過在開發者 Xeophon 的個人 Benchmark 上所有指标都有大提升,成為該測試下最好的非推理模型。
不是推理模型也有 " 啊哈時刻 "
DeepSeek-V3-0324 并非推理模型,在回答之前不會給出思考過程,但依然遵循一定的思維方式分解問題。
走入死胡同的話,還表現出自主回到上一步重新思考的能力。
在 "9.11 和 9.9 那個大 "、"Straberry 有多少個 r" 已經不成問題的今天,最新折磨 AI 的難題是 " 讓 7 米長的甘蔗通過 2 米高 1 米寬的門 "。
在量子位的測試中,DeepSeek-V3-0324 先是像它的前輩以及許多其他 AI 一樣碰壁。
碰壁之後開始重新思考題目本身的含義,後面依舊陷入誤區,但突然在中文解題過程中夾雜一句英語思考,類似 DeepSeek-R1 技術報告中的 " 啊哈時刻 "。
等等,這似乎與之前的對角線方法相似,也許我遺漏了什麼。
頓悟之後,突然就走上了正确的道路,注意到了題目中沒直接提到的隐藏條件。
雖然從計算過程看,還是沒理解到問題的本質,但好歹得出了解決方案,還認識到了自己的誤區。
依舊免費, 依舊開源
像這樣的優秀模型依舊免費, 依舊開源,權重檔案已火速上線 HuggingFace,使用最寬松的 MIT 協定。
所有權重檔案加起來占硬碟空間約 688GB,與初代 v3 保持一致,說明依然是 671B 參數的 MoE 模型,目前沒有更多技術細節,還需等待官方進一步發布公告。
目前在官網和官方 APP(關閉深度思考即可)、HuggingFace 等渠道都能體驗到 v3-0324。
也可以到大模型競技場去與其他模型 pk,不過投票結果還要等一段時間才能出來。
當然最讓大家期待的還是,v3 更新了,r2 還會遠嗎?
官網試玩:
https://chat.deepseek.com/
HuggingFace:
https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/blob/main/README.md
參考鏈接:
[ 1 ] https://x.com/TheXeophon/status/1904225899957936314
[ 2 ] https://x.com/Yuchenj_UW/status/1904223627509465116
[ 3 ] https://x.com/risphereeditor/status/1904194061780590773
關于DeepSeek V3“小版本更新”實測堪比V3.5,非推理模型也有“啊哈時刻”,7米甘蔗過2米門想通了就分享完了,您有什麼想法可以聯系小編(郜萌運)。