今天小編(嬴覓晴)要和大家分享的是從零復現,全面開源:360 Light-R1-14B/7B帶來端側AI平權時刻,歡迎閱讀~
性能領先、開源普惠、國產易獲取的三重勢能,造就了年初 DeepSeek 的技術平權狂熱,掀起 AI 普惠浪潮。
然而,當很多人想在端側部署 DeepSeek 模型時,卻遭遇了挑戰:部署滿血版大模型需數萬元硬體投入,退而求其次選擇蒸餾版 14B 版本,又會出現性能斷崖式下跌與響應延遲。
就在 AI 用戶陷入 " 高成本部署 " 與 " 低質量妥協 " 的兩難困境時,端側 AI 的破局時刻,悄悄被 360 打開了。
近期,360 智腦團隊發布了最強 14B 推理模型:Light-R1-14B-DS,是業界首次在 14B 模型上復現強化學習效果。數學能力上,表現超過 DeepSeek-R1-Distill-Llama-70B 和 DeepSeek-R1-Distill-Qwen-32B。
盡管只訓練了 MATH 數據,但在 GPQA 科學常識評測中,7B/14B 雙版本均超越對标產品,展現出 " 小參數大智慧 " 的泛化能力。
此外,配合 360 的全面開源策略(模型 / 數據 / 代碼 / 技術報告全開放),這場端側 AI 平權運動,意味着 14B 模型能在手機端流暢運行,意味着企業無需天價算力即可部署專業級 AI。
AI 端側民主化的風暴眼,正在醞釀之中。
我們第一時間研讀了 360 放出的技術報告,發現端側 AI 的技術拐點已經出現。360 開源的 Light-R1-14B-DS 創造了三項行業紀錄:
一是能力復現。Light-R1-14B-DS 首次在數學能力上,用 14B 模型復現了強化學習效果,通過多階段課程學習 SFT和強化學習,Light-R1-14B-DS 的表現超過 DeepSeek-R1-Distill-Llama-70B 和 DeepSeek-R1-Distill-Qwen-32B,是目前最優的 14B 模型,這驗證了 RL 強化學習策略的有效性,RL 對端側模型訓練的收益很大,仍有進一步挖掘潛力。
(Light-R1 訓練流程)
二是效率革命。Light-R1-14B-DS 經過長思維鏈強化學習後訓練,在 AIME 24 和 25 上分别取得了74.0 和 60.2的成績,數學部分表現超越 DeepSeek 的 70B(72.6 分)和 32B(54.9 分)蒸餾模型,取得了非常顯著的提升,這标志着推理能耗進一步降低。另一版本的 Light-R1-7B-DS,無需量化即可端側部署。此次探索,在低成本復現 DeepSeek-R1 方面邁出了重要一步。
三是泛化能力增強。Light-R1-14B-DS 在科學常識評測 GPQA 上漲,打破了模型 " 災難性遺忘 " 的魔咒,具有較好的泛化性,開辟模型優化新路徑。
最強 14B 端側推理模型,撕開了 DeepSeek 70B 的性能封鎖線,端側 AI 迎來了規模化普及的拐點。不過,在 AI 與大眾之間,還差一個開源。
如果僅有技術突破,但沒有開源機制,那麼端側推理模型再好,也無法被大眾輕松獲得、低成本用起來。
此次,360 采取了全棧式的開源策略——模型權重、22 萬條數學數據集、RL 訓練代碼、技術報告等,都悉數公開。這種開源深度,遠遠超過了常規模型權重開放。
也就是說,中小團隊僅需極少算力,就能從數據清洗到強化學習全鏈路復現,完成端側 AI 的後訓練與部署。
端側 AI 的民主化,高度依賴于科技企業的開源策略,為什麼說 360 此次開放端側推理模型很重要?
對企業來說,傳統端側 AI 部署,會面臨閉源模型高昂的授權費用(如 OpenAI API 調用成本)與硬體适配的邊際成本(需定制化芯片或伺服器),成本難以承受。此前 openai 也發布過蒸餾版 o1-mini,但高昂的訂閱費依然讓大量開發者望而卻步。此外,閉源模型存在不可解釋性風險,醫療、法律等行業因合規要求無法接受 " 輸入-輸出 " 不透明的 AI 決策。因此,Light-R1-14B-DS 這樣低成本、全開源的國產端側推理模型,有望打消企業對 AI 的顧慮,輕松邁入智能化。
對個人來講,雲端模型需要上傳數據,這會引發隐私洩露的顧慮。而在端側離線運行大模型,又對算力 / 内存有更高的要求,傳統端側 AI 需要旗艦級設備,買不起旗艦機,就用不到好 AI,這形成了一種 AI 時代的 " 設備歧視 "。
360 開源最強 14B 端側模型,讓端側 AI 能力不再是少數機型的特權,也可以下沉到普惠機型上,為大眾所用。而用戶規模的擴大,也會推動 AI 應用及大模型產品的增長。
由此看到,360 開源策略所帶來的技術民主化,可以激活 AI 的長尾需求,加速 AI 普惠的到來。
終端設備,是用好 AI 的載體。推理模型下沉到端側,應用空間也十分廣闊,打開了端側 AI 的無限想象空間。
預測一下,目前這兩個最強端側 14B/7B 推理模型,可能會首先落地在商業價值高的場景,然後一步步滲透進各行業。
首當其衝的,就是消費電子領網域。智能手機、手表、平板、PC、眼鏡等終端設備,近兩年都在加速 AI 化。
但此前 AI 化有兩種方案:一是純端側,保證本地隐私安全,但内存要求高,功耗大;另一種是端雲結合,部分任務上雲處理。Light-R1-7B-DS 無需量化即可部署于終端設備(如手機、IoT 設備),标志着消費級硬體也能運行復雜 AI 任務。對比傳統需要 32B 以上參數的端側模型,其 7B 規模大幅降低内存占用和能耗。為 AI 終端帶來了更大的創新空間,比如在手機本地運行復雜數學輔導、法律文書解析等任務,解決隐私和延遲痛點。
360 的技術突破與全棧開源,可以為消費電子領網域的 AI 探索帶來非常有益的借鑑。
下一個就是重點行業、垂直領網域。金融、政務、醫療、法律等數字化基礎較好的行業,積極擁抱 AI,又希望在本地化運行專業級 AI,避免敏感數據上傳雲端,這就需要專有模型 + 後訓練,最強端側 14B/7B 推理模型可以大幅降低端側專有模型的訓練、推理等硬體門檻,加速行業智能化探索。
更進一步,傳統行業壁壘也将被端側普惠 AI 撕開。比如智慧城市治理,通過部署端側 AI 的邊緣智能計算,可以極大減少智能化的建設和更新運維成本;農業智能化,搭載 14B 模型的農業無人機,路線自動避障、精準識别地面等能力,都會随着推理能力的增強而大幅提升。
通過端側 AI 的普惠路線圖,來進行推演,不難看到,360 的技術突破與開源策略,一定會吸引大量行業開發者或個人開發者前來試用,與豐富的場景相結合,催生大量智能化的長尾應用。
也就是說,通過開源輕量級推理模型,360 有望規避 AI 六小強在千億參數級的競争。基于開源開放的技術公信力,構建開發者生态護城河。從這個角度看,360 掀起的端側 AI 飓風,也将卷出一個大模型競争的新格局。
端側推理模型的平權時刻已到,萬億級邊緣智能市場正蓄勢待發、乘風遠航。
關于從零復現,全面開源:360 Light-R1-14B/7B帶來端側AI平權時刻就分享完了,您有什麼想法可以聯系小編(嬴覓晴)。