最低調的「AI 六小龍」階躍星辰，在 DeepSeek 浪潮中交出了一份新答卷

今天小編(幸聽楓)要和大家分享的是最低調的「AI 六小龍」階躍星辰，在 DeepSeek 浪潮中交出了一份新答卷,歡迎閱讀~

DeepSeek 掀起的浪潮還沒結束，不只是 OpenAI ，中國的「 AI 六小龍」都要面臨拷問：Scaling Law 是否還能持續，開源還是閉源，AI 落地的路線是否還行得通。

今天，AI 六小龍中一直比較低調的階躍星辰，率先交出今年的第一份答卷。

在首屆 Step UP 生态開放日，階躍星辰公布了自己探索 AGI 的方式，開啟多模态推理的技術研究，并将 AI 落地的重點押注在智能終端，重點布局汽車、手機、具身智能、IoT 等應用場景。

階躍星辰創始人、CEO 姜大昕認為，智能終端将成為 Agent （智能體）技術大規模應用的關鍵載體。

們朝着實現 AGI 的目标穩步前進，目前已進入 Agent（智能體）的發展階段。

他指出智能體的發展依賴于兩大關鍵要素：

一是多模态能力，讓智能體充分地感知和理解世界；

二是推理能力，使智能體能夠進行長思維鏈的慢思考，主動規劃、嘗試、反思，通過不斷糾錯提供準确的答案。

多模态讓智能體像人一樣「看、聽、懂」，相當于人的「感官系統」，而推理能力就是處理信息的「大腦皮層」。

二者結合就能讓 AI 《紅樓夢》裡的王熙鳳，一雙丹鳳三角眼，不僅能察言觀色，還能從一句話、一個動作中讀出對方的深意。

多模态也是階躍星辰在六小龍中最大的特點，目前階躍 Step 系列模型矩陣已經發布了 11 款多模态大模型，覆蓋語音識别、語音生成、多模态理解、影像及視頻生成的全面能力。

前幾天階躍星辰還開源了 Step-Video-T2V 視頻生成模型和 Step-Audio 語音模型，成為六小龍最快擁抱開源的其中一位，但和 DeepSeek 不同的是，階躍星辰開源的模型均為多模态，而這也是 DeepSeek 還沒展現的能力。

去年 APPSO 就曾用階躍星辰旗下的躍問應用，讓還不支持的蘋果 AI 的國行 iPhone 16 ，獲得類似官方視覺智能的能力，按下拍攝按鈕，拍照問就能輕松打開，看到任何需要咨詢的東西，基本都能找到答案。

至于推理能力，階躍星辰今天還宣布了和清華大學共同研發的開源推理模型 Open-Reasoner-Zero，首次從預訓練模型開始就大規模強化學習，效率達到 DeepSeek-R1-Zero 的 25 倍。

姜大昕在現場還預告了内部正在研發的視覺推理模型，其實這樣揭示了階躍星辰推動 AI 落地的技術邏輯：将多模态能力和推理能力結合，讓智能終端成為 Agent 的載體。

目前，階躍星辰的模型能力在智能終端主要有以下這些場景。

汽車場景：與吉利合作開發的智能座艙 Agent，通過多模态互動（語音 + 視覺）實現「可見即可說」，例如用戶說「導航到最近的充電站」，Agent 自動調用地圖、查詢充電樁狀态并規劃路線。

手機場景：與 OPPO 共建的「一鍵問屏」功能，用戶拍照或截圖後，Agent 能直接解析圖片内容（如商品、文檔）并調用 API 完成搜索或翻譯，無需手動切換 App。

IoT 場景：與 TCL 等廠商合作，通過設備間聯動實現主動服務，實現設備間的智能化更新和體驗的無縫連接。

具身智能，：促進 Agent 在具身領網域的創新應用。階躍星辰宣布與智元機器人戰略合作，共同探索 AI+ 具身機器人應用場景。

AI 智能終端是一個既性感又飽受争議的概念，可能會讓很多硬體通過 AI 提升用戶的體驗，最近不少手機紛紛都宣布接入 DeepSek，同時去年爆火的 AI 硬體 Ai Pin，下個月就将停止所有的 AI 服務、消息推送等聯網功能。

目前大多數手機接入的 DeepSeek，都是給語音助手加一個插件式外挂，同時由于 DeepSeek 尚不支持多模态能力，使用場景收到的限制就比較多。最近網上流行的「DeepSeek+xx」的組合玩法，其實就是為了彌補其缺乏的能力。

去年率先喊出 AI 手機的 OPPO，就在 AI 終端融合走得更遠。

比如使用小布助手 App「一鍵問屏」，用戶通過多模态視覺跟 AI 互動，實現拍照問答、文檔問答，識屏問答等多種功能。

用戶甚至可以給小布下達指令讓它進入各種應用端完成任務，比如進入淘寶、京東搜索同款商品，在小紅書、同花順、攜程等平台搜索信息和服務，在飛書、釘釘、企業微信等社交軟體搜索聊天記錄等，實現一鍵全能搜。

這些功能 OPPO 基于階躍星辰 Step 系列多模态模型共同開發的，OPPO 智能助理部部長、小布助手負責人萬玉龍告訴我們，随着新一代 AI 技術與移動終端的深度融合，手機已經逐步進化為能夠理解用戶意圖、提供主動服務、甚至預判用戶需求的智能助理。

智能終端正在邁入 Agent 時代。和過去最大的不同在于：本地化 AI 推理能力使終端從被動響應指令的工具，更新為主動理解需求、跨應用協同的「智能夥伴」。

讓這一藍圖成為現實的，則是多模态 AI 智能體，它将作為新的互動界面，無需物理界面，類似《阿凡達》中的靈魂樹，連接所有賽博智能體，用戶甚至通過思維直接與 AI 互動，來完成所有現實任務的執行。

姜大昕提出 AGI 發展需經歷模拟世界、探索世界、歸納世界三大階段：

模拟世界：通過模仿學習訓練多模态模型，統一表征聲音、文本、影像、視頻及物理世界。

探索世界：引入強化學習（如 AlphaGo、DeepSeek），賦予模型邏輯推理與問題解決能力。

歸納世界：探索機器自主發現物理規律的能力，如牛頓從蘋果落地推導萬有引力定律，目标是将 AI 與科學家協同創新。

通往 AGI 的路或許不止一條，但總需要有人去趟出不同的路，階躍星辰選擇了智能終端 Agent 這條路，或許下一次人機互動的革新，已經埋下了草蛇灰線。

關于最低調的「AI 六小龍」階躍星辰，在 DeepSeek 浪潮中交出了一份新答卷就分享完了，您有什麼想法可以聯系小編(幸聽楓)。