今天小編(幸聽楓)要和大家分享的是最低調的「AI 六小龍」階躍星辰,在 DeepSeek 浪潮中交出了一份新答卷,歡迎閱讀~
DeepSeek 掀起的浪潮還沒結束 ,不只是 OpenAI ,中國的「 AI 六小龍」都要面臨拷問:Scaling Law 是否還能持續,開源還是閉源,AI 落地的路線是否還行得通。
今天,AI 六小龍中一直比較低調的階躍星辰,率先交出今年的第一份答卷。
在首屆 Step UP 生态開放日,階躍星辰公布了自己探索 AGI 的方式,開啟多模态推理的技術研究,并将 AI 落地的重點押注在智能終端,重點布局汽車、手機、具身智能、IoT 等應用場景。
階躍星辰創始人、CEO 姜大昕認為,智能終端将成為 Agent (智能體)技術大規模應用的關鍵載體。
們朝着實現 AGI 的目标穩步前進,目前已進入 Agent(智能體)的發展階段。
他指出智能體的發展依賴于兩大關鍵要素:
一是多模态能力,讓智能體充分地感知和理解世界;
二是推理能力,使智能體能夠進行長思維鏈的慢思考,主動規劃、嘗試、反思,通過不斷糾錯提供準确的答案。
多模态讓智能體像人一樣「看、聽、懂」,相當于人的「感官系統」,而推理能力就是處理信息的「大腦皮層」。
二者結合就能讓 AI 《紅樓夢》裡的王熙鳳,一雙丹鳳三角眼,不僅能察言觀色,還能從一句話、一個動作中讀出對方的深意。
多模态也是階躍星辰在六小龍中最大的特點,目前階躍 Step 系列模型矩陣已經發布了 11 款多模态大模型,覆蓋語音識别、語音生成、多模态理解、影像及視頻生成的全面能力。
前幾天階躍星辰還開源了 Step-Video-T2V 視頻生成模型和 Step-Audio 語音模型,成為六小龍最快擁抱開源的其中一位,但和 DeepSeek 不同的是,階躍星辰開源的模型均為多模态,而這也是 DeepSeek 還沒展現的能力。
去年 APPSO 就曾用階躍星辰旗下的躍問應用,讓還不支持的蘋果 AI 的國行 iPhone 16 ,獲得類似官方視覺智能的能力,按下拍攝按鈕,拍照問就能輕松打開,看到任何需要咨詢的東西,基本都能找到答案。
至于推理能力,階躍星辰今天還宣布了和清華大學共同研發的開源推理模型 Open-Reasoner-Zero,首次從預訓練模型開始就大規模強化學習,效率達到 DeepSeek-R1-Zero 的 25 倍。
姜大昕在現場還預告了内部正在研發的視覺推理模型,其實這樣揭示了階躍星辰推動 AI 落地的技術邏輯:将多模态能力和推理能力結合,讓智能終端成為 Agent 的載體。
目前,階躍星辰的模型能力在智能終端主要有以下這些場景。
汽車場景:與吉利合作開發的智能座艙 Agent,通過多模态互動(語音 + 視覺)實現「可見即可說」,例如用戶說「導航到最近的充電站」,Agent 自動調用地圖、查詢充電樁狀态并規劃路線。
手機場景:與 OPPO 共建的「一鍵問屏」功能,用戶拍照或截圖後,Agent 能直接解析圖片内容(如商品、文檔)并調用 API 完成搜索或翻譯,無需手動切換 App。
IoT 場景:與 TCL 等廠商合作,通過設備間聯動實現主動服務,實現設備間的智能化更新和體驗的無縫連接。
具身智能,:促進 Agent 在具身領網域的創新應用。階躍星辰宣布與智元機器人戰略合作,共同探索 AI+ 具身機器人應用場景。
AI 智能終端是一個既性感又飽受争議的概念,可能會讓很多硬體通過 AI 提升用戶的體驗,最近不少手機紛紛都宣布接入 DeepSek,同時去年爆火的 AI 硬體 Ai Pin,下個月就将停止所有的 AI 服務、消息推送等聯網功能。
目前大多數手機接入的 DeepSeek,都是給語音助手加一個插件式外挂,同時由于 DeepSeek 尚不支持多模态能力,使用場景收到的限制就比較多。最近網上流行的「DeepSeek+xx」的組合玩法,其實就是為了彌補其缺乏的能力。
去年率先喊出 AI 手機的 OPPO,就在 AI 終端融合走得更遠。
比如使用小布助手 App「一鍵問屏」,用戶通過多模态視覺跟 AI 互動,實現拍照問答、文檔問答,識屏問答等多種功能。
用戶甚至可以給小布下達指令讓它進入各種應用端完成任務,比如進入淘寶、京東搜索同款商品,在小紅書、同花順、攜程等平台搜索信息和服務,在飛書、釘釘、企業微信等社交軟體搜索聊天記錄等,實現一鍵全能搜。
這些功能 OPPO 基于階躍星辰 Step 系列多模态模型共同開發的,OPPO 智能助理部部長、小布助手負責人萬玉龍告訴我們,随着新一代 AI 技術與移動終端的深度融合,手機已經逐步進化為能夠理解用戶意圖、提供主動服務、甚至預判用戶需求的智能助理。
智能終端正在邁入 Agent 時代。和過去最大的不同在于:本地化 AI 推理能力使終端從被動響應指令的工具,更新為主動理解需求、跨應用協同的「智能夥伴」。
讓這一藍圖成為現實的,則是多模态 AI 智能體,它将作為新的互動界面,無需物理界面,類似《阿凡達》中的靈魂樹,連接所有賽博智能體,用戶甚至通過思維直接與 AI 互動,來完成所有現實任務的執行。
姜大昕提出 AGI 發展需經歷模拟世界、探索世界、歸納世界三大階段:
模拟世界:通過模仿學習訓練多模态模型,統一表征聲音、文本、影像、視頻及物理世界。
探索世界:引入強化學習(如 AlphaGo、DeepSeek),賦予模型邏輯推理與問題解決能力。
歸納世界:探索機器自主發現物理規律的能力,如牛頓從蘋果落地推導萬有引力定律,目标是将 AI 與科學家協同創新。
通往 AGI 的路或許不止一條,但總需要有人去趟出不同的路,階躍星辰選擇了智能終端 Agent 這條路,或許下一次人機互動的革新,已經埋下了草蛇灰線。
關于最低調的「AI 六小龍」階躍星辰,在 DeepSeek 浪潮中交出了一份新答卷就分享完了,您有什麼想法可以聯系小編(幸聽楓)。