高馬爾
一個信息發佈的網站

李飛飛實驗室2025 AI報告出爐:AI推理成本降低至1/280,中美AI模型差距更小了

今天小編(郜萌運)要和大家分享的是李飛飛實驗室2025 AI報告出爐:AI推理成本降低至1/280,中美AI模型差距更小了,歡迎閱讀~

中美 AI 模型差距正在縮小。

由李飛飛聯合領導,斯坦福大學以人為本人工智能研究所(HAI)最新發布了 2025 AI Index,用整整456 頁追蹤了 2024 年全球 AI 行業的發展趨勢,并得出了這樣的結論。

至今,HAI 已發布了8 份(含本次)AI 年度報告,不過今年的這份卻尤為特殊。

這是我們迄今為止最全面的版本,人工智能對社會的影響從未如此明顯。

雖然報告信息量爆炸,但手快的網友已經提前為大家劃了重點:

AI 推理成本降低了 280 倍

開源模型正在迎頭趕上

AI 基準測試成績飙升

……

話不多說,下面我們詳細展開報告中提到的一些重要結論。

從官網消息來看,鑑于報告内容較多,HAI 直接為大家挑出了其中最重要的 12 個結論。

我們先來看與國内最相關的部分。

中美 AI 模型差距正在縮小

首先就是AI 模型方面,中國模型雖然數量不及美國,但質量方面已迅速縮小差距

報告顯示,2024 年美國機構一共開發了 40 個值得關注的 AI 模型,遠高于中國開發的 15 個和歐洲的 3 個。

不過,中美模型之間的性能差異正在快速縮小。具體表現為,在 MMLU 和 HumanEval 等主要基準測試上,二者的性能差異由 2023 年的兩位數縮小到 2024 年的接近相等。

同時,從中美模型過去一年在大模型競技場中的表現也能看出這一追趕趨勢:

當然,這一性能差距正在縮小的趨勢也不局限于中美之間。

報告提到,排名第一和第十的模型之間的得分差距在一年内從 11.9% 降至 5.4%,排名前兩位的差距現在僅為 0.7%。

也就是說,頂尖模型之間的競争越來越激烈。

順帶一提,國内在發表 AI 論文推出 AI 專利方面繼續保持領先地位。

中國是對 AI 最樂觀的國家

其次是在對 AI 的态度方面,中國始終是全球主要國家和地區中最樂觀的。

報告顯示,2024 年中國有 83% 的人認為 AI 產品和服務利大于弊,排在後面的是印度尼西亞(80%)和泰國(77%)。

相比之下,美國(39%)、加拿大(40%)等的樂觀情緒遠低于國内。

不過從整體趨勢來看,自 2022 年以來,幾個之前對 AI 持懷疑态度的國家樂觀情緒增長顯著,比如美國(+4%)、加拿大(+8%)、法國(+10%)等等。

除了以上兩點,還有一些 AI 整體趨勢變化也值得關注。

AI 基準測試成績飙升,表現逐漸接近人類

一個比較符合大家日常感受的結論是:AI 模型在各大基準測試上的得分越來越高了

報告顯示,研究人員在 2023 年引入了一些如今大家已耳熟能詳的基準—— MMMU、GPQA 和 SWE-bench,以此測試更高級 AI 模型的能力極限。

然而僅僅一年之後,從測試得分來看,其性能呈現大幅提升趨勢,分别在 MMMU、GPQA 和 SWE-bench 上提高了 18.8、48.9 和 67.3 個百分點。

從整體趨勢來看,AI 各大能力表現逐漸接近人類,甚至在某些場景下,智能體能在限時編程任務中超越人類。

推理成本下降了 280 倍,開源模型正在迎頭趕上

另一個符合大家印象的趨勢是:AI 正變得更加高效、經濟實惠和易于獲取。

過去兩年間,追求更具性價比的小模型逐漸成為一股潮流。

比如報告中提到的,在 MMLU 中得分超過 60% 的小模型:

數據顯示,由越來越強大的小模型驅動,對于性能達到 GPT-3.5 水平的系統的推理成本,在 2022 年 11 月到 2024 年 10 月間下降了 280 倍

遺憾的是,復雜推理仍然面臨挑戰。

截至目前,AI 模型在國際數學奧林匹克競賽問題等任務中表現出色,但仍無法很好應對 PlanBench 等復雜推理基準測試。

不過與此同時,開源模型也在縮小與閉源模型的差距。

報告中特意提到,在某些基準測試中,它們一年内的性能差異就從 8% 減少到僅 1.7%。

另外在硬體層面,成本每年下降 30%,而能效每年提高 40%。

以上趨勢共同降低了人們獲取高級 AI 的門檻。

AI 正在融入日常生活,企業投資增長強勁

正是由于 AI 獲取門檻降低,我們的日常生活也逐漸被 AI 改寫。

報告顯示,從醫療保健到交通運輸,AI 正迅速從實驗室走向日常生活。

比如 2023 年,美國 FDA 批準了 223 種 AI 醫療設備,而 2015 年僅為 6 種。

另外在自動駕駛方面,美國最大的運營商之一 Waymo 每周提供超過 15 萬次自動駕駛出行,而百度的經濟型 " 蘿卜快跑 " (Apollo Go)自動駕駛出租車車隊現在已在中國多個城市提供服務。

整體而言,AI 的應用落地正在加速

2024 年,有 78% 的組織報告自己正在使用 AI,這比前一年增長了 55%。

當然,以上服務也離不開企業對 AI 的大力投資。

報告顯示,2024 年美國對 AI 的投資為 1091 億美元,這幾乎是中國(93 億美元)的 12 倍和英國(45 億美元)的 24 倍。

其中生成式 AI 尤其強勁,吸引了全球私營投資 339 億美元,這一數字比 2023 年增長了 18.7%。

BTW,除了上述主要結論,報告還提到了:

各國政府正在加強對 AI 的監管和投資;

負責任的 AI 生态系統正在不斷發展,但不均衡;

目前有 2/3 的國家提供或計劃提供 K-12 計算機科學教育(數量是 2019 年的兩倍),其中非洲和拉丁美洲的進步最大;

2024 年近 90% 的知名 AI 模型來自工業界,高于前一年的 60%。

感興趣可以進一步查閱原報告。

報告下載地址:

https://hai-production.s3.amazonaws.com/files/hai_ai_index_report_2025.pdf

參考鏈接:

[ 1 ] https://x.com/stanfordhai/status/1909229864487686475?s=46

[ 2 ] https://hai.stanford.edu/ai-index/2025-ai-index-report

[ 3 ] https://www.youtube.com/watch?v=ABxQBIBsBHY

一鍵三連「點贊」「轉發」「小心心」

歡迎在評論區留下你的想法!

—    —

速搶席位!中國 AIGC 產業峰會觀眾報名通道已開啟  ‍♀️

最新嘉賓曝光啦   百度、華為、AWS、MSRA、無問芯穹、數勢科技、面壁智能、生數科技等十數位 AI 領網域創變者将齊聚峰會,讓更多人用上 AI、用好 AI,與 AI 一同加速成長~

4 月 16 日,就在北京,一起來深度求索 AI 怎麼用  

一鍵星标

科技前沿進展每日見

關于李飛飛實驗室2025 AI報告出爐:AI推理成本降低至1/280,中美AI模型差距更小了就分享完了,您有什麼想法可以聯系小編(郜萌運)。