高马尔
一个信息发布的网站

李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了

今天小编(郜萌運)要和大家分享的是李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了,欢迎阅读~

中美 AI 模型差距正在缩小。

由李飞飞联合领导,斯坦福大学以人为本人工智能研究所(HAI)最新发布了 2025 AI Index,用整整456 页追踪了 2024 年全球 AI 行业的发展趋势,并得出了这样的结论。

至今,HAI 已发布了8 份(含本次)AI 年度报告,不过今年的这份却尤为特殊。

这是我们迄今为止最全面的版本,人工智能对社会的影响从未如此明显。

虽然报告信息量爆炸,但手快的网友已经提前为大家划了重点:

AI 推理成本降低了 280 倍

开源模型正在迎头赶上

AI 基准测试成绩飙升

……

话不多说,下面我们详细展开报告中提到的一些重要结论。

从官网消息来看,鉴于报告内容较多,HAI 直接为大家挑出了其中最重要的 12 个结论。

我们先来看与国内最相关的部分。

中美 AI 模型差距正在缩小

首先就是AI 模型方面,中国模型虽然数量不及美国,但质量方面已迅速缩小差距

报告显示,2024 年美国机构一共开发了 40 个值得关注的 AI 模型,远高于中国开发的 15 个和欧洲的 3 个。

不过,中美模型之间的性能差异正在快速缩小。具体表现为,在 MMLU 和 HumanEval 等主要基准测试上,二者的性能差异由 2023 年的两位数缩小到 2024 年的接近相等。

同时,从中美模型过去一年在大模型竞技场中的表现也能看出这一追赶趋势:

当然,这一性能差距正在缩小的趋势也不局限于中美之间。

报告提到,排名第一和第十的模型之间的得分差距在一年内从 11.9% 降至 5.4%,排名前两位的差距现在仅为 0.7%。

也就是说,顶尖模型之间的竞争越来越激烈。

顺带一提,国内在发表 AI 论文推出 AI 专利方面继续保持领先地位。

中国是对 AI 最乐观的国家

其次是在对 AI 的态度方面,中国始终是全球主要国家和地区中最乐观的。

报告显示,2024 年中国有 83% 的人认为 AI 产品和服务利大于弊,排在后面的是印度尼西亚(80%)和泰国(77%)。

相比之下,美国(39%)、加拿大(40%)等的乐观情绪远低于国内。

不过从整体趋势来看,自 2022 年以来,几个之前对 AI 持怀疑态度的国家乐观情绪增长显著,比如美国(+4%)、加拿大(+8%)、法国(+10%)等等。

除了以上两点,还有一些 AI 整体趋势变化也值得关注。

AI 基准测试成绩飙升,表现逐渐接近人类

一个比较符合大家日常感受的结论是:AI 模型在各大基准测试上的得分越来越高了

报告显示,研究人员在 2023 年引入了一些如今大家已耳熟能详的基准—— MMMU、GPQA 和 SWE-bench,以此测试更高级 AI 模型的能力极限。

然而仅仅一年之后,从测试得分来看,其性能呈现大幅提升趋势,分别在 MMMU、GPQA 和 SWE-bench 上提高了 18.8、48.9 和 67.3 个百分点。

从整体趋势来看,AI 各大能力表现逐渐接近人类,甚至在某些场景下,智能体能在限时编程任务中超越人类。

推理成本下降了 280 倍,开源模型正在迎头赶上

另一个符合大家印象的趋势是:AI 正变得更加高效、经济实惠和易于获取。

过去两年间,追求更具性价比的小模型逐渐成为一股潮流。

比如报告中提到的,在 MMLU 中得分超过 60% 的小模型:

数据显示,由越来越强大的小模型驱动,对于性能达到 GPT-3.5 水平的系统的推理成本,在 2022 年 11 月到 2024 年 10 月间下降了 280 倍

遗憾的是,复杂推理仍然面临挑战。

截至目前,AI 模型在国际数学奥林匹克竞赛问题等任务中表现出色,但仍无法很好应对 PlanBench 等复杂推理基准测试。

不过与此同时,开源模型也在缩小与闭源模型的差距。

报告中特意提到,在某些基准测试中,它们一年内的性能差异就从 8% 减少到仅 1.7%。

另外在硬體层面,成本每年下降 30%,而能效每年提高 40%。

以上趋势共同降低了人们获取高级 AI 的门槛。

AI 正在融入日常生活,企业投资增长强劲

正是由于 AI 获取门槛降低,我们的日常生活也逐渐被 AI 改写。

报告显示,从医疗保健到交通运输,AI 正迅速从实验室走向日常生活。

比如 2023 年,美国 FDA 批准了 223 种 AI 医疗设备,而 2015 年仅为 6 种。

另外在自动驾驶方面,美国最大的运营商之一 Waymo 每周提供超过 15 万次自动驾驶出行,而百度的经济型 " 萝卜快跑 " (Apollo Go)自动驾驶出租车车队现在已在中国多个城市提供服务。

整体而言,AI 的应用落地正在加速

2024 年,有 78% 的组织报告自己正在使用 AI,这比前一年增长了 55%。

当然,以上服务也离不开企业对 AI 的大力投资。

报告显示,2024 年美国对 AI 的投资为 1091 亿美元,这几乎是中国(93 亿美元)的 12 倍和英国(45 亿美元)的 24 倍。

其中生成式 AI 尤其强劲,吸引了全球私营投资 339 亿美元,这一数字比 2023 年增长了 18.7%。

BTW,除了上述主要结论,报告还提到了:

各国政府正在加强对 AI 的监管和投资;

负责任的 AI 生态系统正在不断发展,但不均衡;

目前有 2/3 的国家提供或计划提供 K-12 计算机科学教育(数量是 2019 年的两倍),其中非洲和拉丁美洲的进步最大;

2024 年近 90% 的知名 AI 模型来自工业界,高于前一年的 60%。

感兴趣可以进一步查阅原报告。

报告下载地址:

https://hai-production.s3.amazonaws.com/files/hai_ai_index_report_2025.pdf

参考链接:

[ 1 ] https://x.com/stanfordhai/status/1909229864487686475?s=46

[ 2 ] https://hai.stanford.edu/ai-index/2025-ai-index-report

[ 3 ] https://www.youtube.com/watch?v=ABxQBIBsBHY

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—    —

速抢席位!中国 AIGC 产业峰会观众报名通道已开启  ‍♀️

最新嘉宾曝光啦   百度、华为、AWS、MSRA、无问芯穹、数势科技、面壁智能、生数科技等十数位 AI 领網域创变者将齐聚峰会,让更多人用上 AI、用好 AI,与 AI 一同加速成长~

4 月 16 日,就在北京,一起来深度求索 AI 怎么用  

一键星标

科技前沿进展每日见

关于李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280,中美AI模型差距更小了就分享完了,您有什么想法可以联系小编(郜萌運)。