DeepSeek逼出谷歌新推理模型：40分优势超GPT4.5登顶竞技场，支持原生多模态，但依然败给了“竹竿问题”

今天小编(甄正浩)要和大家分享的是DeepSeek逼出谷歌新推理模型：40分优势超GPT4.5登顶竞技场，支持原生多模态，但依然败给了“竹竿问题”,欢迎阅读~

又双叒，抢在 OpenAI 直播之前，谷歌 Gemini 2.5 系列来了。

首个版本 Pro Experimental 一登场就抢下大模型竞技场第一名，并且整整比 GPT-4.5 高出 40 分！

Gemini 2.5 同样是推理模型，用 Jeff Dean 的说法是：

这是我们最智能的模型，具有令人印象深刻的高级推理和编码能力。

Be like，给出一段提示词：

帮我制作一款吸引人的无尽跑酷游戏。螢幕上要有关键操作说明。使用 p5js，不要用 HTML。我喜欢像素风格的恐龙和有趣的背景。

1 分钟左右，就能得到：

谷歌介绍，相较于 Gemini 2.0 Flash Thinking 这个谷歌首个推理模型，Gemini 2.5 在基础模型和后训练技术上都有改进。

不仅是在大模型竞技场上一举拿下高分，在各种推理、数学、科学、编程基准上，Gemini 2.5 Pro 都表现出色，属于是编程能跟 Claude 3.7 Sonnet 掰手腕，数学能跟 Grok 3 相媲美。

更详细测试结果看这里：

Gemini 2.5 Pro 的上下文視窗是 1M tokens，并且支持原生多模态：可以理解庞大数据集并处理来自不同信息源的复杂问题，包括文本、音频、影像、视频，甚至是整个代码库。

在推理能力之外，谷歌官方还强调了一把 Gemini 2.5 Pro 的编程性能：

2.5 pro 擅长创造视觉上引人注目的 Web 应用程式和智能体代码。

谷歌 DeepMind 研究员们也释出了更多案例，比如把 " 六边形内旋转小球 " 这事整得更加酷炫：

Jeff Dean 则兴奋地放出了一个编程 + 数学的用例，还说：

我记起了小时候第一次了解到曼德布罗特集时的兴奋之情。

（曼德布罗特集：一种在复平面上形成的分形集合）

p.s. 距离谷歌上新 Gemini 2.0 家族，也不过一个多月时间，怕不是让 DeepSeek 给逼急了（doge）。

目前，Gemini 2.5 Pro 已经面向 Gemini Advanced 付费用户开放，开放人员也可以在 Google AI Studio 中试用。谷歌表示，未来几周内还将在 Vertex AI 上推出该模型。

不过，当我们拿最新大模型难题" 竹竿问题 "测试 Gemini 2.5 Pro 时，它并没能顺利通关。

试玩地址：

http://aistudio.google.com/app/prompts/new_chat?model=gemini-2.5-pro-exp-03-25

参考链接：

https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

最后一周！2025 年值得关注的 AIGC 企业产品报名即将截止

下一个 AI" 国产之光 " 将会是谁？欢迎申报奖项！

本次评选结果将于 4 月 16 日中国 AIGC 产业峰会上公布。

一键星标

科技前沿进展每日见

关于DeepSeek逼出谷歌新推理模型：40分优势超GPT4.5登顶竞技场，支持原生多模态，但依然败给了“竹竿问题”就分享完了，您有什么想法可以联系小编(甄正浩)。