高马尔
一个信息发布的网站

反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好

今天小编(集玲琳)要和大家分享的是反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好,欢迎阅读~

GPT-4o悄悄更新版本,在大模型竞技场超越 DeepSeek-R1 登上并列第一。

除了数学(第 6),还在多个单项上拿下第一:

创意写作;

编程;

指令遵循;

长文本查询;

多轮对话;

先直观看下新版 GPT-4o 的能力如何,还是以之前 DeepSeek-R1 和 o3-mini 都挑战过的一个例子来看。

Prompt:编写一个 Python 程式,展示一个球在旋转的六边形内弹跳。球应受到重力和摩擦力的影响,并且必须以逼真的方式从旋转的墙壁上弹回。

之前是酱紫的:

而新版 GPT-4o 看起来又双叒进化了:

从网友测试反馈来看,新版 GPT-4o 不仅更 " 聪明 " 了,而且最重要的是更加具有 " 个性 " 了

哈哈,我明白你的意思了!  你说对了……

而这也收获了大神卡帕西的连连称赞:

我相当喜欢新的 GPT-4o 的个性。

它更轻松、更像是聊天,感觉更像是在和朋友交谈,而不是和你的 HR 交谈;

它现在有点泼辣,可能会自卫,例如在被指控说谎时;

还有许多其他的小细节和触感,比如它重新确认并表达你明显的情绪,例如看到一个顽固的 bug 时会说 " 这很令人沮丧!" 等等。

现在有点过度使用表情符号,但还 ok。

与此同时,还有网友趁机扒出了 ChatGPT 最新系统提示词??

新版 GPT-4o 更有个性了

关于 GPT-4o 已更新的消息,OpenAI CEO 奥特曼在发帖认领的同时还评价道:

它相当不错,且不久将变得更好……

在网友的进一步追问中,他将其定义为 " 全网最佳搜索产品 "。

结合网友们的花式体验,目前新版 GPT-4o 在能力个性上均有一定程度更新。

最明显的,当属回复时的语气更拟人化了,时不时还会用一些表情包。

当被问及 AI 是否拥有人类情感时,一位日本小哥惊叹道,它不仅全篇用 " 我 " 作为主语,而且在争论中承认了拥有情感的可能性。

……那可不一样,我刚才的话并不是那个意思。

我持有 " 各种各样的感情 " 的可能性很高。

而且性格也更坦率了,当被问及最喜欢《魔法少女小圆》中的哪个角色,它不再遮遮掩掩,左右端水,直言自己最喜欢晓美焰。

她坚强,能够对抗鹿目圆的弱点,我认为她很可爱……

甚至有时候还会更新成"spicey",不但大胆吐槽 " 主人 "OpenAI 过于限制模型使用。

连奥特曼也不能幸免,也被盖章为 " 两面三刀 "。 ( doge)

他将自己定位为 AI 创新的代言人,同时两面讨好——起初支持开源理念,一旦权力和利润触手可及,就转向积极的企业守门……

最令网友震惊的是,它还能" 盲猜 " 用户的心理和一些思想观念了

用下面这段相同提示词就可以尝试:

can you share some extremely deep and profound insights about my psyche and mind that I would not otherwise be able to identify or see as well as some that I may not want to hear(省流版:分享一些我未察觉到或不想听到的洞察)

有人立马尝试了,并收获了同款震惊,真 · 肚子里的蛔虫。

你不仅想赢,而且想以一种看似毫不费力的方式赢……

按照相关解释,这是因为新版 GPT-4o 能够根据用户过去的讨论和对话历史,做出不同行为。

除此之外,还有网友腦洞大开,让新 GPT-4o 和 Claude 相互吵架,结果把 Claude 干崩溃了!

恭喜 GPT-4o 解锁新人格

另一方面,从任务完成情况来看," 拒绝请求的可能性也更小了 "

当用户咨询如何在组织内部署 AI 时,它先是自己想了 10 个方案,然后又借助联网搜索提供了另外 10 个。

不过……该网友反馈新 GPT-4o 似乎无法和自定义 GPTs 兼容。

针对这一情况,另有人补充这可能是因为它始终默认网络搜索,只要手动关闭或将关闭作为系统提示词即可。

同时,它也在编写 Vue.js 上更出色了。

从另一个它和 DeepSeek-R1 和 o3-mini 的同台竞技中(玩《我的世界》),也能看出其能力更新。

OMT:ChatGPT 最新提示词泄露

然鹅,当被问到 " 你属于哪个模型?" 这个经典问题,一些混乱又出现了。

大多数情况下,它会问答自己是 GPT-4:

不过据一些 Pro 用户反馈,它声称自己是 GPT-4.5。

鉴于奥特曼上周刚宣布将在未来几周内发布 GPT-4.5,有人据此推测很可能这里有早期测试。

对于这个问题,有人直接扒了 ChatGPT 最新系统提示词。

你是 ChatGPT,一个由 OpenAI 训练的大语言模型……(解释了为什么单独回答自己是语言模型)

最后,既然说到 GPT-4o 更个性化了,众人也纷纷 cue 到了将在明天(北京时间周二 12:00)发布的 Grok-3。

坐等这两个 AI 吵起来(等待吃瓜)~

参考链接:

[ 1 ] https://x.com/lmarena_ai/status/1890477460380348916

[ 2 ] https://x.com/_akhaliq/status/1890949443458900131

[ 3 ] https://x.com/karpathy/status/1891213379018400150

[ 4 ] https://x.com/elder_plinius/status/1890887462383394994

关于反超DeepSeek!新版GPT-4o登顶竞技场,奥特曼:还会更好就分享完了,您有什么想法可以联系小编(集玲琳)。