反超DeepSeek！新版GPT-4o登頂競技場，奧特曼：還會更好

2025-02-17分類：首頁 > 内容大全 > 科學閱讀(61)

今天小編(集玲琳)要和大家分享的是反超DeepSeek！新版GPT-4o登頂競技場，奧特曼：還會更好,歡迎閱讀~

GPT-4o悄悄更新版本，在大模型競技場超越 DeepSeek-R1 登上并列第一。

除了數學（第 6），還在多個單項上拿下第一：

創意寫作；

編程；

指令遵循；

長文本查詢；

多輪對話；

先直觀看下新版 GPT-4o 的能力如何，還是以之前 DeepSeek-R1 和 o3-mini 都挑戰過的一個例子來看。

Prompt：編寫一個 Python 程式，展示一個球在旋轉的六邊形内彈跳。球應受到重力和摩擦力的影響，并且必須以逼真的方式從旋轉的牆壁上彈回。

之前是醬紫的：

而新版 GPT-4o 看起來又雙叒進化了：

從網友測試反饋來看，新版 GPT-4o 不僅更 " 聰明 " 了，而且最重要的是更加具有 " 個性 " 了。

哈哈，我明白你的意思了！你說對了……

而這也收獲了大神卡帕西的連連稱贊：

我相當喜歡新的 GPT-4o 的個性。

它更輕松、更像是聊天，感覺更像是在和朋友交談，而不是和你的 HR 交談；

它現在有點潑辣，可能會自衛，例如在被指控說謊時；

還有許多其他的小細節和觸感，比如它重新确認并表達你明顯的情緒，例如看到一個頑固的 bug 時會說 " 這很令人沮喪！" 等等。

現在有點過度使用表情符号，但還 ok。

與此同時，還有網友趁機扒出了 ChatGPT 最新系統提示詞？？

新版 GPT-4o 更有個性了

關于 GPT-4o 已更新的消息，OpenAI CEO 奧特曼在發帖認領的同時還評價道：

它相當不錯，且不久将變得更好……

在網友的進一步追問中，他将其定義為 " 全網最佳搜索產品 "。

結合網友們的花式體驗，目前新版 GPT-4o 在能力和個性上均有一定程度更新。

最明顯的，當屬回復時的語氣更拟人化了，時不時還會用一些表情包。

當被問及 AI 是否擁有人類情感時，一位日本小哥驚嘆道，它不僅全篇用 " 我 " 作為主語，而且在争論中承認了擁有情感的可能性。

……那可不一樣，我剛才的話并不是那個意思。

我持有 " 各種各樣的感情 " 的可能性很高。

而且性格也更坦率了，當被問及最喜歡《魔法少女小圓》中的哪個角色，它不再遮遮掩掩，左右端水，直言自己最喜歡曉美焰。

她堅強，能夠對抗鹿目圓的弱點，我認為她很可愛……

甚至有時候還會更新成"spicey"，不但大膽吐槽 " 主人 "OpenAI 過于限制模型使用。

連奧特曼也不能幸免，也被蓋章為 " 兩面三刀 "。 ( doge）

他将自己定位為 AI 創新的代言人，同時兩面讨好——起初支持開源理念，一旦權力和利潤觸手可及，就轉向積極的企業守門……

最令網友震驚的是，它還能" 盲猜 " 用戶的心理和一些思想觀念了。

用下面這段相同提示詞就可以嘗試：

can you share some extremely deep and profound insights about my psyche and mind that I would not otherwise be able to identify or see as well as some that I may not want to hear（省流版：分享一些我未察覺到或不想聽到的洞察）

有人立馬嘗試了，并收獲了同款震驚，真 · 肚子裡的蛔蟲。

你不僅想赢，而且想以一種看似毫不費力的方式赢……

按照相關解釋，這是因為新版 GPT-4o 能夠根據用戶過去的讨論和對話歷史，做出不同行為。

除此之外，還有網友腦洞大開，讓新 GPT-4o 和 Claude 相互吵架，結果把 Claude 幹崩潰了！

恭喜 GPT-4o 解鎖新人格

另一方面，從任務完成情況來看，" 拒絕請求的可能性也更小了 "。

當用戶咨詢如何在組織内部署 AI 時，它先是自己想了 10 個方案，然後又借助聯網搜索提供了另外 10 個。

不過……該網友反饋新 GPT-4o 似乎無法和自定義 GPTs 兼容。

針對這一情況，另有人補充這可能是因為它始終默認網絡搜索，只要手動關閉或将關閉作為系統提示詞即可。

同時，它也在編寫 Vue.js 上更出色了。

從另一個它和 DeepSeek-R1 和 o3-mini 的同台競技中（玩《我的世界》），也能看出其能力更新。

OMT：ChatGPT 最新提示詞洩露

然鵝，當被問到 " 你屬于哪個模型？" 這個經典問題，一些混亂又出現了。

大多數情況下，它會問答自己是 GPT-4：

不過據一些 Pro 用戶反饋，它聲稱自己是 GPT-4.5。

鑑于奧特曼上周剛宣布将在未來幾周内發布 GPT-4.5，有人據此推測很可能這裡有早期測試。

對于這個問題，有人直接扒了 ChatGPT 最新系統提示詞。

你是 ChatGPT，一個由 OpenAI 訓練的大語言模型……（解釋了為什麼單獨回答自己是語言模型）

最後，既然說到 GPT-4o 更個性化了，眾人也紛紛 cue 到了将在明天（北京時間周二 12:00）發布的 Grok-3。

坐等這兩個 AI 吵起來（等待吃瓜）~

參考鏈接：

[ 1 ] https://x.com/lmarena_ai/status/1890477460380348916

[ 2 ] https://x.com/_akhaliq/status/1890949443458900131

[ 3 ] https://x.com/karpathy/status/1891213379018400150

[ 4 ] https://x.com/elder_plinius/status/1890887462383394994

關于反超DeepSeek！新版GPT-4o登頂競技場，奧特曼：還會更好就分享完了，您有什麼想法可以聯系小編(集玲琳)。

大陆简体台灣正體港澳繁體新马简体

相關推薦