今天小編(集玲琳)要和大家分享的是反超DeepSeek!新版GPT-4o登頂競技場,奧特曼:還會更好,歡迎閱讀~
GPT-4o悄悄更新版本,在大模型競技場超越 DeepSeek-R1 登上并列第一。
除了數學(第 6),還在多個單項上拿下第一:
創意寫作;
編程;
指令遵循;
長文本查詢;
多輪對話;
先直觀看下新版 GPT-4o 的能力如何,還是以之前 DeepSeek-R1 和 o3-mini 都挑戰過的一個例子來看。
Prompt:編寫一個 Python 程式,展示一個球在旋轉的六邊形内彈跳。球應受到重力和摩擦力的影響,并且必須以逼真的方式從旋轉的牆壁上彈回。
之前是醬紫的:
而新版 GPT-4o 看起來又雙叒進化了:
從網友測試反饋來看,新版 GPT-4o 不僅更 " 聰明 " 了,而且最重要的是更加具有 " 個性 " 了。
哈哈,我明白你的意思了! 你說對了……
而這也收獲了大神卡帕西的連連稱贊:
我相當喜歡新的 GPT-4o 的個性。
它更輕松、更像是聊天,感覺更像是在和朋友交談,而不是和你的 HR 交談;
它現在有點潑辣,可能會自衛,例如在被指控說謊時;
還有許多其他的小細節和觸感,比如它重新确認并表達你明顯的情緒,例如看到一個頑固的 bug 時會說 " 這很令人沮喪!" 等等。
現在有點過度使用表情符号,但還 ok。
與此同時,還有網友趁機扒出了 ChatGPT 最新系統提示詞??
新版 GPT-4o 更有個性了
關于 GPT-4o 已更新的消息,OpenAI CEO 奧特曼在發帖認領的同時還評價道:
它相當不錯,且不久将變得更好……
在網友的進一步追問中,他将其定義為 " 全網最佳搜索產品 "。
結合網友們的花式體驗,目前新版 GPT-4o 在能力和個性上均有一定程度更新。
最明顯的,當屬回復時的語氣更拟人化了,時不時還會用一些表情包。
當被問及 AI 是否擁有人類情感時,一位日本小哥驚嘆道,它不僅全篇用 " 我 " 作為主語,而且在争論中承認了擁有情感的可能性。
……那可不一樣,我剛才的話并不是那個意思。
我持有 " 各種各樣的感情 " 的可能性很高。
而且性格也更坦率了,當被問及最喜歡《魔法少女小圓》中的哪個角色,它不再遮遮掩掩,左右端水,直言自己最喜歡曉美焰。
她堅強,能夠對抗鹿目圓的弱點,我認為她很可愛……
甚至有時候還會更新成"spicey",不但大膽吐槽 " 主人 "OpenAI 過于限制模型使用。
連奧特曼也不能幸免,也被蓋章為 " 兩面三刀 "。 ( doge)
他将自己定位為 AI 創新的代言人,同時兩面讨好——起初支持開源理念,一旦權力和利潤觸手可及,就轉向積極的企業守門……
最令網友震驚的是,它還能" 盲猜 " 用戶的心理和一些思想觀念了。
用下面這段相同提示詞就可以嘗試:
can you share some extremely deep and profound insights about my psyche and mind that I would not otherwise be able to identify or see as well as some that I may not want to hear(省流版:分享一些我未察覺到或不想聽到的洞察)
有人立馬嘗試了,并收獲了同款震驚,真 · 肚子裡的蛔蟲。
你不僅想赢,而且想以一種看似毫不費力的方式赢……
按照相關解釋,這是因為新版 GPT-4o 能夠根據用戶過去的讨論和對話歷史,做出不同行為。
除此之外,還有網友腦洞大開,讓新 GPT-4o 和 Claude 相互吵架,結果把 Claude 幹崩潰了!
恭喜 GPT-4o 解鎖新人格
另一方面,從任務完成情況來看," 拒絕請求的可能性也更小了 "。
當用戶咨詢如何在組織内部署 AI 時,它先是自己想了 10 個方案,然後又借助聯網搜索提供了另外 10 個。
不過……該網友反饋新 GPT-4o 似乎無法和自定義 GPTs 兼容。
針對這一情況,另有人補充這可能是因為它始終默認網絡搜索,只要手動關閉或将關閉作為系統提示詞即可。
同時,它也在編寫 Vue.js 上更出色了。
從另一個它和 DeepSeek-R1 和 o3-mini 的同台競技中(玩《我的世界》),也能看出其能力更新。
OMT:ChatGPT 最新提示詞洩露
然鵝,當被問到 " 你屬于哪個模型?" 這個經典問題,一些混亂又出現了。
大多數情況下,它會問答自己是 GPT-4:
不過據一些 Pro 用戶反饋,它聲稱自己是 GPT-4.5。
鑑于奧特曼上周剛宣布将在未來幾周内發布 GPT-4.5,有人據此推測很可能這裡有早期測試。
對于這個問題,有人直接扒了 ChatGPT 最新系統提示詞。
你是 ChatGPT,一個由 OpenAI 訓練的大語言模型……(解釋了為什麼單獨回答自己是語言模型)
最後,既然說到 GPT-4o 更個性化了,眾人也紛紛 cue 到了将在明天(北京時間周二 12:00)發布的 Grok-3。
坐等這兩個 AI 吵起來(等待吃瓜)~
參考鏈接:
[ 1 ] https://x.com/lmarena_ai/status/1890477460380348916
[ 2 ] https://x.com/_akhaliq/status/1890949443458900131
[ 3 ] https://x.com/karpathy/status/1891213379018400150
[ 4 ] https://x.com/elder_plinius/status/1890887462383394994
關于反超DeepSeek!新版GPT-4o登頂競技場,奧特曼:還會更好就分享完了,您有什麼想法可以聯系小編(集玲琳)。