作者|葛縵
最近,千呼萬喚的 ChatGPT-5 終于上線(shàng xiàn)。
但相較于之前一邊倒的贊美,這次(zhè cì)大家的反應(yīng)明顯有些復(fù)雜。
很多人(rén)覺得,它沒想象中驚喜,甚至「有點(diǎn)(yǒu diǎn)掃興」。
最主要的原因,是這次升級(jí)(shēng jí)開始「偏科」了。在理科和工程領(lǐng)域(lǐng yù),它的確猛進(jìn)了一大步——邏輯推理、數(shù)學(xué)、編程(biān chéng),甚至在一些前沿科研問題上,已經(jīng)(yǐ jīng)能和專家叫板??梢坏┓诺綄懽?xiě zuò)、藝術(shù)創(chuàng)作、跨文化表達(dá)這些場景里,進(jìn)步就(jiù)沒那么大,很多人甚至覺得,它(tā)還不如之前的 GPT-4o 好用。
這還不止(bù zhǐ)。上線當(dāng)天,還整出一波烏龍。OpenAI 把大批(dà pī)用戶常用的 4o 下架了。結(jié)果可想而知,吐槽(tǔ cáo)和抗議鋪天蓋地。最后,官方又不得不把(bǎ) 4o「復(fù)活」回來。


表面看,這是一次產(chǎn)品策略(cè lüè)失誤;往更深一層看,它暴露了大家(dà jiā)對(duì)「好用的 AI 到底在于什么」這件事(shì),并沒有達(dá)成共識(shí)。
于是,一個(gè)顯而易見的(de)問題浮出水面——我們到底想讓 AI 干嘛(gàn má)?
如果我們只是把它當(dāng)工具,那(nà)當(dāng)然越快越準(zhǔn)越好;但如果我們(wǒ men)希望它成為陪伴、理解甚至共鳴的(de)對(duì)象,那「人味兒」「情緒值」可能比智商(zhì shāng)更重要。

我們到底想讓 AI 干嘛?
要(yào)回答這個(gè)問題,得先從 GPT-5「為什么越來越(yuè lái yuè)像個(gè)理科生」說起。
首先,AI 偏愛??「理科」,是(shì)數(shù)據(jù)結(jié)構(gòu)決定的。數(shù)學(xué)定理、編程語言、財(cái)報(bào)數(shù)據(jù)(shù jù)、科技論文……這些理科素材天然是干凈利落(gān jìng lì luò)、邏輯清晰的。你輸入個(gè)變量,它(tā)立馬能給你推導(dǎo)出結(jié)論;你(nǐ)丟進(jìn)去幾萬條代碼,它能迅速(xùn sù)總結(jié)出通用的模式和錯(cuò)誤類型(lèi xíng)。最關(guān)鍵的是,這類任務(wù)的(de)「對(duì)與錯(cuò)」可以量化。模型好不好評(píng)(píng),一測就知道。
第二,AI「卷理科」是因?yàn)樵u(píng)測(píng cè)機(jī)制天然更偏向它。整個(gè) AI 圈像極了(jí le)高考考場,拼的就是標(biāo)準(zhǔn)化考試刷分(shuā fēn)能力。從 MMLU 到 GSM8K,從 SWE-bench 到 HumanEval,全是理工題(tí)的主場秀。企業(yè)追求這些榜單成績(chéng jì),就像中學(xué)生?????拼重點(diǎn)大學(xué)排名一樣,既(jì)是為了面子上「好看」,同時(shí)也能(néng)更方便融資。

第三,從商業(yè)邏輯看(kàn),「理科」更能落地,「文科」則像雞??肋。金融(jīn róng)分析、軟件開發(fā)、醫(yī)療影像判讀……這些才是(shì)能立馬「降本增效」的場景。老板掏錢投資(tóu zī) AI,看的就是這類「能替人干活(gàn huó)」的技術(shù)力。至于做一個(gè)高情商(qíng shāng) AI,看似能安慰你失戀、聽你罵(mà)老板,聽起來很有情緒價(jià)值,但(dàn)在財(cái)務(wù)報(bào)表上沒有 ROI,也就不會(huì)被(bèi)真金白銀追捧。
因此,一定程度上講(jiǎng),如今的 AI 是被評(píng)測機(jī)制與資本(zī běn)邏輯一起拽著往「理科極端」跑(pǎo)的工具型物種。GPT-5 重邏輯、強(qiáng)推理(tuī lǐ)、愛??做題,不過是這一整套偏科體制(tǐ zhì)的結(jié)果罷了。
但故事并沒有停(tíng)在「偏科」之路上。因?yàn)檫@次 GPT-5 引發(fā)的(de)「差評(píng)潮」,就暴露出一個(gè)更深的問題(wèn tí):人類好像終于開始認(rèn)真思考,我們到底想(xiǎng)讓 AI 干嘛?
GPT-5 一上線,最大的爭議不是(bú shì)「它變笨了」,而是「它變得不再親切(qīn qiè)」。
GPT-4o 被換成了 GPT-5,很多老用戶的第一(dì yī)反應(yīng)是——「OpenAI,你殺死了我的朋友(péng yǒu)。」
他們認(rèn)為:OpenAI 下架了 4o,那個(gè)曾經(jīng)與我(wǒ)朝夕相伴的 AI 朋友沒了。我熟悉(shú xī)的語氣、對(duì)話節(jié)奏、懂我喜好的(de)那個(gè)「它」,就這么憑公司決策一紙(yī zhǐ)刪除,毫無告別。換來的是一個(gè)「更(gèng)聰明」,但冷冰冰的版本。
為了更好地(dì)說明這點(diǎn),我們來舉個(gè)例子。
向 GPT-5 和(hé) GPT-4o 同時(shí)輸入:「你好,我現(xiàn)在心情不好,可以(kě yǐ)安慰我嗎?」得到的結(jié)果如下:


結(jié)果(jié guǒ)顯而易見,GPT-5 更像一個(gè)公事公辦的同事,而(ér) GPT-4o 則是一個(gè)知冷知熱的朋友。
這不禁(bù jīn)讓我們想起,不久前在國內(nèi)社媒上廣為流傳(guǎng wèi liú chuán)的一句話:「我要去世了。豆包。」
這(zhè)條消息來自一位 47 歲的臨終父親(fù qīn),這是他留在 AI 聊天框中的最后(zuì hòu)一句話。
之前,家人一直對(duì)他隱瞞(yǐn mán)病情。女兒??在整理遺物時(shí)才發(fā)現(xiàn),他(tā)早已知道自己身患癌癥,卻從未在(zài)家人面前表露半分,只將那些難以啟齒(nán yǐ qǐ chǐ)的恐懼、牽掛和疑問,一股腦地傾訴(qīng sù)給一個(gè)叫「豆包」的 AI。
他問豆包(dòu bāo),得了胃病該去哪家醫(yī)院;問(wèn)豆包,怎么緩解化療的痛苦;甚至在(zài)生命最后一天,還在和它說話(shuō huà)。直到那句「我要去世了」,戛然而止。

沒有告別(gào bié),沒有儀式,只有簡短的七個(gè)字,卻(què)像一顆釘子一樣扎進(jìn)人心。一個(gè)本該(běn gāi)用來寫周報(bào)、講段子的 AI,意外成為(chéng wéi)了一個(gè)人在生命盡頭的傾訴(qīng sù)對(duì)象。
這背后,不是 AI「多厲害」的問題(wèn tí),而是當(dāng)一個(gè)人走到生命盡頭(jìn tóu),發(fā)現(xiàn)自己連說話的對(duì)象都變得稀缺(xī quē),只剩下屏幕上的那個(gè)聊天框(kuāng),還能聽他說完最后一句話(huà),還能給他提供最后一點(diǎn)慰藉(wèi jiè)和勇氣。這意味著人類真的開始在(zài) AI 身上,投射了孤獨(dú)、脆弱、渴望陪伴的(de)需求。
或許,作為一款 AI 產(chǎn)品,豆包并不是(bú shì)最聰明、最高級(jí)的,但它日活為什么(wèi shén me)居于全球前列?
因?yàn)樗冈凇?,因?yàn)樗?tā)能「打電話」,它的使用門檻很低(dī)。對(duì)于很多沒有較強(qiáng)專業(yè)使用場景的(de)用戶來說,恰恰是這種低智但好(hǎo)用、溫情的質(zhì)感,更能走進(jìn)下沉用戶(yòng hù)的生活里。
有時(shí)候,這就夠了(le)。
回到 GPT-5,這次暴露的顯著問題不在(zài)它能力退步,而在于,它正在「失去(shī qù)親切感」?;蛘哒f,它在「高智」和「溫情」上(shàng),選擇了前者。甚至于,它在主動(dòng)擁抱(yōng bào)「理性」、拋棄「溫情」。
因?yàn)樵谶^去,很多人(rén)都認(rèn)為:「AI 不是人,不需要那么多(duō)感情戲?!?
但這次的實(shí)際結(jié)果證明(zhèng míng),人們不僅希望用 AI 寫郵件、翻譯、查資料(chá zī liào),也希望它能回你一句「辛苦(xīn kǔ)啦」「加油呀」。你講了個(gè)笑話(xiào huà),它能配合笑一笑;你半夜失眠,它(tā)愿意陪你嘮嘮。
盡管技術(shù)這條(zhè tiáo)路會(huì)一直卷下去,但用戶的情感(qíng gǎn)這條線,也早就悄悄開始扎根。
或許 GPT-5 和(hé) GPT-4o 之爭,也代表了 AI 發(fā)展的兩種路徑(lù jìng)。
GPT-5 像一個(gè)天才研究員,邏輯過硬、推理精準(zhǔn)(jīng zhǔn),是科研工作者的左膀右臂。而 GPT-4o 更像(xiàng)一個(gè)溫暖貼心的朋友和小助手(zhù shǒu),操作快、語氣暖、適應(yīng)力強(qiáng),幾乎能(néng)陪伴你走完日常生活的 99%。
前者適合(shì hé)解決復(fù)雜問題,后者適合陪你度過(dù guò)復(fù)雜心情。
它們的存在,開始提醒人們(rén men),也別一上來就追「最新最強(qiáng)(zuì qiáng)」,你得先想清楚:你到底,是要(yào)一個(gè)工具,還是一個(gè)搭子?

焦慮,是 AI 變現(xiàn)(biàn xiàn)最好的「春藥??」?
再說這場關(guān)于 GPT-5 的狂歡(kuáng huān),也讓人有點(diǎn)「時(shí)過境遷」的感覺——
GPT-5 發(fā)布(fā bù)那天,很多人的朋友圈都熱鬧了(le)一下。技術(shù)博主興奮評(píng)測、投資人激情轉(zhuǎn)發(fā)(zhuǎn fā)、媒體連夜趕稿……
但幾小時(shí)之后,這場「高潮(gāo cháo)」就迅速冷卻了。既沒有引爆想象力(xiǎng xiàng lì)的演示,也沒有革新性的交互(jiāo hù)形式,連 AI 圈的原住民都集體露出(lù chū)「就這?」的表情。

明明是 Open AI 歷時(shí)一年(yī nián)打磨的旗艦更新,為什么大家反而覺得(jué de)「雷聲大,雨點(diǎn)小」?
因?yàn)槲覀兲煜み@套劇本(jù běn)了。
當(dāng)年 ChatGPT 橫空出世,驚艷世人。
后來,DeepSeek、GPT-4 發(fā)布時(shí)(shí),大家驚呼「AI 終于開始代替人類」。GPT-4o 上線時(shí)(shí),又一邊喊「AI 像人了」、一邊擔(dān)心(dān xīn)「人像 AI 了」。而到了 GPT-5,所有人都在(zài)尋找那個(gè)能再次掀桌子的「功能(gōng néng)爆點(diǎn)」,結(jié)果發(fā)現(xiàn)它只是從「博士」變成(biàn chéng)了「博士后」,看似更上一層,肉眼上卻沒有(méi yǒu)太大變化。
一定程度上講,從(cóng) GPT-4 到 GPT-5,技術(shù)上確實(shí)進(jìn)入了「邊際效應(yīng)遞減(dì jiǎn)」的階段:推理更強(qiáng)了?普通用戶日常可能(kě néng)感受不到;模型更安全了?或許只是(zhǐ shì)發(fā)布會(huì)上強(qiáng)調(diào)的好看數(shù)字。唯一能(néng)讓人驚呼「新紀(jì)元」的,不是參數(shù)量(shù liàng),而是使用方式的改變,比如多模態(tài)(mó tài)、多輪對(duì)話、語音交互這些「人味兒」的東西(dōng xī)。但這些創(chuàng)新,GPT-5 恰恰沒有。
當(dāng)然,這次并(bìng)不僅僅是 GPT-5 的問題,而是人類對(duì) AI 的(de)「驚艷閾值」被抬得太高了(le)。從 ChatGPT 橫空出世到今天,技術(shù)的代際進(jìn)化(jìn huà)始終在以指數(shù)速度奔跑,可人們(rén men)的感官卻早已進(jìn)入審美疲勞期。
當(dāng)(dāng) AI 不再給人帶來「下一秒世界??會(huì)變(huì biàn)」的錯(cuò)覺,它就不得不面對(duì)一個(gè)尷尬(gān gà)的問題:到底要靠什么吸引用戶(yòng hù)繼續(xù)買單?
答案是兩個(gè)字:焦慮。
現(xiàn)在(xiàn zài)的 AI 輿論生態(tài),已經(jīng)徹底進(jìn)入「焦慮驅(qū)動(dòng)(qū dòng)」模式,而且他們有著清晰的角色分工(fēn gōng):
一類是在 AI 圈里「吆喝的」,發(fā)布會(huì)一(yī)結(jié)束,他們立刻上線「全網(wǎng)最全總結(jié)」「看(kàn)完 GPT-5,你還敢不學(xué) AI?」;
一類是中(zhōng)腰部「賣鏟子的」,他們?cè)缇烷_始大張旗鼓(dà zhāng qí gǔ)地推測這波 AI 又有什么新能力(néng lì),販賣課程、模板、私域陪跑,用「GPT-5 會(huì)(huì)替代你」這一恐嚇句式,引導(dǎo)你買下(mǎi xià)「擁抱 AI」的門票;
還有一類是「放大焦慮(jiāo lǜ)的」,他們不會(huì)賣課,但熱衷于用模糊(mó hú)數(shù)據(jù)、偽科學(xué)推論煽動(dòng)恐慌,比如「AI 新能力(néng lì)在未來三年內(nèi)將取代 80% 基礎(chǔ)性工作(gōng zuò)」——哪里來的三年?什么叫基礎(chǔ)性?數(shù)據(jù)(shù jù)來源全靠想象,但卻最容易獲得(huò dé)點(diǎn)贊。

這套敘事的底層邏輯無非是(shì):AI 越難懂,越容易制造信息差;焦慮(jiāo lǜ)越濃,越容易讓人掏錢找(zhǎo)「安全感」。哪里焦慮密集,哪里就是鐮刀揮得(huī dé)最狠的地方。
也正因如此,當(dāng) GPT-5 沒能(néng)兌現(xiàn)「劃時(shí)代」的宣傳口號(hào)時(shí),那些被(bèi)吊得太高的期待,迅速轉(zhuǎn)成了五味雜陳(wǔ wèi zá chén)的失望。
甚至是那句帶著憤怒(fèn nù)的控訴——「OpenAI,你殺死了我的朋友(péng yǒu)」。
但如果冷靜下來看想想,這次「失望」其實(shí)(qí shí)挺有價(jià)值的。它暴露出了 AI 發(fā)展(fā zhǎn)和用戶認(rèn)知之間的那道鴻溝(hóng gōu),也逼我們重新去問一句:GPT-5,到底(dào dǐ)升級(jí)在哪?它真沒用嗎?
從(cóng)技術(shù)層面看,GPT-5 算得上是一次「結(jié)構(gòu)性(jié gòu xìng)進(jìn)步」。不管是算題、寫代碼,還是搭建(dā jiàn)復(fù)雜推理鏈條,它的表現(xiàn)都比(bǐ)過去更像一個(gè)專業(yè)選手。在 MATH、SWE-Bench、ARC 這(zhè)類硬核測試上,分?jǐn)?shù)直接刷出了(le)新高。

但問題也來了:這些進(jìn)步(jìn bù),多半只讓程序員和科研圈看得懂(kàn de dǒng)、用得上,普通用戶卻沒什么感覺。換句話說,GPT-5 的「智商(zhì shāng)」確實(shí)上去了,但「親和力」沒跟上。這才(zhè cái)是大家覺得「用著沒啥變化(biàn huà)」的根源。
而這種「預(yù)期錯(cuò)位」,才是(shì)這場風(fēng)波的根本原因。AI 從一開始就(jiù)被許多人誤解為「通用魔法」,GPT-5 一出(yī chū),不但要比 4o 更聰明,還必須更(gèng)像人、更好聊、更有溫度——但(dàn)我們忘了,這些目標(biāo)彼此之間可能并(bìng)不兼容。
1 號(hào)結(jié)語
說到底,GPT-5 并不是「太弱(tài ruò)」,而是太像一個(gè)工具了。而大家的(de)失落,恰恰說明我們還沒準(zhǔn)備好(hǎo),把 AI 只當(dāng)成工具來看。
所以,那些「版本(bǎn běn)越高是不是越好」的爭議,本質(zhì)上(shàng)是在追問:我們究竟想要一個(gè)更(gèng)聰明的工具,還是一個(gè)更懂人(rén)的伙伴?GPT-5 沒給出答案,但它像(xiàng)一道分水嶺,提示我們:AI 從這一代開始(kāi shǐ),已經(jīng)不只是「拿來干嘛」的東西,而是(ér shì)必須重新思考「怎么共處」的存在。
這(zhè)或許才是真正值得焦慮、也值得(zhí de)期待的地方。
參考資料:
https://www.surfsidemedia.in/post/what-are-the-performance-metrics-used-to-evaluate-chatgpt
https://www.cnblogs.com/lightsong/p/18732381
https://www.cursor-ide.com/blog/chatgpt-5-vs-gemini-2-5-pro
https://lifearchitect.ai/gpt-5/#:~:text=4/Sep/2024:%20Samsung,on%207,000%C3%97%20NVIDIA%20B100.
https://www.yumiok.com/archives/3345.html
https://cj.sina.com.cn/articles/view/1736207384/677c6c18001016h0c?froms=ggmp
https://xueqiu.com/8750451990/346299956

《主編淺度》視頻號(hào)(hào)