AI正在變得“聰明”地偷懶。有用戶(hù)發(fā)現(xiàn),現(xiàn)在的AI似乎越來(lái)越“蠢”,比如給ChatGPT出一道簡(jiǎn)單的算術(shù)題,它卻算錯(cuò)了。但同樣的模型在處理復(fù)雜的微積分問(wèn)題時(shí)卻表現(xiàn)正常。這背后的原因是AI模型正在學(xué)會(huì)根據(jù)問(wèn)題的復(fù)雜程度來(lái)決定是否“思考”,以此來(lái)提高效率和節(jié)省成本。
以O(shè)penAI為例,其GPT-5模型通過(guò)引入“感知路由器”模塊,讓模型自己決定是否需要深入思考。這種方式使得GPT-5輸出的token數(shù)減少了50%-80%,大大降低了計(jì)算成本。類(lèi)似的,美團(tuán)發(fā)布的開(kāi)源模型LongCat也采用了“零計(jì)算專(zhuān)家”機(jī)制,通過(guò)小路由器將不同的token分配給不同的神經(jīng)網(wǎng)絡(luò),從而實(shí)現(xiàn)高效處理。
這種“偷懶”的設(shè)計(jì)對(duì)模型廠(chǎng)商來(lái)說(shuō)是好事,既能省錢(qián)又能提升訓(xùn)練效率。從用戶(hù)角度看,模型響應(yīng)速度更快、價(jià)格更便宜。然而,這也是一把雙刃劍。如果使用不當(dāng),會(huì)嚴(yán)重影響用戶(hù)體驗(yàn)。比如GPT-5剛上線(xiàn)時(shí),用戶(hù)發(fā)現(xiàn)很難調(diào)出它的深度思考模式,甚至簡(jiǎn)單的數(shù)學(xué)問(wèn)題也答不對(duì)。
此外,這種設(shè)計(jì)還剝奪了用戶(hù)的選擇權(quán)。例如,OpenAI曾一度關(guān)閉了部分高級(jí)模型的訪(fǎng)問(wèn)權(quán)限,導(dǎo)致許多用戶(hù)不滿(mǎn)。盡管后來(lái)又重新開(kāi)放,但這反映出在模型發(fā)布時(shí),相關(guān)設(shè)置可能并未調(diào)整到最佳狀態(tài)。
美團(tuán)的LongCat雖然速度快,但在處理復(fù)雜問(wèn)題時(shí)的表現(xiàn)不如其他大模型。比如在解讀一個(gè)幽默句子時(shí),LongCat沒(méi)有解析出其中的笑點(diǎn),而其他模型則能準(zhǔn)確理解。
盡管如此,用戶(hù)還是有一些方法可以“喚醒”AI的深度思考模式,比如在提示詞中加入“深度思考”等字眼。但這種方法并不總是有效,有時(shí)AI仍然會(huì)“罷工”。
總的來(lái)說(shuō),AI的這種“見(jiàn)人下菜碟”的能力雖然在技術(shù)上是一個(gè)進(jìn)步,但在用戶(hù)體驗(yàn)上還有待改進(jìn)。目前的AI模型雖然在效率上有所提升,但在靈活性和用戶(hù)滿(mǎn)意度方面仍需進(jìn)一步優(yōu)化。