當(dāng)前位置：首頁(yè) > 娛樂(lè) > AI進(jìn)化成人的速度可能比你想象的還慢正文

AI進(jìn)化成人的速度可能比你想象的還慢

時(shí)間：2025-11-13 20:34:32 來(lái)源：企業(yè)錄(www.qy6.com)-公司信息發(fā)布,網(wǎng)上買賣交易門戶

吹了這么久AI，進(jìn)化到底嘛時(shí)候才能超越人類?。砍扇?/p>

其實(shí)，圈內(nèi)人對(duì) AI 都有一個(gè)終極期望，速度可的還就是想象實(shí)現(xiàn) AGI （通用人工智能），說(shuō)白了，進(jìn)化就是成人造出“和人一樣聰明的AI”。

咱去馬斯克的速度可的還社交平臺(tái)上逛一圈，會(huì)發(fā)現(xiàn)他三句不離AGI。想象。進(jìn)化

OpenAI的成人奧特曼也在瘋狂預(yù)言，AGI即將到來(lái)，速度可的還也就這三五年的想象事兒了。

但這玩意，進(jìn)化到底咋衡量呢？成人俗話說(shuō)得好，人和人的速度可的還區(qū)別，比人和豬的區(qū)別還大。。到底啥水平，才能和人一樣聰明啊？

就連天天為了AGI吵架的大佬們，也根本說(shuō)不出來(lái)，AGI到底是個(gè)啥。。

合著都在這虛空對(duì)線是吧。

所以最近，一幫頂尖大佬看不下去了，幾十號(hào)人聯(lián)手發(fā)了篇論文，作者還是全明星陣容，包括圖靈獎(jiǎng)得主、谷歌前 CEO 等等，他們聯(lián)合起來(lái)，給出了目前為止第一個(gè) AGI 的量化定義。

他們也順便用GPT模型做了個(gè)測(cè)試，結(jié)果顯示，如果AGI是100分，GPT-5只有58分，不及格的水平。

這幫大佬的核心觀點(diǎn)是：AGI，就是一種能達(dá)到“一個(gè)受過(guò)良好教育的成年人”的能力的人工智能。

他們把心理學(xué)中一個(gè)最權(quán)威的理論，CHC 理論，給AI搬過(guò)來(lái)了。

CHC 的觀點(diǎn)，簡(jiǎn)單來(lái)說(shuō)，就是智力這玩意，不是一個(gè)單一的標(biāo)準(zhǔn)能衡量的東西，需要多維度考察。

說(shuō)白了，這就和高考差不多。一門課強(qiáng)根本不夠，你得門門都強(qiáng)，才證明你厲害。

所以，他們把 AI 的能力分成了 10 個(gè)核心能力，每個(gè)占了 10% 的分。它們分別是：

(K) 通識(shí)知識(shí)、(RW) 讀寫能力、(M) 數(shù)學(xué)能力、(R) 即時(shí)推理、(WM) 工作記憶、(V) 視覺處理、(A) 聽覺處理、(S) 反應(yīng)速度、(MS) 長(zhǎng)期記憶存儲(chǔ)、 (MR) 長(zhǎng)期記憶檢索。

這里面比較抽象的，可能就是工作記憶和長(zhǎng)期記憶了。

工作記憶，其實(shí)就是短期記憶，就是說(shuō)我剛剛提過(guò)的東西，你現(xiàn)在還能記得起來(lái)；而長(zhǎng)期記憶就是，AI通過(guò)跟我的對(duì)話，永久性學(xué)到了新東西，就像你上過(guò)學(xué)，即使你畢業(yè)了，“奇變偶不變”還刻在你DNA里一樣。。

每一種能力，他們都會(huì)叫AI測(cè)試，也就是寫他們精心準(zhǔn)備的測(cè)試題。比如(R) 即時(shí)推理這一塊，他們就專門找了些略微燒腦的問(wèn)題，比如：

“David認(rèn)識(shí)張先生的朋友Jack，Jack認(rèn)識(shí)David的朋友林女士。認(rèn)識(shí)Jack的人都有碩士學(xué)位，認(rèn)識(shí)林女士的人都是上海人。所以誰(shuí)既是上海人又有碩士學(xué)位？”（測(cè)試你是不是AI的時(shí)候到了）

他們找了OpenAI的兩員大將，GPT-4（2023）和 GPT-5（2025）來(lái)考試。結(jié)果，GPT-4 總分 27。 GPT-5 總分 58，合計(jì)也沒(méi)達(dá)到100分。

而且，咱來(lái)看看這成績(jī)單，有拉滿的，也有拉褲兜的，純純嚴(yán)重偏科。

比如 GPT-5，在通識(shí)(K)、讀寫(RW)、數(shù)學(xué)(M)這幾項(xiàng)上，直奔 9 分 10 分。所以說(shuō)目前來(lái)看，這幾項(xiàng)是AI的強(qiáng)項(xiàng)。

而 (MS) 長(zhǎng)期記憶存儲(chǔ)這項(xiàng)，GPT-5純純大光頭，3-4分的也有一堆。而GPT-4更不用說(shuō)，好幾項(xiàng)都是0分。

這一項(xiàng)其實(shí)考的是， AI 能不能持續(xù)學(xué)習(xí)獲得信息。因?yàn)檎撐陌l(fā)現(xiàn)，現(xiàn)在的 AI 根本就是個(gè)健忘癥，你今天教它的東西，明天它就忘得一干二凈。

他們做測(cè)試的方法，就是第一天跟AI講一些東西，然后第二天單開一個(gè)對(duì)話，再讓AI回想。

都不用猜，包想不起來(lái)的，大伙用過(guò)都知道，新開窗口就會(huì)清空記憶，那得分不是0就怪了。。

有的人會(huì)反駁，現(xiàn)在的AI早就有永久記憶了。但文章中其實(shí)譴責(zé)了這一點(diǎn)，現(xiàn)在AI的記憶，根本不是真正的記憶，他們只是在假裝自己有記憶。

作者們把這招叫做 “能力扭曲” ，即利用某些領(lǐng)域的優(yōu)勢(shì)來(lái)彌補(bǔ)其他領(lǐng)域的嚴(yán)重弱點(diǎn)，創(chuàng)造出一種“AI真有能力”的錯(cuò)覺。像現(xiàn)在的AI記憶，其實(shí)就是在瘋狂卷上下文長(zhǎng)度，或者通過(guò)知識(shí)庫(kù)來(lái)實(shí)現(xiàn)，實(shí)際上就是外掛，模型本身是一點(diǎn)記憶都沒(méi)有。

除了記憶力，長(zhǎng)期記憶檢索ai們也很拉，說(shuō)白了，就是檢測(cè)幻覺，別睜眼說(shuō)瞎話。

當(dāng)然，還有一項(xiàng)大伙都很拉的功能，(V) 視覺處理。 GPT-4是0分，而GPT-5進(jìn)化過(guò)后，也只來(lái)到4分。

它考的不是簡(jiǎn)單的“這圖里有啥”，考的是視覺推理。這對(duì)大模型來(lái)說(shuō)，可就難多了。比如說(shuō)，咱來(lái)試一道：

“下面這 4 個(gè) 2D 展開圖里，哪一個(gè)不能折成左邊那個(gè)立方體？”

還真有點(diǎn)難度，但我們?nèi)祟惿约铀妓?，還是能做出來(lái)的。我也去求證了下Gemini，結(jié)果確實(shí)是無(wú)法戰(zhàn)勝。

這也說(shuō)明，AI的眼睛和腦子，目前配合的不是很好，還沒(méi)有人類這種，邊看邊想就解決問(wèn)題的能力。

當(dāng)然，這份報(bào)告，肯定還是不夠完美的。除了這十個(gè)維度，人腦還有聯(lián)想等其他難以名狀的能力，人類可太復(fù)雜了，不是幾道題就能測(cè)明白的。

但它最大的價(jià)值，是給當(dāng)下的 AI 做了一次全面診斷：AI現(xiàn)在還是瘸腿，在一些人類最基本的認(rèn)知能力上，仍然有嚴(yán)重的缺陷。

而且，現(xiàn)在的 AI 廠商會(huì)還用一些捷徑，來(lái)掩蓋這些弱點(diǎn)。

因此，這篇文章也在給大家敲警鐘：這樣搞出來(lái)的 AI，是到不了 AGI 的。

但奧特曼在前一陣的直播里還說(shuō)了，AGI在路上了，我只能說(shuō)，走著瞧了。

當(dāng)然，俺覺得，這套標(biāo)準(zhǔn)本身也有不小的槽點(diǎn)。

人家AGI ，憑啥非要模仿人類??？它很可能是一種完全不同的智能。硬拿人類的 CHC 理論去套 AGI，是否有點(diǎn)刻舟求劍的意味了。

而且，這標(biāo)準(zhǔn)定得也有點(diǎn)高了。講實(shí)話，AI 要能達(dá)到一個(gè)“沒(méi)受過(guò)教育的小孩”的水平，就已經(jīng)無(wú)敵了。更別提有相當(dāng)一部分人類，自己都通不過(guò)這個(gè)測(cè)試。。

不過(guò)，不管怎么吐槽，有人提出標(biāo)準(zhǔn)就是好事。

它最大的意義，是終于把 AGI 這個(gè)話題從玄學(xué)的范疇，拉回到了一個(gè)可以討論的具體問(wèn)題上。

就算這個(gè)標(biāo)準(zhǔn)不完美，它也會(huì)逼著整個(gè)行業(yè)開始思考，我們到底在追求什么，以及我們到底缺了什么。

這總比大家都在吹牛，說(shuō)自己快要實(shí)現(xiàn) AGI要強(qiáng)得多。

實(shí)驗(yàn)室級(jí)純凈+天然礦化：知乎答主評(píng)審團(tuán)硬核拆解格力“6個(gè)9”鋅礦水凈水機(jī)

對(duì)標(biāo)《魔獸世界》騰訊《塔瑞斯世界》國(guó)際服今日停服上線剛1年

京東、美團(tuán)等8家平臺(tái)企業(yè) 被市監(jiān)總局指導(dǎo)發(fā)起食品安全管理公約

馬斯克可能真覺得造車沒(méi)意思了

10.98萬(wàn)起長(zhǎng)城歐拉首款SUV歐拉5開售：延續(xù)貓系設(shè)計(jì)

華為最美路由！華為路由X3 Pro日照金山即將發(fā)布：子母套裝1999元

下一代iPhone Air已在路上：蘋果死磕超薄賽道

20世紀(jì)最具影響力的科學(xué)家之一 DNA之父詹姆斯沃森去世：享年97歲

鴻蒙雙11福利承包你一年的高品質(zhì)“聽”與“看”

高通最強(qiáng)Soc！驍龍8 Elite Gen6前瞻：臺(tái)積電2nm工藝性能激進(jìn)

上一篇：百度正式發(fā)布小度AI眼鏡Pro：支持AI識(shí)物、AI翻譯 2299元
下一篇：百度李彥宏回應(yīng)AI泡沫爭(zhēng)議：健康的AI產(chǎn)業(yè)結(jié)構(gòu)應(yīng)是“倒金字塔”結(jié)構(gòu)

相關(guān)內(nèi)容

·網(wǎng)信辦通報(bào)涉退役軍人違法違規(guī)賬號(hào)處置典型案例
·月產(chǎn)能100萬(wàn)片！馬斯克要建超級(jí)晶圓廠
·淘寶閃購(gòu)加強(qiáng)騎士保障全國(guó)百萬(wàn)城市騎士免費(fèi)煥新！
·200TB以上的SSD被AI捧紅了 PLC閃存蠢蠢欲動(dòng)：扶我試試
·（走進(jìn)中國(guó)鄉(xiāng)村）西藏巴松措湖畔：農(nóng)牧民吃香“旅游飯”
·純血美國(guó)芯片馬斯克暗示將建巨型工廠：考慮與Intel合作
·“一帶一路”自然災(zāi)害防治和應(yīng)急管理國(guó)際合作機(jī)制擴(kuò)容
·轉(zhuǎn)發(fā)周知！這種羽絨服穿得越久危害越大
·AMD入門銳龍5 7500X3D正式發(fā)布！不到2000元：比245KF快13%
·3000元以下價(jià)位16GB顯卡唯一最優(yōu)選擇！AMD RX 9060 XT首發(fā)評(píng)測(cè)：追平RTX 5060 Ti 8GB 但顯存更大價(jià)格更便宜
·華為PC史上最重要的產(chǎn)品！首款鴻蒙電腦華為MateBook Pro評(píng)測(cè)
·這些電動(dòng)自行車12月1日后禁售：舊國(guó)標(biāo)、無(wú)有效3C證書一律禁止
·京東11.11打印設(shè)備銷量再創(chuàng)新高 3D打印產(chǎn)品成交量同比增長(zhǎng)超110％
·女主播模仿勞榮枝“求關(guān)注” 引眾怒后抖音回應(yīng)
·電商128元買128GB內(nèi)存真有這種好事嗎
·特斯拉滿血FSD即將入華！馬斯克為了天價(jià)薪酬拼了

最新內(nèi)容

推薦內(nèi)容

熱點(diǎn)內(nèi)容

亚洲精品三,久久久久欧美,日本九九热,久久久鲁,天堂一区,天堂精品久久,亚洲久久

AI進(jìn)化成人的速度 可能比你想象的還慢

AI進(jìn)化成人的速度可能比你想象的還慢