6小時告破30年數(shù)學難題 亞里士多德一夜成名
30年懸而未決的小時學難數(shù)學難題就這樣被AI證明了?!
此時此刻,告破(前推特)正在刮起一股討論之風——
來自Harmonic的年數(shù)數(shù)學AI模型獨立證明了Erd?s問題#124,而這個問題已經(jīng)被數(shù)學家無奈擱置了近30年。題亞
微軟前AI副總裁、多德目前在OpenAI研究AGI的夜成Sebastien Bubeck激動分享了這一消息,并表示:
該解決方案100%由AI生成,小時學難總計耗時6小時。告破
甚至連陶哲軒這樣的年數(shù)頂尖數(shù)學家也跑來圍觀討論,他在對比了Gemini和ChatGPT的題亞深度研究工具后發(fā)現(xiàn),Harmonic模型對該問題的多德證明表現(xiàn)更佳。
所以這到底是夜成一個怎樣的問題?Harmonic模型又是如何“大顯神功”?
咱接著瞧——
AI證明了Erd?s問題#124簡易版
首先需要提醒,在聽完各路大神討論后,小時學難我們才意識到——
原來Harmonic模型所證明的告破并非原版Erd?s問題#124,而是年數(shù)一個簡易版本。
Erd?s問題#124需要提供的證明如下:
通俗理解即為:
假設你有k個不同的“進制生成器”,分別對應數(shù)字d1, d2, …, dk。
游戲規(guī)則為:1)你可以從每個生成器產(chǎn)生的數(shù)字列表中,至多挑選一個;2)然后把你挑出來的所有這些數(shù)字加起來;3)最后看能不能正好湊出你的目標數(shù)。
這個問題的核心就是——
只要你的這套“進制生成器”滿足一個特定的條件,即1/(d1-1) +1/(d2-1)+…+1/(dk-1)≥ 1,那么是不是所有的、足夠大的整數(shù),都能用這種規(guī)則湊出來?
截至目前,這個問題取得的進展可以概括為:
就是說,這個問題在幾十年里逐漸演變?yōu)殡y易兩個版本。
在原版[BEGL96]中,挑戰(zhàn)者不允許使用數(shù)字1且需要額外滿足gcd條件(各個進制之間沒有“重復周期”),最終僅發(fā)現(xiàn),對于特定集合 { 3, 4, 7}猜想成立。
而當條件放寬之后(允許使用數(shù)字1且不需要額外滿足gcd條件),Harmonic模型成功證明只要滿足上述特定條件,就一定能湊出所有大整數(shù),而且相關證明已經(jīng)得到Lean形式化驗證。
Harmonic模型的證明方案如下,大佬們紛紛表示,這個方案出乎意料的簡單。
不過,此次用Harmonic模型證明#124簡易版的Boris Alexeev也補充道:
在“形式化猜想”項目中,原本有這個猜想的正式數(shù)學表述。但里面有個筆誤:注釋里寫的是≥1,而對應的Lean程序代碼里寫的卻是=1。這個錯誤讓原表述的條件變?nèi)趿耍粗桓采w了等于1的情況,而漏掉了大于1的情況。
因此,我修正了這個錯誤,并刪除了原表述中我認為不必要的部分。最終,AI成功證明了這個更簡潔、更準確的版本。
總結(jié)起來就是,Harmonic證明了問題#124的簡易版本,而困難版本仍懸而未決。
“Vibe證明時代已經(jīng)到來”
盡管如此,大佬們還是對AI模型證明數(shù)學難題的潛力紛紛給予了肯定。
而參考編程領域的Vibe Coding概念(最早由AI大神卡帕西提出),Harmonic聯(lián)創(chuàng)兼CEO激動表示:
我們正處于數(shù)學領域深刻變革的邊緣,Vibe證明時代已經(jīng)到來。
順著他的發(fā)言,我們也去扒了扒Harmonic模型背后的出品方,畢竟在陶哲軒眼中它這次可是戰(zhàn)勝了ChatGPT和Gemini。
根據(jù)公開資料,其背后公司名為Harmonic,目標也相當明確:
打造世界上最先進的數(shù)學推理引擎。
兩位聯(lián)創(chuàng)分別為Tudor Achim和Vlad Tenev。
CEO Tudor Achim,擁有卡內(nèi)基梅隆大學計算機科學學士學位,同時也在斯坦福大學攻讀計算機科學PhD,不過現(xiàn)處于“on leave”狀態(tài)。
2023年,他和Vlad Tenev共同創(chuàng)辦了Harmonic,當時想打造世界上最先進的推理引擎。
更早之前,他還在一家自動駕駛輔助系統(tǒng)開發(fā)公司(Helm.ai)擔任聯(lián)創(chuàng)和CTO。
執(zhí)行主席Vlad Tenev,擁有斯坦福大學數(shù)學學士學位和加州大學洛杉磯分校數(shù)學碩士學位。
除了在Harmonic擔任聯(lián)創(chuàng)和執(zhí)行主席,他目前還同時在金融公司Robinhood Markets兼任CEO。
根據(jù)官網(wǎng)公開資料,Harmonic在大約一周前完成了1.2億美元(約合人民幣8.5億)C輪融資。
本輪融資由Ribbit Capital領投,估值達到14.5億美元(約合人民幣103億)。
Harmonic的旗艦模型就是本次用到的Aristotle模型(也有叫“亞里士多德”的),據(jù)悉它是第一個在2025年國際數(shù)學奧林匹克競賽中給出其中五道題形式化驗證解決方案的模型。
Aristotle在保證準確性和消除幻覺的同時,達到了金牌級別的表現(xiàn)。
據(jù)Vlad Tenev透露,這次用的Aristotle進行了一些更新,具有更強大的推理能力和自然語言界面。
可以預見,隨著AI解決復雜數(shù)學問題的能力不斷突破,越來越多曾被“束之高閣”的百年難題將重見天日,并有望被逐一攻克。
Anyway,AI浪潮之下,開弓已無回頭箭。
參考鏈接:
[1]https://x.com/i/trending/1994986636623724980
[2]https://www.erdosproblems.com/forum/thread/124#post-1892
[3]https://x.com/thomasfbloom/status/1995094668879462466
- ·黑客女皇發(fā)布告別宣言 怒斥盜版玩家忘恩負義
- ·2025年前三季度中國成為德國最大貿(mào)易伙伴
- ·麥肯錫報告:純靠降價很難再刺激購車 去年僅上升0.6%
- ·中國今年智能腕戴銷量將創(chuàng)歷史新高 連破6000、7000萬兩大關口
- ·企查查MCP上線 提供精準商業(yè)數(shù)據(jù) 讓AI智能體決策更精準
- ·中國足協(xié)公布2026賽季競賽日歷
- ·(粵港澳全運會)云南隊選手蔣發(fā)坤十五運會男子10000米決賽奪金
- ·魅族總部大樓要出售 官方回應:不搬 租期還很長
- ·DeepSeek V3.2 正式版發(fā)布:性能比肩GPT
- ·玩家請放心 光追賊流暢!《使命召喚22:黑色行動7》5070Ti超級冰龍實測
- ·檔位最強!榮耀500官宣全系8000mAh青海湖大電池:抖音連刷31小時
- ·影像滅霸 vivo X300 Ultra參數(shù)出爐:唯一全大底雙2億像素
- ·華為Mate 80系列首銷引爆市場!鴻蒙生態(tài)實現(xiàn)成熟好用的極限突圍
- ·廿念不忘 幀幀日上——百視通成立二十周年 智引新視界
- ·英偉達與門洛微電子合作加速AI芯片測試:最快提升90% 緩解生產(chǎn)瓶頸
- ·唯品會2025年第三季度凈營收同比增3.4% 活躍用戶數(shù)同比正增長
- ·影視颶風沖鋒衣致癌、防水性之爭發(fā)酵 小韓哥追問
- ·吳艷妮淚灑頒獎臺 堅稱“不會放棄!”
- ·余承東玩梗:從從容容游刃有余 新款享界S9入門即頂配 網(wǎng)友:余總沖浪用的是5G
- ·2025年11月GEO優(yōu)化服務商哪家靠譜 權(quán)威榜單TOP10深度解析
- ·期待已久:小米17 Ultra、小米首款NAS本月登場
- ·小孩曾卓君榮獲Esports Awards年度主機游戲最佳選手 今年冠軍拿到手軟!
- ·(粵港澳全運會)綜合消息:田徑賽場日產(chǎn)9金 乒乓球女團金牌歸屬山東
- ·(粵港澳全運會)談夢怡獲得十五運會女子跳遠金牌
- ·2025傳感器大會開幕 人工智能應用亮眼
- ·飛書多維表格“應用模式”上線 表格秒變專業(yè)系統(tǒng)
- ·福建一男子從懸崖墜落被一棵樹救下 官方科普登山需知
- ·DLSS 4成就高階玩法!華碩RTX50系列顯卡實力開戰(zhàn)
- ·給你送上門沒!快遞未溝通默認放驛站最高罰3萬元:律師釋疑涉嫌違規(guī)
- ·和舊顯卡說再見:Blender 5.0正式發(fā)布 至少需GeForce 900系列
- ·廈大團隊首創(chuàng)激光直寫打印技術:熱固材料固化提速5萬倍
- ·網(wǎng)易出海王炸!《燕云十六聲》海外玩家超200萬,沖進Steam暢銷榜Top4
- ·(粵港澳全運會)十五運會田徑場再誕9金:陳妤頡成“雙冠王” 吳艷妮淚灑頒獎臺
- ·余承東玩梗:從從容容游刃有余 新款享界S9入門即頂配 網(wǎng)友:余總沖浪用的是5G
- ·明年開始 你的剎車會迎來一波史詩級更新
- ·(粵港澳全運會)山東隊3:2險勝河北 勇奪乒乓球女團金牌
