6小時告破30年數學難題 亞里士多德一夜成名
30年懸而未決的小時學難數學難題就這樣被AI證明了?!
此時此刻,告破(前推特)正在刮起一股討論之風——
來自Harmonic的年數數學AI模型獨立證明了Erd?s問題#124,而這個問題已經被數學家無奈擱置了近30年。題亞
微軟前AI副總裁、多德目前在OpenAI研究AGI的夜成Sebastien Bubeck激動分享了這一消息,并表示:
該解決方案100%由AI生成,小時學難總計耗時6小時。告破
甚至連陶哲軒這樣的年數頂尖數學家也跑來圍觀討論,他在對比了Gemini和ChatGPT的題亞深度研究工具后發(fā)現,Harmonic模型對該問題的多德證明表現更佳。
所以這到底是夜成一個怎樣的問題?Harmonic模型又是如何“大顯神功”?
咱接著瞧——
AI證明了Erd?s問題#124簡易版
首先需要提醒,在聽完各路大神討論后,小時學難我們才意識到——
原來Harmonic模型所證明的告破并非原版Erd?s問題#124,而是年數一個簡易版本。
Erd?s問題#124需要提供的證明如下:
通俗理解即為:
假設你有k個不同的“進制生成器”,分別對應數字d1, d2, …, dk。
游戲規(guī)則為:1)你可以從每個生成器產生的數字列表中,至多挑選一個;2)然后把你挑出來的所有這些數字加起來;3)最后看能不能正好湊出你的目標數。
這個問題的核心就是——
只要你的這套“進制生成器”滿足一個特定的條件,即1/(d1-1) +1/(d2-1)+…+1/(dk-1)≥ 1,那么是不是所有的、足夠大的整數,都能用這種規(guī)則湊出來?
截至目前,這個問題取得的進展可以概括為:
就是說,這個問題在幾十年里逐漸演變?yōu)殡y易兩個版本。
在原版[BEGL96]中,挑戰(zhàn)者不允許使用數字1且需要額外滿足gcd條件(各個進制之間沒有“重復周期”),最終僅發(fā)現,對于特定集合 { 3, 4, 7}猜想成立。
而當條件放寬之后(允許使用數字1且不需要額外滿足gcd條件),Harmonic模型成功證明只要滿足上述特定條件,就一定能湊出所有大整數,而且相關證明已經得到Lean形式化驗證。
Harmonic模型的證明方案如下,大佬們紛紛表示,這個方案出乎意料的簡單。
不過,此次用Harmonic模型證明#124簡易版的Boris Alexeev也補充道:
在“形式化猜想”項目中,原本有這個猜想的正式數學表述。但里面有個筆誤:注釋里寫的是≥1,而對應的Lean程序代碼里寫的卻是=1。這個錯誤讓原表述的條件變弱了,即只覆蓋了等于1的情況,而漏掉了大于1的情況。
因此,我修正了這個錯誤,并刪除了原表述中我認為不必要的部分。最終,AI成功證明了這個更簡潔、更準確的版本。
總結起來就是,Harmonic證明了問題#124的簡易版本,而困難版本仍懸而未決。
“Vibe證明時代已經到來”
盡管如此,大佬們還是對AI模型證明數學難題的潛力紛紛給予了肯定。
而參考編程領域的Vibe Coding概念(最早由AI大神卡帕西提出),Harmonic聯創(chuàng)兼CEO激動表示:
我們正處于數學領域深刻變革的邊緣,Vibe證明時代已經到來。
順著他的發(fā)言,我們也去扒了扒Harmonic模型背后的出品方,畢竟在陶哲軒眼中它這次可是戰(zhàn)勝了ChatGPT和Gemini。
根據公開資料,其背后公司名為Harmonic,目標也相當明確:
打造世界上最先進的數學推理引擎。
兩位聯創(chuàng)分別為Tudor Achim和Vlad Tenev。
CEO Tudor Achim,擁有卡內基梅隆大學計算機科學學士學位,同時也在斯坦福大學攻讀計算機科學PhD,不過現處于“on leave”狀態(tài)。
2023年,他和Vlad Tenev共同創(chuàng)辦了Harmonic,當時想打造世界上最先進的推理引擎。
更早之前,他還在一家自動駕駛輔助系統(tǒng)開發(fā)公司(Helm.ai)擔任聯創(chuàng)和CTO。
執(zhí)行主席Vlad Tenev,擁有斯坦福大學數學學士學位和加州大學洛杉磯分校數學碩士學位。
除了在Harmonic擔任聯創(chuàng)和執(zhí)行主席,他目前還同時在金融公司Robinhood Markets兼任CEO。
根據官網公開資料,Harmonic在大約一周前完成了1.2億美元(約合人民幣8.5億)C輪融資。
本輪融資由Ribbit Capital領投,估值達到14.5億美元(約合人民幣103億)。
Harmonic的旗艦模型就是本次用到的Aristotle模型(也有叫“亞里士多德”的),據悉它是第一個在2025年國際數學奧林匹克競賽中給出其中五道題形式化驗證解決方案的模型。
Aristotle在保證準確性和消除幻覺的同時,達到了金牌級別的表現。
據Vlad Tenev透露,這次用的Aristotle進行了一些更新,具有更強大的推理能力和自然語言界面。
可以預見,隨著AI解決復雜數學問題的能力不斷突破,越來越多曾被“束之高閣”的百年難題將重見天日,并有望被逐一攻克。
Anyway,AI浪潮之下,開弓已無回頭箭。
參考鏈接:
[1]https://x.com/i/trending/1994986636623724980
[2]https://www.erdosproblems.com/forum/thread/124#post-1892
[3]https://x.com/thomasfbloom/status/1995094668879462466
- ·貨車龜速行駛后車追尾司機死亡!交警提醒:開車不是越慢越安全
- ·多色多款可選!三槍中筒運動襪子5雙到手10.9元
- ·麥肯錫報告:純靠降價很難再刺激購車 去年僅上升0.6%
- ·支持120GB超大可變共享顯存,英特爾酷睿Ultra 285H拓展端側AI新境界
- ·京東、美團、阿里外賣大戰(zhàn):半年燒了800億!你薅了多少羊毛?
- ·《使命召喚22》畫質提升明顯 華碩RTX50系顯卡震撼開戰(zhàn)
- ·中國足協(xié)公布2026賽季競賽日歷
- ·超擎數智亮相 NVIDIA 中國開發(fā)者日2025 攜手開發(fā)者 探索AI無限前景!
- ·小米王化開SU7 Max到武漢上任:一天開1200多公里 充3次電
- ·realme UI 7.0正式版不限量內測來了 支持真我GT7等7款機型
- ·鴻蒙生態(tài)學堂創(chuàng)新實訓營東莞站圓滿落幕 助力港澳企業(yè)開發(fā)者把握萬物互聯新機遇
- ·MBS微博文化交流之夜與2025商業(yè)與慈善論壇
- ·前三季度凈賺490億元!寧德時代每月漲薪150元
- ·AMD銳龍9000G APU果然沒讓我們失望!真的有Strix Point高端版本
- ·創(chuàng)芯賦能智能生態(tài)!匯頂科技亮相2025英特爾技術創(chuàng)新與產業(yè)生態(tài)大會
- ·教育部:2026屆高校畢業(yè)生規(guī)模預計1270萬人!多所高校宣布延長研究生學制
- ·李國慶與新婚妻子互吻:高調示愛迎娶白月光
- ·MLGO微算法科技基于遷移學習與特征融合的運動想象分類算法技術
- ·平泉東山頭遺址考古新發(fā)現:紅山文化分布范圍再拓展
- ·(粵港澳全運會)江蘇隊輕取山東隊獲女子排球成年組冠軍
- ·超時必賠!順豐首推“超時賠付”助推行業(yè)服務升級
- ·AMD銳龍9000G APU果然沒讓我們失望!真的有Strix Point高端版本
- ·AMD銳龍9000G APU果然沒讓我們失望!真的有Strix Point高端版本
- ·(粵港澳全運會)李晨洋獲得十五運會男子撐桿跳高金牌
- ·華為門店購機福利已就位!支付寶碰一下攜手鴻蒙 帶來最高888元紅包!
- ·吃火鍋的靈魂!海底撈火鍋蘸料合集 任選6件到手19.9元
- ·中東部地區(qū)有大風降溫 臺風“天琴”繼續(xù)影響南海
- ·2025年11月GEO優(yōu)化服務商哪家靠譜 權威榜單TOP10深度解析
- ·雷軍:今年小米汽車將交付超40萬輛
- ·(粵港澳全運會)短跑“天才少女”陳妤頡的AB面
- ·清華大學與賽力斯聯合研究中心揭牌,以突破新一代電池關鍵技術難題為核心目標
- ·麥肯錫報告:純靠降價很難再刺激購車 去年僅上升0.6%
- ·吳艷妮淚灑頒獎臺 堅稱“不會放棄!”
- ·給你送上門沒!快遞未溝通默認放驛站最高罰3萬元:律師釋疑涉嫌違規(guī)
- ·字節(jié)跳動新品將攜自研芯片登場 百度/微美全息齊發(fā)力拓寬XR產業(yè)集群
- ·何同學就拒絕給網約車司機好評道歉:很多客戶直接撤單了 虧損一兩百萬是客觀情況
