當(dāng)前位置：首頁(yè) > 焦點(diǎn) > V4還沒(méi)來(lái) DeepSeekMath 正文

V4還沒(méi)來(lái) DeepSeekMath

時(shí)間：2025-12-02 02:32:45 來(lái)源：企業(yè)錄(www.qy6.com)-公司信息發(fā)布,網(wǎng)上買賣交易門戶

11月27日消息，全網(wǎng)都在等DeepSeek發(fā)布V4大模型，然而好事多磨，這個(gè)模型一直沒(méi)有問(wèn)世，但DeepSeek也沒(méi)閑著，時(shí)不時(shí)來(lái)個(gè)驚喜，今晚突然低調(diào)發(fā)布了DeepSeekMath-V2模型。

DeepSeekMath-V2是一款可自我驗(yàn)證的數(shù)學(xué)推理訓(xùn)練框架，基于 DeepSeek?V3.2?Exp?Base訓(xùn)練而來(lái)，通過(guò)LLM驗(yàn)證器自動(dòng)審查生成的數(shù)學(xué)證明，并利用高難度樣本持續(xù)優(yōu)化性能。

目前該模型代碼與權(quán)重已開(kāi)源，發(fā)布于Hugging Face及GitHub平臺(tái)。

這款模型強(qiáng)在哪里？先說(shuō)結(jié)果，在IMO 2025和CMO 2024中均達(dá)到金牌水平，Putnam 2024獲118/120分。

如果對(duì)比當(dāng)前頂級(jí)的大模型，比如Claude Sonnet4、GPT-5、Gemini 2.5 Pro等，Basic測(cè)試中得分被DeepSeekMath-V2的99分遠(yuǎn)遠(yuǎn)甩開(kāi)，Adveanced中也只比Gemini DeepThink的65.7分略低，這個(gè)模型也是谷歌特調(diào)的，也達(dá)到到了IMO金牌水平。

考慮到DeepSeekMath-V2的開(kāi)源、免費(fèi)等特性，可以說(shuō)它是當(dāng)前最強(qiáng)的數(shù)學(xué)模型了。

不過(guò)DeepSeek官方的說(shuō)法倒是很謙虛，表示盡管仍有許多工作需要完成，這些結(jié)果表明，自我可驗(yàn)證的數(shù)學(xué)推理是一個(gè)可行的研究方向，可能有助于開(kāi)發(fā)更強(qiáng)大的數(shù)學(xué)AI系統(tǒng)。

如果聯(lián)系到DeepSeek最近幾款特殊模型的表現(xiàn)，顯然他們?cè)赩4發(fā)布之前積累了相當(dāng)多的新技術(shù)新想法，在OCR、數(shù)學(xué)等方面表現(xiàn)驚艷，這么一想V4如果是全能型的多模態(tài)大模型，那就更值得期待了。

嵐圖汽車11月交付首次突破兩萬(wàn)輛再創(chuàng)歷史新高

600流明強(qiáng)光、110米遠(yuǎn)射！小米米家戶外多功能燈開(kāi)啟眾籌：89元

最適合入門的無(wú)人機(jī)！大疆Neo 2評(píng)測(cè)：4K60幀影像全向避障隨便飛！

美國(guó)軟件巨頭SAS撤出中國(guó)！400名員工全被解雇補(bǔ)償豐厚

新加坡禁止中學(xué)生校內(nèi)用智能手機(jī)、手表：研究稱玩手機(jī)會(huì)削弱智商

歷時(shí)兩年半已有210多款中國(guó)車搭載高通驍龍數(shù)字底盤

蘋果iOS 26.1上線：一文了解更新詳情

12TB網(wǎng)盤：迅雷超級(jí)會(huì)員約10元/月年內(nèi)新低

超時(shí)必賠！順豐首推“超時(shí)賠付”助推行業(yè)服務(wù)升級(jí)