Kimi最強(qiáng)開源思考模型 Kimi K2 Thinking發(fā)布：推理等超越GPT

熱點(diǎn) 2025-11-09 00:12:29 14366

11月7日消息，最強(qiáng)日前，開源月之暗面宣布發(fā)布Kimi K2 Thinking，思考這是模型Kimi 迄今能力最強(qiáng)的開源思考模型。

目前，布推該模型已上線kimi.com和最新版Kimi手機(jī)應(yīng)用的最強(qiáng)常規(guī)對(duì)話模式。

據(jù)了解，開源Kimi K2 Thinking原生掌握“邊思考，思考邊使用工具”的模型能力，在人類最后的布推考試（Humanity's Last Exam）、自主網(wǎng)絡(luò)瀏覽能力（BrowseComp）、最強(qiáng)復(fù)雜信息收集推理（SEAL-0）等多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)達(dá)到SOTA水平，開源超越GPT-5。思考

在Agentic搜索、模型Agentic編程、布推寫作和綜合推理能力等方面也取得全面提升。

據(jù)介紹，該模型無需人類干預(yù)，即可自主實(shí)現(xiàn)高達(dá)300輪的工具調(diào)用和持續(xù)穩(wěn)定的多輪思考能力，從而幫助用戶解決更復(fù)雜的問題。

人類最后的考試是一項(xiàng)涵蓋100多個(gè)專業(yè)領(lǐng)域的終極封閉式學(xué)術(shù)測(cè)試。

在允許使用工具——搜索、Python、網(wǎng)絡(luò)瀏覽工具的同等情況下，Kimi K2 Thinking在這項(xiàng)基準(zhǔn)評(píng)測(cè)中取得了44.9%的SOTA成績。

根據(jù)官方示例顯示，Kimi K2 Thinking經(jīng)過5輪搜索和推理，結(jié)合每輪搜索到的新信息，層層深入，最終推理出了答案：

此外，在復(fù)雜搜索和瀏覽場(chǎng)景中，Kimi K2 Thinking模型也表現(xiàn)出色。

BrowseComp是由OpenAI發(fā)布的一個(gè)專門評(píng)估AI Agent網(wǎng)絡(luò)瀏覽能力的基準(zhǔn)測(cè)試，這項(xiàng)測(cè)試的初衷是衡量AI Agent在信息過載環(huán)境中展現(xiàn)出的堅(jiān)持性與創(chuàng)造力，即能否像人類研究員一樣“刨根問底”。

在這項(xiàng)極具挑戰(zhàn)的任務(wù)上，人類平均只能達(dá)到29.2%的成績。

Kimi K2 Thinking在這項(xiàng)基準(zhǔn)測(cè)試中展現(xiàn)出極強(qiáng)的鉆研能力，以60.2%的成績成為新的SOTA模型。

在長程規(guī)劃和自主搜索能力的驅(qū)動(dòng)下，Kimi K2 Thinking可借助多達(dá)上百輪的“思考→搜索→瀏覽網(wǎng)頁→思考→編程”動(dòng)態(tài)循環(huán)，持續(xù)地提出并完善假設(shè)、驗(yàn)證證據(jù)、進(jìn)行推理，并構(gòu)建出邏輯一致的答案。

這種邊主動(dòng)搜索邊持續(xù)思考的能力，使Kimi K2 Thinking能夠?qū)⒛：议_放式的問題分解為清晰、可執(zhí)行的子任務(wù)。

在官方示例中，Kimi K2 Thinking經(jīng)過兩輪搜索和思考，先根據(jù)股票回購的已知信息找到了這家制造快速的公司，然后在美國證券交易委員會(huì)（SEC）的官網(wǎng)上找到了股票回購公告信息，得出了準(zhǔn)確的答案：

本文地址：http://www.bxbedu.com/news/47e299950.html

版權(quán)聲明

本文僅代表作者觀點(diǎn)，不代表本站立場(chǎng)。
本文系作者授權(quán)發(fā)表，未經(jīng)許可，不得轉(zhuǎn)載。

全站熱門

基因特征似COVID

打破質(zhì)疑！小鵬直播剪開機(jī)器人IRON外衣：里面不是真人

繼“巨型吊牌”后商家再想新招：衣服上掛密碼鎖確認(rèn)收貨再給密碼

AMD確認(rèn)Zen5處理器有缺陷！執(zhí)行RDSEED指令會(huì)出錯(cuò)：將更新修復(fù)

Mate 70 Air之后華為Mate 80即將登場(chǎng)：全球首發(fā)麒麟9030

“港股Robotaxi第一股”誕生！文遠(yuǎn)知行正式登陸港交所首日收跌9.96%

酒精能給餐具消毒嗎中疾控：或起不到消毒作用甚至有害

亚洲精品三,久久久久欧美,日本九九热,久久久鲁,天堂一区,天堂精品久久,亚洲久久

Kimi最強(qiáng)開源思考模型 Kimi K2 Thinking發(fā)布：推理等超越GPT

本文地址：http://www.bxbedu.com/news/47e299950.html

版權(quán)聲明

熱門文章

熱門標(biāo)簽

全站熱門

熱門文章

亚洲精品三,久久久久欧美,日本九九热,久久久鲁,天堂一区,天堂精品久久,亚洲久久

Kimi最強(qiáng)開源思考模型 Kimi K2 Thinking發(fā)布：推理等超越GPT

本文地址：http://www.bxbedu.com/news/47e299950.html

版權(quán)聲明

相關(guān)文章

熱門文章

熱門標(biāo)簽

全站熱門

熱門文章