阿里媽媽獲北京市科學(xué)技術(shù)進(jìn)步獎二等獎
11月7日,阿里在北京市科學(xué)技術(shù)獎勵大會上,媽媽北京大學(xué)同阿里媽媽聯(lián)合提報的獲北項目“工業(yè)級圖學(xué)習(xí)系統(tǒng)開發(fā)及應(yīng)用”榮獲2024年度北京市科學(xué)技術(shù)進(jìn)步獎二等獎,該項目由北京大學(xué)和阿里媽媽研究團(tuán)隊在“北大-阿里媽媽人工智能創(chuàng)新聯(lián)合實驗室”支持下聯(lián)合完成。京市技術(shù)進(jìn)步獎等獎
據(jù)了解,科學(xué)“工業(yè)級圖學(xué)習(xí)系統(tǒng)開發(fā)及應(yīng)用”項目成果在國際重要期刊和會議發(fā)表論文50余篇,阿里獲得國際知識管理領(lǐng)域旗艦會議CIKM最佳論文獎等獎項,媽媽項目研發(fā)的獲北工業(yè)級圖學(xué)習(xí)系統(tǒng)在全國近200個行業(yè)中的數(shù)百萬商家推廣,過去3年間應(yīng)用于阿里媽媽搜索廣告投放系統(tǒng),京市技術(shù)進(jìn)步獎等獎累計帶來廣告投放規(guī)模提升3%以上??茖W(xué)
在創(chuàng)新性上,阿里該項目提出了理論上等價于經(jīng)典Skip-gram模型的媽媽可解耦動態(tài)圖嵌入方法,在保持嵌入精度的獲北同時,將算法復(fù)雜性降到了近似線性,京市技術(shù)進(jìn)步獎等獎解決了大規(guī)模圖的科學(xué)動態(tài)嵌入難題;提出了基于匿名隨機(jī)游走的子圖結(jié)構(gòu)融合的圖神經(jīng)網(wǎng)絡(luò)模型,引入了模型感受野和數(shù)據(jù)異質(zhì)分布的自適應(yīng)學(xué)習(xí)機(jī)制,并在理論證明了模型表達(dá)能力突破了圖同構(gòu)判定能力的上限,打開了提升圖神經(jīng)網(wǎng)絡(luò)表達(dá)能力的新路徑;引領(lǐng)了國際工業(yè)級圖學(xué)習(xí)框架的開源工作,研發(fā)了Euler深度圖學(xué)習(xí)平臺,支持曲率空間分布式深度建模,支持大規(guī)模、復(fù)雜異構(gòu)圖的表征學(xué)習(xí)。
該項目所依托的北大-阿里媽媽人工智能創(chuàng)新聯(lián)合實驗室(以下簡稱聯(lián)合實驗室),于2022年9月正式掛牌成立,是北京大學(xué)聯(lián)合阿里媽媽共建的校企聯(lián)合研發(fā)平臺,面向?qū)嶋H工業(yè)場景,聚焦人工智能前沿領(lǐng)域的理論、方法與關(guān)鍵技術(shù)展開研究,主要研究領(lǐng)域包括:圖機(jī)器學(xué)習(xí),包括圖嵌入學(xué)習(xí)、圖神經(jīng)網(wǎng)絡(luò)和大規(guī)模圖預(yù)訓(xùn)練等;決策智能,包括AI經(jīng)濟(jì)學(xué)(博弈論,模擬規(guī)則制定等);內(nèi)容創(chuàng)意,包括智能音樂制作(視覺和音樂配合創(chuàng)意等);多模態(tài)智能,包括統(tǒng)一的多模態(tài)大模型微調(diào)與評估框架等。
成立以來,聯(lián)合實驗室已取得數(shù)十篇國際頂會論文、多項專利等研究成果,并已成功落地阿里媽媽業(yè)務(wù)應(yīng)用,產(chǎn)生了顯著經(jīng)濟(jì)和社會價值。除了此次獲獎的圖機(jī)器學(xué)習(xí)方面的工作,決策智能和內(nèi)容創(chuàng)意等方向在學(xué)術(shù)研究和工業(yè)應(yīng)用方面均有顯著突破。
比如,聯(lián)合實驗室決策智能方向提報的「大規(guī)模拍賣中的自動出價」賽題,入選人工智能國際頂會 NeurIPS 2024,同名比賽成功舉辦。AIGB(AI-Generated Bidding)是阿里媽媽在 2023 年首次提出的 Bidding 模型訓(xùn)練新范式。AIGB 的提出在業(yè)內(nèi)引發(fā)廣泛關(guān)注,在 NeurIPS 2024 會議上,少有地舉行了由中國公司提出概念、并由中國公司主辦的 workshop。
在 NeurIPS 2024 上,阿里媽媽將 AIGB 的 Benchmark 正式開源,同時還發(fā)起了大規(guī)模拍賣中的自動出價比賽,并特別設(shè)置了 AIGB 賽道,也成為去年國內(nèi)工業(yè)界唯一一家獲得 NeurIPS 比賽主辦權(quán)的組織。據(jù)報道,阿里媽媽已將AIGB升級為 AIGB-R1 版本,進(jìn)一步提升廣告投放的 ROI 達(dá) 12%;同時其廣告大模型 LMA2 相比之前參數(shù)規(guī)模提升 10 倍,達(dá)到萬億參數(shù)級別。