
谷歌于今日凌晨正式發(fā)布新一代AI模型Gemini 2.5 Pro,憑借強(qiáng)大的推理能力橫掃全球多項榜單,并創(chuàng)下AI模型史上最大分?jǐn)?shù)飛躍紀(jì)錄。該模型主打“思考式”響應(yīng)機(jī)制,在編程、數(shù)學(xué)及多模態(tài)任務(wù)中展現(xiàn)出領(lǐng)先實力,被谷歌稱為“當(dāng)前最強(qiáng)大的通用AI模型”。
根據(jù)官方數(shù)據(jù),Gemini 2.5 Pro在LMArena測試中以領(lǐng)先第二名40分的絕對優(yōu)勢登頂,并包攬數(shù)學(xué)、創(chuàng)意寫作、指令執(zhí)行、長文本處理及多輪對話五項單項冠軍。在視覺競技場(Vision Arena)和編程測試中,其擊敗包括GPT-4.5、Grok-3等對手,甚至在網(wǎng)頁開發(fā)競技場(WebDev Arena)中斬獲亞軍,成為首個綜合實力接近Claude 3.5 Sonnet的模型。
技術(shù)層面,Gemini 2.5 Pro支持百萬級Token上下文處理(未來將擴(kuò)展至200萬Token),可同時解析文本、音頻、圖像及完整代碼庫。實測顯示,該模型僅用一行提示詞即生成交互式動畫、像素游戲及分形可視化程序。例如,根據(jù)“宇宙魚”指令,其自動編寫出包含魚類心理活動的動態(tài)場景;輸入恐龍跑酷需求后,則生成完整游戲代碼與像素化美術(shù)素材。
谷歌透露,2.5 Pro在未使用多數(shù)投票法等增強(qiáng)技術(shù)的情況下,即在GPQA科學(xué)測試中達(dá)到18.8%準(zhǔn)確率,較行業(yè)平均水平顯著提升。目前,該模型已面向Gemini Advanced用戶開放,未來幾周將公布商業(yè)定價方案,支持企業(yè)大規(guī)模部署。
此次升級標(biāo)志著谷歌在AI推理領(lǐng)域取得關(guān)鍵突破,其能否持續(xù)領(lǐng)跑,或?qū)⒁l(fā)OpenAI等競爭對手的新一輪技術(shù)競速。
原創(chuàng)文章,作者:Google,如若轉(zhuǎn)載,請注明出處:http://www.bdzhitong.com/article/712488.html