谷歌Gemini 2.5 Pro上線：推理能力顛覆AI榜單，創(chuàng)歷史最高分

Google ? 3天前 ? AI

谷歌于今日凌晨正式發(fā)布新一代AI模型Gemini 2.5 Pro，憑借強(qiáng)大的推理能力橫掃全球多項榜單，并創(chuàng)下AI模型史上最大分?jǐn)?shù)飛躍紀(jì)錄。該模型主打“思考式”響應(yīng)機(jī)制，在編程、數(shù)學(xué)及多模態(tài)任務(wù)中展現(xiàn)出領(lǐng)先實力，被谷歌稱為“當(dāng)前最強(qiáng)大的通用AI模型”。

根據(jù)官方數(shù)據(jù)，Gemini 2.5 Pro在LMArena測試中以領(lǐng)先第二名40分的絕對優(yōu)勢登頂，并包攬數(shù)學(xué)、創(chuàng)意寫作、指令執(zhí)行、長文本處理及多輪對話五項單項冠軍。在視覺競技場（Vision Arena）和編程測試中，其擊敗包括GPT-4.5、Grok-3等對手，甚至在網(wǎng)頁開發(fā)競技場（WebDev Arena）中斬獲亞軍，成為首個綜合實力接近Claude 3.5 Sonnet的模型。

技術(shù)層面，Gemini 2.5 Pro支持百萬級Token上下文處理（未來將擴(kuò)展至200萬Token），可同時解析文本、音頻、圖像及完整代碼庫。實測顯示，該模型僅用一行提示詞即生成交互式動畫、像素游戲及分形可視化程序。例如，根據(jù)“宇宙魚”指令，其自動編寫出包含魚類心理活動的動態(tài)場景；輸入恐龍跑酷需求后，則生成完整游戲代碼與像素化美術(shù)素材。

谷歌透露，2.5 Pro在未使用多數(shù)投票法等增強(qiáng)技術(shù)的情況下，即在GPQA科學(xué)測試中達(dá)到18.8%準(zhǔn)確率，較行業(yè)平均水平顯著提升。目前，該模型已面向Gemini Advanced用戶開放，未來幾周將公布商業(yè)定價方案，支持企業(yè)大規(guī)模部署。

此次升級標(biāo)志著谷歌在AI推理領(lǐng)域取得關(guān)鍵突破，其能否持續(xù)領(lǐng)跑，或?qū)⒁l(fā)OpenAI等競爭對手的新一輪技術(shù)競速。

原創(chuàng)文章，作者：Google，如若轉(zhuǎn)載，請注明出處：http://www.bdzhitong.com/article/712488.html

Google認(rèn)證作者

0 0

新聞

英國AI雄心遇“攔路虎”，28%政府系統(tǒng)老舊拖后腿

據(jù)外媒TechRadar報道，英國公共賬目委員會（PAC）最新報告顯示，該國政府推廣人工智能的雄心正面臨傳統(tǒng)IT系統(tǒng)老化、數(shù)據(jù)質(zhì)量低下及共享受限等現(xiàn)實阻礙。報告稱，英國中央政府約…

聆聽
8小時前
AI

Open宣布GPT-4o大升級，付費用戶今日搶先體驗

OpenAI今日宣布，旗下AI模型GPT-4o迎來重大功能更新，即日起面向所有付費用戶開放，免費用戶需等待數(shù)周后才可使用。此次升級覆蓋四大核心能力，并在權(quán)威測試中實現(xiàn)多個關(guān)鍵領(lǐng)域排…

AI
1天前
AI

?豆包上線“深度思考”新技能：邊搜索邊推理破解復(fù)雜問題

字節(jié)跳動旗下智能助手豆包今日宣布，新版“深度思考”功能正式開啟測試。該功能將推理過程的思維鏈與實時搜索結(jié)合，實現(xiàn)“邊思考邊搜索”，可多次調(diào)用工具并整合信息，顯著提升復(fù)雜問題處理精度…

AI
1天前
商業(yè)

OpenAI預(yù)計2025年營收127億美元，微軟、軟銀加注“AI印鈔機(jī)”

據(jù)彭博社、CNBC等多家媒體披露，OpenAI最新內(nèi)部預(yù)測顯示，其2025年營收將達(dá)到127億美元（約合922.3億元人民幣），較2024年37億美元營收增長超兩倍，并預(yù)計2026…

AI
2天前
AI

OpenAI圖像生成神器GPT-4o全面開放，免費用戶也能用

當(dāng)?shù)貢r間3月25日，美國開放人工智能研究中心（OpenAI）宣布，正式將全新“GPT-4o圖像生成功能”集成至其旗艦?zāi)Ｐ虶PT-4o中，并面向所有用戶開放基礎(chǔ)服務(wù)。該功能被CEO山…

AI
3天前
新聞

傳聞寶馬聯(lián)手阿里升級新世代車型通義大模型驅(qū)動車載AI革新

據(jù)多方消息披露，寶馬集團(tuán)與阿里巴巴已達(dá)成全面AI合作協(xié)議，阿里通義大模型將深度整合至寶馬面向中國市場的新世代系列車型。這意味著雙方將共同推進(jìn)智能座艙、語音交互等車載系統(tǒng)的AI化升級…

小丸子
3天前
AI

?DeepSeek V3模型更新：編程能力飆升，商業(yè)使用更自由

近日，國產(chǎn)AI公司深度求索（DeepSeek）宣布推出大模型V3版本更新，其6850億參數(shù)的開源版本已同步上線開源平臺。官方稱此次為“小版本升級”，用戶可通過官網(wǎng)、App及小程序入…

AI
4天前
AI

OpenAI高層調(diào)整：CEO親抓研發(fā)，三位核心高管晉升扛重任

當(dāng)?shù)貢r間3月24日，全球知名人工智能公司OpenAI宣布重大組織架構(gòu)調(diào)整。首席執(zhí)行官山姆·奧爾特曼（Sam Altman）將投入更多精力主導(dǎo)技術(shù)研發(fā)，同時三位核心高管獲得晉升，共同…

AI
4天前
商業(yè)

美股集體收漲特斯拉漲近12%

美東時間3月24日，美國股市迎來強(qiáng)勢開局，三大基準(zhǔn)指數(shù)集體收漲。道瓊斯工業(yè)平均指數(shù)勁升597.97點（+1.42%）至42583.32點，納斯達(dá)克綜合指數(shù)暴漲404.54點（+2.…

商業(yè)頭條
4天前
新聞

螞蟻集團(tuán)AI訓(xùn)練大突破：國產(chǎn)芯片替代英偉達(dá)，成本直降20%

據(jù)彭博社援引知情人士消息，螞蟻集團(tuán)正通過中國自主研發(fā)的芯片開發(fā)AI模型訓(xùn)練技術(shù)，成功將成本壓縮20%。其訓(xùn)練效果已與英偉達(dá)H800芯片相當(dāng)，標(biāo)志著國產(chǎn)芯片在高端AI領(lǐng)域的重大突破?！?/p>

AI
5天前
出海

亞馬遜推出免費AI作圖神器：8秒生成專業(yè)素材，覆蓋12國賣家

近日，亞馬遜正式上線?「圖像生成工具」測試版?，宣布為全球12個國家站點的品牌賣家提供?“零成本、8秒出圖”?的AI作圖服務(wù)。該工具可根據(jù)商品圖片及文字描述，自動生成最多8張場景化…

聆聽
5天前
AI

全球首個“減肥AI助手”在國內(nèi)發(fā)布，基于DeepSeek、OpenAI及豆包三大通用模型

6月23日，全球首款專攻體重管理的AI大模型?“減單”?在合肥正式亮相。該模型由安徽醫(yī)科大學(xué)校長翁建平教授團(tuán)隊聯(lián)合?中國科學(xué)技術(shù)大學(xué)附屬第一醫(yī)院?、?浙江諾特健康科技公司?共同研發(fā)…

AI
5天前
AI

Gemini Live新功能實測上線：手機(jī)攝像頭秒變AI顧問

谷歌發(fā)言人亞歷克斯·約瑟夫今日向媒體證實，?Gemini Live人工智能實時視頻解析功能已正式上線?。用戶可通過智能手機(jī)攝像頭或屏幕畫面與AI互動，Gemini將實時分析視覺內(nèi)容…

Google
5天前
手機(jī)

?谷歌Pixel 10啟動速度或提升30% 安卓內(nèi)核優(yōu)化方案曝光

據(jù)外媒9to5Google報道稱，谷歌近期通過安卓開源項目（AOSP）提交了兩項內(nèi)核優(yōu)化代碼，針對設(shè)備啟動流程進(jìn)行重大調(diào)整。測試數(shù)據(jù)顯示，即將發(fā)布的Pixel 10手機(jī)啟動時間或縮…

Google
6天前
手機(jī)

谷歌Pixel 9a緊急暫停發(fā)貨，組件隱患致預(yù)售延期

據(jù)外媒Android Authority報道，谷歌發(fā)言人確認(rèn)，由于部分Pixel 9a設(shè)備發(fā)現(xiàn)組件質(zhì)量問題，該機(jī)將延遲發(fā)貨。盡管官方未透露具體故障部件，但內(nèi)部人士推測可能與電池或主…

Google
2025年3月21日
AI

DeepMind資深科學(xué)家離職創(chuàng)辦機(jī)器人公司Generalist AI，獲NVentures投資

谷歌DeepMind前機(jī)器人科學(xué)家Pete Florence近日宣布創(chuàng)立AI機(jī)器人公司Generalist AI，并已獲得英偉達(dá)旗下風(fēng)投機(jī)構(gòu)NVentures的戰(zhàn)略投資。這家初創(chuàng)公…

AI
2025年3月20日
出海

Shopify推出免費AI建店工具！一句話生成品牌官網(wǎng)

全球電商服務(wù)巨頭Shopify今日宣布，正式向所有商戶開放免費的“AI店鋪設(shè)計工具”，用戶僅需輸入品牌或產(chǎn)品描述，即可在30分鐘內(nèi)生成個性化在線商店，徹底簡化傳統(tǒng)建站流程。?該工具…

小丸子
2025年3月20日
手機(jī)

谷歌Pixel 9a正式發(fā)布：七年系統(tǒng)更新成最大亮點

當(dāng)?shù)貢r間3月19日，谷歌正式推出旗下中端機(jī)型Pixel 9a，以499美元（約合人民幣3600元）的起售價延續(xù)”高性價比安卓旗艦”定位。這款新機(jī)在保留AI影…

Google
2025年3月20日
新聞

Google Play下架331款惡意應(yīng)用累計下載量突破6000萬次

網(wǎng)絡(luò)安全機(jī)構(gòu)IAS Threat Lab與Bitdefender于3月22日聯(lián)合披露，谷歌應(yīng)用商店近期移除331款涉及“Vapor”惡意活動的安卓應(yīng)用，累計下載量達(dá)6000萬次。該…

Google
2025年3月19日
AI

英偉達(dá)發(fā)布基于DeepSeek-R1 AI推理系統(tǒng) 創(chuàng)全球性能新紀(jì)錄

在3月19日舉行的NVIDIA GTC 2025技術(shù)大會上，英偉達(dá)正式推出基于DeepSeek-R1大模型的AI推理系統(tǒng)。官方披露，搭載八塊Blackwell架構(gòu)GPU的NVIDI…

AI
2025年3月19日