谷歌 DeepMind 展示 GenRM 技術，提升生成式 AI 推理能力

潮玩君 ? 2024年9月3日 10:57:00 ? AI

谷歌DeepMind發布GenRM技術，通過創新獎勵模型增強生成式AI推理能力，提高大語言模型性能。GenRM能無縫集成指令調整，支持思維鏈推理，優化結果質量。在推理任務中表現優于傳統驗證器，標志著AI獎勵系統的重要演化。

9 月 3 日消息，谷歌 DeepMind 團隊于 8 月 27 日在 arxiv 上發表論文，介紹展示了 GenRM 生成式驗證器，創造性提出獎勵模型，從而提升生成式 AI 推理能力。

AI 行業內，目前提高大語言模型（LLMs）的主流做法就是 Best-of-N 模式，即由 LLM 生成的 N 個候選解決方案由驗證器進行排序，并選出最佳方案。

這種基于 LLM 的驗證器通常被訓練成判別分類器來為解決方案打分，但它們無法利用預訓練 LLMs 的文本生成能力。

DeepMind 團隊為了克服這個局限性，嘗試使用下一個token 預測目標來訓練驗證器，同時進行驗證和解決方案生成。

DeepMind 團隊這種生成式驗證器（GenRM），相比較傳統驗證器，主要包含以下優點：

無縫集成指令調整

支持思維鏈推理

通過多數投票利用額外的推理時間計算

在算法和小學數學推理任務中使用基于 Gemma 的驗證器時，GenRM 的性能優于判別式驗證器和 LLM-as-a-Judge 驗證器，在使用 Best-of-N 解決問題的百分比上提高了 16-64%。

據 Google DeepMind 報道，GenRM 相對于分類獎勵模型的邊標志著人工智能獎勵系統的關鍵演化，特別是在其容量方面，以防止新模型學成到的欺詐行為。這一進步突出表明，迫切需要完善獎勵模型，使人工智能輸出與社會責任標準保持一致。

原創文章，作者：潮玩君，如若轉載，請注明出處：http://www.bdzhitong.com/article/677866.html

潮玩君管理團隊

0 0

新聞

?谷歌Chrome商店新規：封殺PayPal旗下Honey惡意劫持返利

據報道，谷歌更新了Chrome商店政策，明確禁止擴展程序“暗中篡改用戶返利鏈接”等行為，劍指支付巨頭PayPal旗下優惠券平臺Honey的惡意操作。此次政策更新直接回應了該擴展長期…

Google
20小時前
AI

?中國AI智能體Manus爆火 7天吸引200萬人排隊體驗

3月12日晚間，中國AI智能體企業Manus AI宣布，其通用型AI智能體產品Manus自3月6日發布以來，全球用戶申請體驗的等候名單已突破?200萬人?，市場需求遠超預期。 Ma…

AI
22小時前
AI

?谷歌DeepMind發布兩款AI模型：機器人“零訓練”即可執行復雜任務

北京時間3月12日晚，谷歌旗下DeepMind團隊宣布推出兩款新型AI模型——?Gemini Robotics?和?Gemini Robotics-ER?，旨在賦予機器人更強大的現…

Google
1天前
手機

谷歌Pixel 9a真機首曝：直角邊框+5100mAh電池

今日，外媒91Mobile曝光了谷歌中端新機Pixel 9a真機上手視頻及包裝盒照片，這也是谷歌Pixel 9a外觀與核心配置首次完整披露。? 曝光視頻畫面中，Pixel 9a采用…

Google
1天前
AI

AI大模型平臺排行榜震撼發布，誰才是你的NO.1

隨著人工智能技術的迅猛發展，大模型平臺在AI領域的重要性日益凸顯。2025年2月發布的“中國AI大模型平臺排行榜”顯示了當前各大模型平臺的綜合實力、初創潛力以及在不同應用場景下的表…

AI
1天前
AI

OpenAI推出新工具：AI助理進化到“替你干活”時代

近日，OpenAI正式推出三項開發者工具——Responses API、Agents SDK及計算機使用工具，推動AI智能體從“聊天對話”向“任務執行”跨越升級，該技術方案將于20…

AI
1天前
AI

Manus聯手阿里通義千問，國產大模型首度實現全功能遷移

今日，AI公司Manus合伙人張濤宣布，與阿里云通義千問團隊達成戰略合作，雙方將基于通義千問開源模型，在國產化算力平臺上實現Manus產品的全功能適配，為中國用戶打造更高效、更具創…

AI
1天前
手機

谷歌Pixel 10系列渲染圖曝光：臺積電芯片加持，8月發布

近日，科技媒體Android Headline聯合爆料人Onleaks發布了谷歌Pixel 10系列渲染圖，首次展示Pixel 10、Pixel 10 Pro及Pixel 10 P…

Google
1天前
新聞

有消息稱谷歌 Play 版微信 WeChat 國內用戶已支持 FCM 推送功能

微信 WeChat 于 3 月 12 日面向中國內地用戶激活 FCM 推送功能，海外用戶需境外手機號。開發者 Oasis Feng 表示已等待半年多，終于迎來轉機，消息不延遲，微信來電也能及時彈出。

蘋果派
1天前
新聞

消息稱歐洲三大銀行搶測中國AI模型DeepSeek

據外媒The Information報道，自2024年1月起，歐洲多家頂級銀行正秘密測試中國AI公司深度求索（DeepSeek）的生成式人工智能模型，試圖挖掘其技術潛力。這與美國銀…

AI
2天前
出海

Shopify推出AI主題生成器，讓新手5分鐘開網店

近日，全球電商平臺Shopify宣布推出“AI主題生成器”，賣家僅需在后臺輸入文字描述，系統即可自動生成三套定制化店鋪模板，將網店搭建時間從平均6小時壓縮至5分鐘。?該功能基于Sh…

happy
2天前
AI

?Manus官方X賬號突遭凍結后解封，公司緊急辟謠

上周五，中國AI智能體企業Manus的官方X平臺賬號（@ManusAI_HQ）突然被凍結。聯合創始人兼首席科學家季逸超（Peak Ji）當日發布聲明稱，公司正與X平臺支持團隊合作解…

AI
3天前
產品

谷歌舊款Chromecast設備突現“不信任”警告，用戶擔憂停服風險

今日，部分用戶反饋稱，第二代 ?Chromecast? 電視棒及已停產的 ?Chromecast Audio? 音樂流媒體設備出現“?不受信任的設備?”錯誤提示，并顯示“?無法驗證…

Google
3天前
產品

?星紀魅族StarV系列智能眼鏡將亮相悉尼支持AI大模型與188英寸巨幕

今日，星紀魅族科技宣布將于3月11日在澳大利亞悉尼舉辦發布會，正式推出面向海外市場的StarV系列智能眼鏡，包含StarV Air2和StarV View兩款產品。該系列搭載旗艦級…

檸萌
4天前
AI

谷歌安卓原生 Linux Terminal 終端應用上線

谷歌發布原生 Linux Terminal 終端應用，支持在虛擬機中運行 Debian 系統。

科技探索者
4天前
新聞

美司法部撤回拆分谷歌AI業務要求維持強制出售Chrome裁決

當地時間3月7日（周五），美國司法部向華盛頓聯邦法院提交文件，宣布不再要求谷歌剝離其在人工智能領域的投資，包括對Anthropic公司的數十億美元少數股權。這一調整源于司法部認為，…

Google
5天前
手機

?谷歌Pixel 9a外觀提前泄露：四色可選、預裝Android 15

近日，谷歌尚未發布的Pixel 9a渲染圖遭提前曝光，爆料人Evan Blass公開了谷歌Pixel 9a外觀設計細節及核心配置信息。新機預計于3月19日正式發布，起售價499美元…

Google
5天前
AI

Manus是什么？揭秘全球首款通用AI代理的顛覆性革命

在科技日新月異的今天，中國初創公司Monica.im（蝴蝶效應科技）憑借其卓越的創新力，推出了全球首款通用型AI代理——Manus。大家都比較好奇Manus為何會如此火爆，那么Ma…

AI
6天前
新聞

谷歌搜索測試全新“AI模式”：復雜問題一鍵生成答案

谷歌公司于3月5日正式宣布，面向全球用戶測試全新“AI模式”（AI Mode），旨在通過人工智能技術解決復雜搜索難題。用戶現可通過桌面或移動設備點擊“AI模式”按鈕，輸入多維度問題…

Google
2025年3月6日
AI

OpenAI宣布GPT-4.5正式開放，價格是舊版30倍

今日，OpenAI宣布，即日起向所有ChatGPT Plus用戶開放GPT-4.5模型，比原計劃提前兩周落地。此次升級被官方稱為“最接近人類思維的AI系統”，其輸入成本高達GPT-…

AI
2025年3月6日

發表回復

登錄后才能評論

谷歌 DeepMind 展示 GenRM 技術，提升生成式 AI 推理能力

相關推薦

發表回復

谷歌 DeepMind 展示 GenRM 技術，提升生成式 AI 推理能力