谷歌推出全能視頻編碼器VideoPrism 性能超越30項SOTA

秋秋 ? 2024年2月26日 14:00:00 ? 新聞

谷歌研究團隊近日發布了全新的通用視頻編碼器——VideoPrism，其在3600萬高質量視頻字幕對和5.82億視頻剪輯的數據集上進行了訓練，并在33項視頻理解基準測試中刷新了30項SOTA（最先進技術）成績。

VideoPrism的設計旨在通過單一凍結模型處理各種視頻理解任務，包括分類、定位、檢索、字幕和問答等。其設計理念主要基于預訓練數據和兩階段訓練法。預訓練數據方面，谷歌團隊通過匯集高質量視頻字幕對和帶有噪聲的并行文本，構建了一個龐大的語料庫。在建模方面，VideoPrism采用了對比學習和掩碼視頻建模兩個階段，以優化語義視頻嵌入和全局提煉。

VideoPrism的出色表現不僅體現在分類和定位任務上，還能進行視頻-文本檢索和QA問答。例如，給定一段視頻，VideoPrism可以準確地檢索出與文本內容相匹配的視頻片段，或者根據視頻內容回答相關問題。

谷歌團隊表示，VideoPrism的成功驗證了通用視覺編碼器在視頻理解領域的巨大潛力。未來，隨著數據集的擴大和模型的不斷優化，VideoPrism有望在更多領域實現突破，為視頻理解和應用提供更強大的支持。

原創文章，作者：秋秋，如若轉載，請注明出處：http://www.bdzhitong.com/article/632435.html

VideoPrism 谷歌

秋秋管理團隊

0 0

商業

美國科技“七巨頭”損失慘重，市值蒸發超千億美元

美國科技行業近期遭遇劇烈震蕩，被稱為“美股七巨頭”的亞馬遜、微軟、特斯拉等科技巨頭市值大幅下滑。彭博社數據顯示，自特朗普政府1月20日就職以來，多家企業股價跌幅已導致高管財富顯著縮…

商業頭條
3小時前
新聞

?安卓16 Beta 3上線：新增助聽器廣播、高對比度字體

谷歌昨日宣布，?安卓16 Beta 3?版本正式發布，標志著該系統進入平臺穩定性階段。新版本鎖定API接口及應用行為規范，開發者可向Google Play提交適配應用，同時新增廣播…

野游栗
1天前
新聞

?谷歌Chrome商店新規：封殺PayPal旗下Honey惡意劫持返利

據報道，谷歌更新了Chrome商店政策，明確禁止擴展程序“暗中篡改用戶返利鏈接”等行為，劍指支付巨頭PayPal旗下優惠券平臺Honey的惡意操作。此次政策更新直接回應了該擴展長期…

Google
1天前
AI

?谷歌DeepMind發布兩款AI模型：機器人“零訓練”即可執行復雜任務

北京時間3月12日晚，谷歌旗下DeepMind團隊宣布推出兩款新型AI模型——?Gemini Robotics?和?Gemini Robotics-ER?，旨在賦予機器人更強大的現…

Google
2天前
手機

谷歌Pixel 9a真機首曝：直角邊框+5100mAh電池

今日，外媒91Mobile曝光了谷歌中端新機Pixel 9a真機上手視頻及包裝盒照片，這也是谷歌Pixel 9a外觀與核心配置首次完整披露。? 曝光視頻畫面中，Pixel 9a采用…

Google
2天前
手機

谷歌Pixel 10系列渲染圖曝光：臺積電芯片加持，8月發布

近日，科技媒體Android Headline聯合爆料人Onleaks發布了谷歌Pixel 10系列渲染圖，首次展示Pixel 10、Pixel 10 Pro及Pixel 10 P…

Google
2天前
新聞

有消息稱谷歌 Play 版微信 WeChat 國內用戶已支持 FCM 推送功能

微信 WeChat 于 3 月 12 日面向中國內地用戶激活 FCM 推送功能，海外用戶需境外手機號。開發者 Oasis Feng 表示已等待半年多，終于迎來轉機，消息不延遲，微信來電也能及時彈出。

蘋果派
3天前
產品

谷歌舊款Chromecast設備突現“不信任”警告，用戶擔憂停服風險

今日，部分用戶反饋稱，第二代 ?Chromecast? 電視棒及已停產的 ?Chromecast Audio? 音樂流媒體設備出現“?不受信任的設備?”錯誤提示，并顯示“?無法驗證…

Google
5天前
AI

谷歌安卓原生 Linux Terminal 終端應用上線

谷歌發布原生 Linux Terminal 終端應用，支持在虛擬機中運行 Debian 系統。

科技探索者
6天前
新聞

美司法部撤回拆分谷歌AI業務要求維持強制出售Chrome裁決

當地時間3月7日（周五），美國司法部向華盛頓聯邦法院提交文件，宣布不再要求谷歌剝離其在人工智能領域的投資，包括對Anthropic公司的數十億美元少數股權。這一調整源于司法部認為，…

Google
6天前
手機

?谷歌Pixel 9a外觀提前泄露：四色可選、預裝Android 15

近日，谷歌尚未發布的Pixel 9a渲染圖遭提前曝光，爆料人Evan Blass公開了谷歌Pixel 9a外觀設計細節及核心配置信息。新機預計于3月19日正式發布，起售價499美元…

Google
6天前
新聞

谷歌搜索測試全新“AI模式”：復雜問題一鍵生成答案

谷歌公司于3月5日正式宣布，面向全球用戶測試全新“AI模式”（AI Mode），旨在通過人工智能技術解決復雜搜索難題。用戶現可通過桌面或移動設備點擊“AI模式”按鈕，輸入多維度問題…

Google
2025年3月6日
AI

谷歌開源SpeciesNet AI模型：6500萬張圖訓練，2000種物種一鍵辨

近日，谷歌宣布開源人工智能模型SpeciesNet，該工具可通過分析紅外相機陷阱拍攝的照片識別野生動物物種，幫助研究者快速處理海量監測數據?。 SpeciesNet由谷歌地球外展慈…

AI
2025年3月5日
手機

谷歌Pixel 9a傳聞：將成谷歌最便宜衛星通信手機

今日，有外媒報道了谷歌Pixel 9a傳聞信息。消息稱，谷歌新款中端手機Pixel 9a正式現身美國聯邦通信委員會（FCC）數據庫，型號為GXQ96、GTF7P和G3Y12。認證文…

Google
2025年3月5日
新聞

谷歌為Pixel機型推送3月更新：全面優化系統卡頓、藍牙斷連等問題

今日，谷歌正式向所有在支持周期內的Pixel設備推送了2025年度首個大型系統更新。此次更新包含“三月Pixel Drop”功能升級包，重點優化了系統流暢度、藍牙通話體驗、相機穩定…

Google
2025年3月5日
新聞

谷歌以國家安全為由反對司法部拆分計劃

據外媒報道，谷歌Alphabet正式向特朗普政府提交抗辯文件，要求美國司法部放棄強制拆分公司的提案。此次爭議源于司法部針對谷歌搜索和廣告技術業務發起的雙重反壟斷訴訟，案件目前處于“…

Google
2025年3月5日
新聞

谷歌與《Roblox》合作推出 ChromeOS 專版游戲號稱“性能翻倍”

2月28日，谷歌 ChromeOS 官方博客宣布，《Roblox（羅布樂思）》現已全面對 ChromeOS 平臺進行優化，推出專為 Chromebook 打造的 x86 版本。在…

Google
2025年2月28日
新聞

?美國多州立法：蘋果谷歌需承擔應用商店年齡驗證責任

近期，美國至少有九個州正在積極推動立法，要求蘋果和谷歌等應用商店在允許用戶下載有最低年齡限制的應用程序時，承擔年齡驗證的責任。這一變化主要針對社交媒體應用，這些應用通常設定最低使用…

好奇寶寶
2025年2月26日
新聞

澳大利亞重罰Telegram百萬澳元嚴打平臺有害內容監管漏洞

據報道，澳大利亞在線安全監管機構eSafety今日宣布，對即時通訊平臺Telegram處以100萬澳元（約合人民幣462.6萬元）罰款，因其逾期160天未按要求提交打擊兒童虐待及恐…

NEWS
2025年2月24日
AI

?蘋果計劃將谷歌Gemini集成至Apple Intelligence，Siri功能再升級

近日，據外媒報道，蘋果已具備將Siri請求導向ChatGPT的功能，為用戶提供比Siri自身更貼合上下文的回答。除此之外，蘋果被曝計劃將谷歌的Gemini模型與Apple Inte…

Apple
2025年2月24日

發表回復

登錄后才能評論

谷歌推出全能視頻編碼器VideoPrism 性能超越30項SOTA

相關推薦

發表回復