
在人工智能領域,大型語言模型的發展一直備受關注。昨日,谷歌Google公司宣布推出其規模最大、功能最強大的新大型語言模型Gemini。該模型擁有最強大的TPU(張量處理單元)系統“Cloud TPU v5p”以及來自谷歌云的人工智能超級計算機,是谷歌籌備了一年之久的GPT4真正競品。
在發布會上,谷歌DeepMind首席執行官、Gemini團隊代表德米斯·哈薩比斯正面談及GPT-4與Gemini的對比。他表示,谷歌運行了32個完善的基準測試來比較這兩個模型,從廣泛的整體測試到比較兩個模型生成Python代碼的能力,結果發現Gemini在32項基準中的30項中大幅領先。
Gemini模型經過海量數據訓練,可以很好識別和理解文本、圖像、音頻等內容,并可以回答復雜主題相關的問題。因此,非常擅長解釋數學和物理等復雜學科的推理任務。此外,Gemini可以生成和理解Python、Java、C++和Go等主流代碼,并在多個編碼基準測試中表現出色。
除了在語言理解和編碼方面的能力,Gemini還具有多模態功能,可以在視覺理解、文本生成等方面表現出非常強的功能。例如,從數十萬字的小說中整理出重要觀點,從200頁的金融報告中找出最有價值的內容。這對于金融、科技、醫療等領域的科研和業務人員來說非常有幫助。
在一段公布的演示視頻中,桑達爾?皮查伊展示了Gemini對視頻、圖像的非同凡響的識別能力。Gemini可以非常自如地在圖像、音頻、視頻各模態之間轉換,展現了驚人的解鎖應用場景與產品形態的潛力。
目前,Gemini Ultra是第一個在MMLU(大規模多任務語言理解)方面超越人類專家的模型。該模型綜合使用數學、物理、歷史、法律、醫學和倫理學等57個科目來測試世界知識和解決問題的能力。谷歌在一篇博客文章中表示,Gemini Ultra可以理解復雜主題中的細微差別和推理。
對于未來發展,谷歌計劃將Gemini授權給客戶,供他們在自己的應用程序中使用。從12月13日開始,開發者和企業客戶可以通過谷歌AI Studio或谷歌Cloud Vertex AI中的Gemini API(應用程序編程接口)訪問Gemini Pro。安卓開發人員可以使用Gemini Nano完成構建。
總之,Gemini作為谷歌最新的大型語言模型,具有強大的功能和靈活的適配能力。通過海量數據訓練和多模態功能,它可以回答復雜問題、生成和理解代碼以及處理各種類型的數據。這些功能對于金融、科技、醫療等領域的科研和業務人員來說非常有幫助。隨著更多用戶開始使用Gemini,它有望在各個領域發揮更大的作用。
原創文章,作者:秋秋,如若轉載,請注明出處:http://www.bdzhitong.com/article/603297.html