9月5日,騰訊宣布推出新一代大模型“混元Turbo”,相比前代模型,騰訊混元Turbo性能有顯著提升,訓練效率提升108%,推理效率提升 100%,推理成本降低 50%,解碼速度提升 20%,效果在多個基準測試上對標GPT-4o,第三方測評居國內第一。

在騰訊全球數字生態大會上,騰訊公司副總裁、云與智慧產業事業群COO兼騰訊云總裁邱躍鵬宣布,騰訊混元Turbo在騰訊云上線,輸入和輸出價格只有前代模型的一半,企業和開發者可以直接在云上接入使用。
目前,騰訊混元在騰訊云上提供了多種尺寸的模型服務,通過API、專屬模型、精調模型等接入和使用方式面向企業及個人開發者全量開放。騰訊混元在云上提供了Turbo、Pro、Standard、Lite等多個版本;在專屬模型上開放了代碼生成、角色扮演、Functioncall等;企業也可以通過騰訊云TI平臺對騰訊混元進行精調。

(圖:公開benchmark測評騰訊混元Turbo與國內外大模型對比)
從去年開始,騰訊混元在國內率先采用MoE結構,并在這一技術路線上持續升級,通過自研的萬億級層間異構MoE結構,在模型不同層采用不同的專家個數和不同的激活參數量,同時優化訓練數據,使得新一代模型混元Turbo在效果和性能上均實現大幅度的提升。
在業界公認的benchmark指標上,騰訊混元Turbo處于國內行業領先地位,效果接近國外頭部模型GPT4o和Claude3.5。作為新一代旗艦大模型,騰訊混元Turbo在語言理解、文本創作、數學和代碼等領域都有較大提升,跟前代模型相比,復雜數學解決能力提升38%,代碼能力提升32%。

(圖:公開benchmark測評騰訊混元Turbo與國內外大模型對比)
9月2日,中文大模型測評基準SuperCLUE發布《中文大模型基準測評2024年8月報告》,騰訊混元Turbo憑借在多個核心任務上的出色表現,總得分居國內大模型第一名。作為國內成績最好的模型,騰訊混元Turbo在理科、文科均居于第一名。在圍繞復雜任務和高階推理的Hard任務上,騰訊混元Turbo表現出色,取得74.33分,是國內唯一超過70分的大模型,僅與ChatGPT-4o有微小差距。
作為騰訊全鏈路自研的大模型,自2023年9月正式亮相以來,騰訊混元通過持續的迭代和實踐,積累了從底層算力到機器學習平臺再到上層應用的自主技術,其行業領先技術實力獲多方認可,在中國電子學會2023科學技術獎評選中,騰訊混元《面向大規模數據的Angel機器學習平臺關鍵技術及應用》獲科技進步一等獎。
基于領先的模型能力積累,騰訊混元大模型正在積極推進內部應用落地,讓大模型創造更多價值,目前騰訊內部近700個業務及場景已接入,包含騰訊元寶、騰訊云、QQ、微信讀書、騰訊新聞、騰訊客服等。此前,騰訊旗下協作SaaS(軟件即服務)產品全面接入騰訊混元大模型。
原創文章,作者:蘋果派,如若轉載,請注明出處:http://www.bdzhitong.com/article/678519.html