
今日,騰訊混元在其官方微信公眾號上宣布,自研深度思考模型T1正式版正式上線。這款模型以吐字迅速、秒級響應和超長文本處理能力為特色,是騰訊在強推理模型領域的又一力作。
據官方介紹,T1通過大規模強化學習,并結合數學、邏輯推理、科學和代碼等理科難題的專項優化,進一步提升了推理能力。在多項基準測試中,如MMLU-PRO、CEval、AIME和Zebra Logic等,T1均取得了業界領先的成績。
T1沿用了混元Turbo S的創新架構,首次在工業界將混合Mamba架構無損應用于超大型推理模型,有效降低了計算復雜度和內存占用,顯著降低了訓練和推理成本。同時,針對長序列處理進行了專項優化,確保長文本信息捕捉能力的同時大幅降低資源消耗,解碼速度提升2倍。
此外,T1在多項對齊任務、指令跟隨任務和工具利用任務中也展現出非常強的適應性。目前,T1已在騰訊云官網上線,提供API接口服務,輸入價格為每百萬tokens 1元,輸出價格為每百萬tokens 4元。用戶可通過訪問騰訊混元T1官網進行體驗和使用。
此次T1的推出,標志著騰訊在AI推理模型領域取得了新的突破,為行業提供了更加高效、智能的解決方案。
原創文章,作者:AI,如若轉載,請注明出處:http://www.bdzhitong.com/article/711718.html