
在3月19日舉行的NVIDIA GTC 2025技術大會上,英偉達正式推出基于DeepSeek-R1大模型的AI推理系統。官方披露,搭載八塊Blackwell架構GPU的NVIDIA DGX超級計算機,在運行完整版6710億參數模型時,實現單用戶每秒250個令牌的實時響應速度,系統整體吞吐量峰值突破每秒3萬令牌,刷新全球大模型推理性能紀錄。
此次發布的DeepSeek-R1系統采用英偉達最新Blackwell GPU集群,單機配置八塊加速卡,支持FP8精度下的動態稀疏計算。技術文檔顯示,該模型在處理千億級參數時,推理延遲較上一代Hopper架構降低45%,能源效率提升2.3倍,可同時承載超過1200個并發用戶的交互需求。
英偉達現場演示了該系統在多模態場景下的應用表現:在實時視頻流解析任務中,系統同步完成畫面識別、語義理解和邏輯推理,響應時間穩定在900毫秒以內。企業級解決方案中,DeepSeek-R1已部署于金融高頻交易風控、工業數字孿生仿真等20余個垂直領域。
據官方測試數據,該系統在語言生成基準測試中,單卡處理速度達每秒1800個漢字,較開源同類模型快4倍。在醫療影像分析場景,其推理準確率較傳統方案提升12個百分點,誤診率降至0.37%。全球已有三家超算中心確認采購該架構,計劃于2025年三季度投入運營。
英偉達同時宣布,DeepSeek-R1的云服務接口將于6月向開發者開放,支持API調用和私有化部署。目前,該系統兼容PyTorch、TensorFlow等主流框架,并針對生物制藥、自動駕駛等數據密集型行業推出定制優化方案。
原創文章,作者:AI,如若轉載,請注明出處:http://www.bdzhitong.com/article/710872.html