
當地時間周日,有外媒報道了關于英偉達Blackwell處理器災情的消息。英偉達新一代Blackwell處理器在高容量服務器機架中遭遇了嚴重的過熱問題。這一技術難題不僅導致了設計上的多次調整,還迫使項目延期,引發了谷歌、Meta和微軟等主要客戶對能否按計劃部署Blackwell服務器的深切擔憂。
據知情人士透露,Blackwell GPU是英偉達專為人工智能(AI)和高性能計算(HPC)領域設計的高端產品。然而,在配置72個處理器的服務器機架中,其過熱問題尤為突出。這類服務器機架的功耗極高,每個機架的功耗最高可達120千瓦。過熱問題不僅迫使英偉達多次修改機架設計,還限制了GPU的性能發揮,甚至存在損壞硬件的風險。
面對這一技術挑戰,英偉達迅速采取行動,要求供應商調整機架設計,并與合作伙伴共同優化散熱系統。盡管這種工程改進在大規模技術發布中屬于常規步驟,但無疑進一步推遲了產品的交付時間。英偉達發言人對此向路透社表示,公司正與云服務提供商緊密合作,設計調整是正常研發流程的一部分。英偉達希望通過這種合作,確保最終產品在性能和可靠性方面均能達到預期標準,并盡快解決當前的技術瓶頸。
從相關報道中獲悉,經過修訂的Blackwell GPU于今年10月底才正式進入量產階段,預計最快將于明年1月底出貨。這一延期對于依賴英偉達GPU訓練最強大AI模型的谷歌、Meta、微軟等科技巨頭而言,無疑將對其研發計劃和產品發布產生不可避免的影響。
值得一提的是,英偉達在今年3月曾展示了Blackwell芯片,并當時表示計劃在第二季度發貨。然而,由于過熱問題的出現,這一計劃不得不被迫推遲。
此次Blackwell處理器的過熱問題再次凸顯了高端芯片研發過程中的復雜性和不確定性。英偉達作為GPU領域的領軍企業,將如何克服這一技術難題,并盡快將產品推向市場,值得業界密切關注。
原創文章,作者:AI,如若轉載,請注明出處:http://www.bdzhitong.com/article/693613.html