6月13日,阿里云宣布推出云基礎設施處理器CIPU(Cloud Infrastructure Processing Unit ),這是為新型云數據中心設計的專用處理器,將替代CPU成為云時代IDC的處理核心。它可對計算資源進行云化加速,并可部署飛天操作系統對云資源進行管控。阿里云智能總裁張建鋒表示,云計算進入了一個關鍵突破期,今年要Back to Basic,堅持在技術的長征路上,不斷取得突破。
云基礎設施處理器CIPU(Cloud infrastructure Processing Units ),是阿里云為新型云數據中心設計的專用處理器,用于加速和管控計算資源,將替代CPU成為云時代IDC的處理核心。在這個全新體系架構下,CIPU向下對數據中心的計算、存儲、網絡資源快速云化并進行硬件加速,向上接入飛天云操作系統,管控阿里云全球上百萬臺服務器。
1、CIPU的三大特性:
l 網絡:對高帶寬物理網絡進行硬件加速,通過建設大規模的eRDMA分布式高性能網絡,實現RDMA技術的普惠化;
l 存儲:對存算分離架構的塊存儲接入進行硬件加速,提供超高性能的云盤;
l 計算:快速接入不同類型資源的神龍計算平臺,帶來算力的“0”損耗,以及硬件級安全的加固隔離。
2、為什么要有CIPU?
過去十多年,云計算技術發展經歷了兩個階段:
l 第一階段是分布式技術,推動互聯網企業從大機向分布式系統整個遷移;
l 第二階段誕生了資源池化技術,通過計算存儲分離的架構,對資源統一的調度編排,提高云計算的可靠性和可用性。
這兩個階段都是以CPU為中心的計算體系架構,解決了部分計算的需求。但云上客戶的需求發生了巨大的變化,就像內燃機發明之后,人類對載具速度的想象力從馬車時代進入了汽車時代。
隨著數據密集型計算越來越多,傳統以CPU為中心的計算體系架構無法適應這一趨勢:
第一,以CPU為中心的架構導致了計算和網絡傳輸的時延大;
第二,大數據應用增多,導致數據中心內部數據遷移量增多,以CPU為中心的架構無法提供高帶寬;
第三,管理的基礎設施規模越來越大,阿里云在全球27個國家和地區、84個可用區管理著超過上百萬臺服務器,基于CPU為中心的架構無法解決超大規模的復雜管理問題。
為了解決以上問題,需要對數據中心內部的云計算體系架構進行改革創新,從以CPU為中心的體系架構進入以飛天操作系統+CIPU為中心的體系架構。
3、CIPU帶來哪些改變?
基于CIPU和飛天操作系統的新一代云計算架構體系,無論是在分布式應用還是人工智能的場景測試中,都展現了優越的性能。
存儲方面,通過全硬件虛擬化和轉發加速,存儲時延最低可至30us(PLX),IOPS高達300萬,存儲帶寬可達200 Gbps,全面超越市面上所有云產品,云端能提供比本地更安全可靠且高性能的存儲能力。
網絡方面,基礎帶寬從100G升級至200G,VPC的PPS轉發性能從2000萬提升至4000萬,網絡時延從22us降低至16us,RDMA協議下更可低至5.5us。應用上云之后,比自建物理機的集群吞吐量提升了30%,業務高峰期延遲下降了90%。
計算方面,單容器虛擬化消耗減少50%,虛擬化容器啟動速度快350%。主流通用計算場景下,Nginx性能提升了89%,Redis性能提升了68%、MySQL提升了60%。大數據和AI 場景下,AI深度學習場景訓練性能提升30%,Spark計算性能提升30%。同時,神龍計算平臺可以提前預測80%的硬件故障,并進行無感熱遷移規避,從而實現了業界領先的高可用SLA。
原創文章,作者:蘋果派,如若轉載,請注明出處:http://www.bdzhitong.com/article/555473.html