云HPC時代已至 NVIDIA如何驅動數據中心網絡運作
云計算、AI、5G等技術的發展正在改變整個世界的面貌,作為承載這些新興技術的基礎設施,數據中心也在面臨來自各個維度的壓力,微觀角度來看,近幾年摩爾定律的失速正使得CPU性能增長的邊際成本急劇上升。有數據表明,CPU性能的年化增長率已不足每年5%,但人們對于計算性能的需求依然居高不下,這使得云和通信服務商必須不斷耗費高昂的成本來對基礎設施進行升級和維護,以滿足算力需求。而從宏觀角度來看,隨著AI的惠普,超級計算中心也正在為越來越多的用戶開放,如何為數以百萬計的客戶提供高效的超級計算服務也成為了云服務提供商需要考慮的問題。
在此背景下,為CPU減負成為了降本增效,提高效率的有效手段。要知道,現在除了主內存和輔助內存之外的所有計算都是在CPU上完成的,面對超大規模數據處理的需求,CPU的算力已經達到瓶頸,盡可能地從CPU內核中卸載虛擬化、容器化、安全化工作負載的繁瑣開銷,一方面是對CPU性能價值的充分釋放,另一方面也是對數據處理與存儲等工作負載的更好平衡。
芯片巨頭們都看到了這樣的需求和趨勢,近幾年來在數據中心領域占據較大優勢的NVIDIA先是在前年發布了首代DPU BlueField-2,然后又在去年的GTC21宣布了NVIDIA的芯片戰略正式升級為CPU+GPU+DPU,足見NVIDIA對DPU市場的重視。
但DPU的作用,絕不僅僅是替CPU減負這么簡單。當下的數據中心雖然足夠靈活,但其基礎架構就會對CPU造成極大的開銷,過去以CPU為中心的數據中心已經無法滿足靈活性與高性能的雙重需求,換言之,過去在計算規模和數據量較小的情況下,僅憑馮諾依曼架構就能解決提高性能的問題,而在當下數據量越來越大,云計算、AI火熱發展的情況下,傳統的計算模型十分容易造成網絡擁塞,反而加重數據中心的負擔。
因此,DPU一方面能針對安全、存儲、網絡、AI、HPC等業務進行加速,為以后迫在眉睫的E級計算鋪平了道路,另一方面則為數據中心的計算架構提供了全新的思路,以實現過去無法實現的功能。
今年的GTC大會上,NVIDIA則帶來了新一代InfiniBand網絡平臺Quantum-2和全新升級的DOCA 1.2。前者是迄今為止最先進的端到端高性能網絡平臺,憑借其云原生技術,可提供每秒400Gb/s的高吞吐量和先進的多租戶支持功能,可滿足眾多企業的要求;后者則支持了云原生架構,開發者可借助DOCA將加速安全作為一項服務進行部署。
NVIDIA Quantum-2平臺即新一代400Gbps InfiniBand網絡平臺,包括NVIDIA Quantum-2交換機、ConnectX-7網卡、BlueField-3數據處理器(DPU)和支持新架構的軟件,可為云計算提供商和超級計算中心提供極致的性能、廣泛的接入能力和強大的安全性,助力AI、數據分析和高性能計算應用,并提供安全性和QoS 保證。
整體來看,憑借每端口高達400Gbps的吞吐量,NVIDIA Quantum-2 InfiniBand可在增加三倍網絡端口數量的基礎上將網速提高一倍,并把數據中心網絡所需的交換機減少了6倍,降低了數據中心7%的能耗與空間;此外,NVIDIA Quantum-2平臺可實現多租戶之間的性能隔離,因此一個租戶的行為并不會影響到其他租戶,同時通過利用主動遙測和支持云原生的擁塞控制機制,可確保可靠的數據吞吐量,且不受用戶或應用需求高峰的影響。
不僅如此,NVIDIA Quantum-2內置的SHARPv3網絡計算技術可為AI應用提供超出上一代產品32倍的加速引擎能力,借助NVIDIA UFM Cyber-AI平臺,NVIDIA Quantum-2可為數據中心提供包括預測性維護在內的InfiniBand網絡管理功能;同時NVIDIA Quantum-2也集成了納秒級精度的時鐘系統以同步分布式應用,有助于減少數據庫處理等操作的等待時間,在納秒時鐘同步的加持下,云數據中心可成為電信網絡的一部分,用來托管軟件定義的5G服務。
目前,包括Atos、DataDirectNetworks(DDN)、戴爾、Excelero、惠普、IBM、浪潮、聯想、Penguin Computing、QCT、超微、VAST Data和WekaIO在內的基礎架構和系統廠商已支持NVIDIA Quantum-2平臺。
未來的超級計算機既要提供出色性能,又需要具備多租戶安全性,云原生超級計算平臺正是一個理想的解決方案。為了提供卓越的裸機性能和原生支持多節點租戶隔離,NVIDIA Quantum-2交換機的重要性不言而喻,它也是NVIDIA Quantum-2平臺的核心,其主芯片采用7nm制程,包含570億個晶體管,數量甚至要比NVIDIAA100 GPU還要再多一些,此外,NVIDIA Quantum-2交換機擁有64個400Gbps端口或128個200Gbps接口,并可提供最高可達2048個端口數的模塊式交換機系統,交換能力超出上一代Quantum-1約5倍。憑借著在網絡速度、交換能力和擴展性方面的優勢,NVIDIA Quantum-2交換機成為了構建下一代高性能計算機系統的理想選擇。
實現云原生超級計算平臺架構升級的關鍵要素是DPU,而此次NVIDIA Quantum-2平臺在主機端則提供了兩個網絡選項,分別是NVIDIA BlueField-3 DPU InfiniBand和NVIDIA ConectX-7智能網卡。
BlueField-3作為首款為AI和加速計算而設計的DPU,可助力各企業在任何規模的應用上實現領先的性能和數據中心的安全性。這款DPU針對多租戶、云原生環境進行了優化,提供數據中心級的軟件定義和硬件加速的網絡、存儲、安全和管理等服務。
BlueField-3 DPU可以從業務應用中將數據中心的基礎設施服務卸載和隔離出來,實現了由傳統基礎設施到現代基于“零信任”環境的轉型,可對數據中心的每個用戶進行身份認證,保障了企業從云到核心數據中心,再到邊緣的安全性,同時在效率和性能上有了更大的提升。
技術細節方面,BlueField-3 InfiniBand采用7nm工藝,包含220億個晶體管,提供16個64位Arm CPU,以卸載和隔離各種數據中心基礎設施服務,樣片將于明年5月問世。
而NVIDIA ConectX-7網卡提供多達4 個連接端口和高達400Gb/s 的吞吐量,可為云、電信、AI和企業工作負載提供數據中心規模的硬件加速網絡、存儲、安全和管理服務。ConnectX-7具有加速交換和數據包處理(ASAP2)、高級RoCE、GPUDirect Storage,以及用于TLS、IPsec和 MACsec加密與解密的in-line 硬件加速等功能,能夠為敏捷、高性能的網絡解決方案提供助力。ConnectX-7讓客戶能夠在高帶寬和高密度環境中滿足目前和未來的網絡需求。
與BlueField-3 InfiniBand相同,NVIDIA ConectX-7同樣基于7nm工藝設計,包含80億個晶體管,其數據傳輸速率是目前世界領先的高性能計算網絡芯片NVIDIAConectX-6的兩倍,還使RDMA、GPUDirect Storage、GPUDirectRDMA和網絡計算的性能翻倍,其樣片也將于明年1月問世。
除了硬件之外,NVIDIA片上數據中心基礎架構(DOCA)使基礎設施開發者能夠利用行業標準API,在NVIDIA BlueField DPU上快速創建網絡、存儲、安全、管理、AI和 HPC等各種應用和服務。借助DOCA,開發者可以通過創建高性能、軟件定義和云原生DPU加速的服務,對未來的超級計算基礎設施進行編程,現在它也迎來了1.2版本。
現如今,數據中心需要處理日益增長的用戶、應用和流量,在缺乏零信任保護模式的情況下,企業極易受到攻擊,這也是NVIDIA DOCA 1.2產生的背景,開發者可借助DOCA1.2零信任安全框架,實現網絡安全即服務,包括建立量化的云服務控制資源訪問、驗證每個應用和用戶、隔離可能受到影響的機器并保護數據免遭竊取等,涵蓋應用、數據、設備、存儲、基礎架構等每個關鍵點。
此外,DOCA1.2提供了軟件和硬件認證、硬件加速的線速數據加密、對分布式防火墻和智能遙測的支持,以及租戶之間的安全隔離等策略,所有功能都可作為容器部署。
除了DOCA1.2之外,NVIDIA也帶來了基于NVIDIA RAPIDS的零信任AI應用框架Morpheus,可以分析來自網絡流量日志、應用日志和云日志的數據,并提醒安全運營團隊注意潛在的安全漏洞。
目前NVDIA Morpheus已上市,而NVIDIA DOCA 1.2將于11月30日開放搶先體驗,BlueField DPU則即將隨華碩、Atos、思科、戴爾、新華三、浪潮、聯想、寧暢、Quanta/QCT和超微等廠商推出的系統而推出。
從傳統的高性能計算到新型的加速計算,再到現如今超級計算中心與公有云的融合,下一代超級計算中心將為HPC、AI與數分析提供盡可能高的性能,并提供安全隔離應用,同時響應用戶對流量的不同需求。現如今,NVIDIA正在用3U(CPU、GPU、DPU)一體的架構使得未來數據中心的管理程序與調度程序變得更加簡單,以實現從邊緣到數據中心的統一架構、統一管理和統一調度。而全新的NVIDIA Quantum InfiniBand平臺,正是NVIDIA邁向云HPC的重要一步。
華碩ROG-STRIX-RTX3060-O12G-V2-GAMING NVIDIA Ampere流式多處理器,軸流風扇設計,GPU Tweak II
進入購買
2022-01-13 08:29:23
2022-01-13 08:27:53
2022-01-13 08:25:49
2022-01-13 08:24:48
2022-01-13 08:23:24
2022-01-13 08:21:58
2022-01-13 08:19:20
2022-01-13 08:17:53
2022-01-13 08:12:40
2022-01-13 08:11:31
2022-01-13 08:08:09
2022-01-12 16:50:28
2022-01-12 14:16:53
營業執照公示信息
相關新聞