在昨日舉行的ISC 2019國際超算大會上,全球超算500強出爐,中國超算失榜首但在數量上以219臺蟬聯第一,遠超過美國116臺,而美國Summit以20億億次運算速度暫奪世界超級計算機領域的頭把交椅,據悉,這臺超級計算機搭載的近28000塊NVIDIA GPU提供了95%的計算力。
現如今,超級計算機領域已開始向百萬兆級計算規模進擊。美國目前在建的Aurora及Frontier中包括加速器等主要硬件分別由Intel及AMD提供。NVIDIA也不甘缺席,在本屆超算大會上宣布,將利用其芯片與Arm的處理器打造超級計算機,進一步推動英偉達開發用于氣候變化預測和核武器建模的系統。NVIDIA支持Arm CPU,或為高性能計算行業構建節能、支持AI的百萬兆級超算開辟全新途徑。
Arm具備足夠實力進擊Exascale超算領域
英國Arm公司是全球領先的半導體知識產權(IP)供應商, 于2016年被日本軟銀集團(SoftBank)以234億英鎊(約合310億美元)高價收購,該公司為大多數手機芯片提供底層處理器技術。
但Arm處理器與英特爾或IBM芯片的不同之處在于,Arm本身并不制造芯片。相反,它將底層技術授權出去,這樣其他人就可以自主制造芯片。華為、蘋果、三星、高通、飛利浦等各大芯片廠商們都從Arm那里購買授權,全球超90%的智能設備均采用Arm架構,包括手機、平板、手表、電視、無人機等。
在超大規模數據中心和高性能計算的服務器市場,英特爾x86處理器長期占據主導地位, 隨著Arm處理器的崛起,傳統x86 CPU市場面臨著巨大的威脅。
經過多年發展,很多面向高性能計算的應用及AI框架也支持了Arm指令集架構,同時目前Arm內核的性能也大幅提高。和其他架構相比,Arm的一大特色在于出色的能效,它能夠為超級計算機提供開放式架構,因此用戶可以添加各種有益于超級計算的技術,例如緊密集成。
一直以來,Arm都在尋求機會將其處理器擴展至高性能計算領域。2016年8月宣布將與日本富士通公司合作,開發一個以64位ARMv8-A驅動的Post K超級計算機;同年12月宣布收購Allinea Software公司,后者主要為超級計算機提供性能分析工具;2018年6月,美國能源部下屬的桑迪亞國家實驗室宣布建造基于Arm處理器的超算Astra,并于同年11月現身TOP500列表;于此同時,Cray在英國氣象局交付了一臺基于Arm的超級計算機Isambard;而且日本的下一代超級計算機Post-K也同樣基于Arm架構。
就美國超級計算機Astra為什么選擇Arm,制造方惠普稱“Arm服務器在功耗方面更加經濟,可以打包的更加緊密,且惠普青睞該平臺的內存性能。”
而且如中國的飛騰等公司已經使用ARMv8指令集設計出了FT-2000+/64處理器,Arm加入Exascale超算領域其實力已然足夠。
據悉,全球眾多涉及超級計算的項目或單位都在尋求Arm的加入,包括歐洲處理器計劃(European Processor Initiative)、日本先進情報項目中心 (RIKEN)、美國能源部的先鋒項目(DOE Vanguard project)等。
NVIDIA將支持Arm CPU打造超級計算機
長期以來,NVIDIA始終以為PC提供圖形芯片而聞名,以使視頻游戲看起來更逼真。近些年來NVIDIA在AI新興領域投入巨大,其CUDA加速計算實力不可小覷,因而日益成長為數據中心市場的佼佼者。
NVIDIA的CUDA GPU芯片被用于與英特爾、IBM等公司的中央處理器(CPU)協同工作,完成大規模并行計算的加速任務。昨日發布的Green500排行榜,在全球最節能的25款超級計算機中,有22款都得益于NVIDIA的支持。
而實現這些的關鍵因素在于:采用NVIDIAGPU的超級計算機能夠將繁重的處理作業卸載至更為節能的并行處理CUDA GPU之上;NVIDIA與Mellanox合作優化整體超級計算集群的處理;以及NVIDIA發明的SXM3D封裝和可實現極密集型擴展節點的NVIDIA NVLink互連技術。
據了解,NVIDIA與Arm有10年的合作基礎,此前,NVIDIA幾款用于便攜式游戲、自動駕駛汽車、機器人和嵌入式AI計算的系統級芯片產品都采用了Arm。對于此次雙方推進在在超算領域的合作,NVIDIA解決方案架構與工程團隊副總裁Marc Hamilton表示,NVIDIA和Arm已為這個計劃準備了兩年左右,現在是最佳的發布時機。
盡管英偉達加速計算部門副總裁伊恩·巴克(Ian Buck)表示,從技術角度看,建造配有Arm處理器的超級計算機將是一個“嚴峻的考驗”。但他坦言,英偉達之所以這么做,是因為歐洲和日本的研究人員希望利用Arm的技術開發超級計算芯片,這實際上為他們提供了超越IBM和英特爾的第三種選擇,他們可以在這方面擁有更多控制權。
談及Arm的技術時,巴克表示,“這種開放性使得Arm的技術非常有吸引力,它能夠為超級計算提供一個開放式架構,這也是我們宣布支持Arm的原因。”
據悉,NVIDIA將于今年年底前向Arm生態系統提供全堆棧的AI、HPC軟件,該堆棧為600多個HPC應用程序和所有AI框架提供加速,其中包括了所有NVIDIA CUDA-X AI和HPC庫、GPU加速的AI框架和軟件開發工具,比如支持OpenACC的PGI編譯器和性能分析器。
堆棧優化完成后,NVIDIA將為所有主要CPU架構提供加速,至此,NVIDIA將完成了在x86、POWER(OpenPower)及Arm多種處理器指令集體系結構上構建超算。對于Arm而言,通過將NVIDIA軟件棧引入Arm生態系統,將進一步助推其在HPC服務器市場的創新。
NVIDIA創始人兼首席執行官黃仁勛表示:“NVIDIA CUDA加速的計算和Arm的高能效CPU架構的相結合,將助力HPC社區實現大幅提升,以達到百萬兆級。”
對于NVIDIA CUDA架構向Arm的開放,超級計算中心、系統提供商和系統級芯片制造商,包括Ampere Computing、Cray、CSC、EPI、HPE、Julich、Marvell、Mellanox、日本物理化學研究所計算科學研究中心等,均認為該舉有利于解決HPC行業日益不可持續的功耗水平問題。
作為促進科學發現的重要工具,超級計算機已挺進“百萬兆級”。在這個賽道上,如今又迎來了一位新的重量級選手。NVIDIA 能否將 CUDA和Arm的軟件生態無縫銜接, 為高性能計算行業構建節能、支持AI的百萬兆級超算開辟全新途徑,值得觀望。