美國超算奪冠實(shí)現(xiàn) “E級(jí)” 突破!中國面臨哪些挑戰(zhàn)?

中國超級(jí)計(jì)算機(jī)的自主創(chuàng)新之路還任重而道遠(yuǎn) | 圖源:pixabay.com
2022年5月30日,第59屆全球超算前500強(qiáng)榜單(TOP500)發(fā)布,美國巨型計(jì)算機(jī)系統(tǒng) “前沿(Frontier)” 以每秒110.2億億次的運(yùn)算速度登頂。TOP500官網(wǎng)寫道:“前沿” 不僅是有史以來最強(qiáng)大的超級(jí)計(jì)算機(jī),而且是第一臺(tái)真正的E級(jí)計(jì)算機(jī)器。
在超算系統(tǒng)這個(gè)領(lǐng)域,中美是最重要的玩家。中美超級(jí)計(jì)算機(jī)占據(jù)TOP500排行榜的一半以上,相比上一屆,中國保持在173臺(tái)不變,擁有列表中最多的超算系統(tǒng)(34.6%),美國從150臺(tái)下降到126臺(tái)(25.4%)。然而,細(xì)究起來,中國超級(jí)計(jì)算機(jī)的自主創(chuàng)新之路還任重而道遠(yuǎn),面臨著原創(chuàng)能力不足、人才匱乏及應(yīng)用較少等問題。
撰文 | 宋安娜
責(zé)編 | 錢煒
● ● ●
備受關(guān)注的下一代超級(jí)計(jì)算機(jī)——E級(jí)超算系統(tǒng)終于問世。這個(gè)進(jìn)展標(biāo)志著超級(jí)計(jì)算新時(shí)代的到來,也讓美國在計(jì)算速度上重新奪回了世界第一。
這臺(tái)只需要一秒鐘就能計(jì)算百億億次的機(jī)器,是位于美國田納西州橡樹嶺國家實(shí)驗(yàn)室的巨型計(jì)算機(jī)系統(tǒng) “前沿(Frontier)”。當(dāng)?shù)貢r(shí)間5月30日,全球超算盛會(huì)ISC22在德國漢堡市開幕,會(huì)上發(fā)布了第59屆全球超算前500強(qiáng)榜單(TOP500)。TOP500官網(wǎng)寫道:“前沿” 不僅是有史以來最強(qiáng)大的超級(jí)計(jì)算機(jī),而且是第一臺(tái)真正的E級(jí)計(jì)算機(jī)器。

圖12022年6月公布的第59版Top500超級(jí)計(jì)算機(jī)排名(前5名列表)| 圖源:Top500官網(wǎng)
在運(yùn)算速度上,“前沿” 有著非常顯著的優(yōu)勢(shì),比榜單上第二名的日本“富岳”在算力上拉開兩倍以上的差距。不過,還不光是如此,美國加州大學(xué)計(jì)算機(jī)工程博士劉少山指出,超級(jí)計(jì)算機(jī)是一個(gè)極其復(fù)雜的系統(tǒng)工程,任何一個(gè)短板都可能成為算力的瓶頸,因此 “前沿” 超級(jí)計(jì)算機(jī)的突破背后,是在多項(xiàng)技術(shù)上的領(lǐng)先。

圖2 美國田納西州橡樹嶺國家實(shí)驗(yàn)室的巨型計(jì)算機(jī)系統(tǒng) “前沿(Frontier)” | 圖源:olcf.ornl.gov/
過去,關(guān)于如何衡量超級(jí)計(jì)算機(jī)的進(jìn)展,學(xué)界沒有公認(rèn)的最佳標(biāo)準(zhǔn)。1990年代初期,美國田納西大學(xué)電氣工程和計(jì)算機(jī)科學(xué)杰出教授杰克·唐加拉(Jack J. Dongarra)使用Linpack代碼,創(chuàng)造出衡量超級(jí)計(jì)算機(jī)能力的測(cè)試。有了Linpack,科學(xué)家可以知道超級(jí)計(jì)算機(jī)每一秒運(yùn)行多少次計(jì)算,進(jìn)而可以比較哪臺(tái)機(jī)器是地球上運(yùn)行最快的。
在唐加拉等人的主持下,從1993年開始,全球超級(jí)計(jì)算機(jī)500強(qiáng)榜單TOP500開始發(fā)布,每半年公布一次。不同以往的是,今年這次的榜單很有看頭。美國超算系統(tǒng) “前沿” 以1.102 Exaflop/s(每秒110.2億億次)的Linpack峰值性能登頂TOP500,實(shí)測(cè)性能成功突破1 Exaflop的障礙,E級(jí)超算終于到來。
“前沿” 由美國能源部負(fù)責(zé)運(yùn)營(yíng)。這個(gè)龐大的超級(jí)計(jì)算機(jī)系統(tǒng)由74個(gè)機(jī)柜組成,可容納9408個(gè)節(jié)點(diǎn)。它配備AMD公司的處理器,共有超過873萬個(gè)內(nèi)核,系統(tǒng)能效比為52.23GFlops/W,依靠千兆以太網(wǎng)進(jìn)行數(shù)據(jù)傳輸。數(shù)據(jù)顯示,榜單第二名超算系統(tǒng),亦即日本 “富岳” 的Linpack基準(zhǔn)測(cè)試峰值性能為每秒44.2億億次,不到 “前沿” 的一半。

圖3 “前沿” 節(jié)點(diǎn)圖 | 圖源:olcf.ornl.gov/
E級(jí)超算此前被認(rèn)為是超級(jí)計(jì)算機(jī)領(lǐng)域的 “下一頂皇冠”。所謂E級(jí)超算,是指能在一秒鐘實(shí)現(xiàn)百億億次數(shù)學(xué)運(yùn)算的超級(jí)計(jì)算機(jī)。一般情況下,要能夠被稱為E級(jí)計(jì)算機(jī),雙精度浮點(diǎn)運(yùn)算能力峰值或超算TOP500的HPL(High Performance Linpack)實(shí)測(cè)性能要達(dá)到E級(jí),并要滿足系統(tǒng)能耗比、內(nèi)存容量、存儲(chǔ)容量等方面的要求。
早在2008年,國際高性能計(jì)算界就提出了E級(jí)計(jì)算機(jī)的議題,并開始了研討和預(yù)研工作。近年來,世界各國紛紛設(shè)立E級(jí)超算相關(guān)研究專項(xiàng),包括美國的ECP、歐洲的EuroHPC、中國的 “高性能計(jì)算專項(xiàng)” 等。
“前沿” 是美國ECP計(jì)劃(美國能源部E級(jí)計(jì)算計(jì)劃,Exascale Computing Project)重點(diǎn)資助的項(xiàng)目。2016年,美國能源部公布ECP計(jì)劃,投入18億美元用于研制三臺(tái)E級(jí)計(jì)算機(jī),又投資18億美元用于應(yīng)用研發(fā)。
根據(jù)當(dāng)初的計(jì)劃,英特爾和阿爾貢國家實(shí)驗(yàn)室主導(dǎo)研制的“Aurora”原本預(yù)計(jì)2021年交付,在性能上突破1EFlops。AMD公司主導(dǎo)其余兩臺(tái)E級(jí)超算的研制,“前沿(Frontier)” 預(yù)計(jì)峰值性能達(dá)1.5EFlops,于2021年交付;另一臺(tái) “El Capitan” 會(huì)融合 “前沿” 的技術(shù),在2023年初交付,實(shí)現(xiàn)超過2EFlops的峰值性能,并采用針對(duì)高性能計(jì)算和AI工作負(fù)載而優(yōu)化的新型架構(gòu)。
現(xiàn)在看來,“前沿” 的交付時(shí)間雖然比預(yù)計(jì)晚了一些,但早于ECP布局的 “Aurora” 先跨越了這一里程碑。據(jù)報(bào)道,因英特爾供應(yīng)鏈?zhǔn)苡绊懀珹urora所需的處理器和GPU延期交付,而導(dǎo)致了落后,該E級(jí)計(jì)算機(jī)預(yù)計(jì)于今年晚些時(shí)候推出。
2020年~2021年的四屆TOP500榜單,均由日本超算 “富岳” 霸占榜首。 “前沿” 問世后,“富岳” 滑至第二。芬蘭新超算LUMI奪得第三,美國IBM的Summit和Sierra分列第四、第五;曾經(jīng)在2016~2017年在該榜單上位列第一的中國的 “神威·太湖之光” 現(xiàn)在排名第六;中國的 “天河二號(hào)A” 排名第九。

圖4 “神威·太湖之光” | 圖源:china.com.cn/
雖然 “富岳” 前兩年表現(xiàn)出色,不過,在超算系統(tǒng)這個(gè)領(lǐng)域,中美才是最主導(dǎo)的玩家。中美超級(jí)計(jì)算機(jī)仍占據(jù)TOP500排行榜的一半以上,相比上一屆,中國保持在173臺(tái)不變,擁有列表中最多的超算系統(tǒng)(34.6%),美國從150臺(tái)下降到126臺(tái)(25.4%)。
在 “富岳” 被 “前沿” 超越后,《日經(jīng)亞洲評(píng)論》寫道,日本面臨的問題是如何制定 “后富岳” 時(shí)代的戰(zhàn)略,開發(fā)大型超算需要近8億美元預(yù)算,而日本的公共財(cái)政狀況正不斷惡化。在全球超算競(jìng)賽中,日本正努力跟上領(lǐng)先者的步伐。在此次榜單中,來自日本的超算系統(tǒng)占比為6.8%,排在中、美后面。
今年3月,中山大學(xué)國家超算廣州中心主任盧宇彤在接受媒體采訪時(shí)總結(jié)了各國競(jìng)爭(zhēng)態(tài)勢(shì)。她說,美國仍是超算領(lǐng)域最具競(jìng)爭(zhēng)力的國家。日本研制和應(yīng)用的水平比較高而且有特色;歐洲雖然投入比較少,但他們的超算應(yīng)用能力比較強(qiáng)。中國近年來超算系統(tǒng)和應(yīng)用都取得了快速發(fā)展,進(jìn)入世界領(lǐng)先行列。
北京航空航天大學(xué)計(jì)算機(jī)學(xué)院教授錢德沛與副教授王銳在2020年發(fā)表的評(píng)述文章《E級(jí)計(jì)算的幾個(gè)問題》中指出,自從TOP500發(fā)布以來,世界最快計(jì)算機(jī)的性能大約每10~11年會(huì)提高1000倍, 高于摩爾定律所預(yù)測(cè)的性能提高速度,這既得益于處理器速度的提高,也來源于系統(tǒng)規(guī)模的不斷擴(kuò)大。
但是,從2013年開始,榜單冠軍的性能曲線變得平緩了。而且,2019年11月發(fā)布TOP500的前10名與同年6月的前10名相比較,系統(tǒng)和性能完全沒有變化。作者們指出,超級(jí)計(jì)算機(jī)的發(fā)展遇到了瓶頸,包括四個(gè)方面的挑戰(zhàn):功耗、應(yīng)用性能、可編程性和可靠性。
每個(gè)大型的超級(jí)計(jì)算機(jī)都會(huì)消耗大量能源,對(duì)當(dāng)?shù)氐墓╇娤到y(tǒng)造成很大的壓力,并會(huì)產(chǎn)生大量熱量,因此,能耗與散熱也是一個(gè)核心競(jìng)爭(zhēng)點(diǎn)。能耗問題與超級(jí)計(jì)算機(jī)的體系結(jié)構(gòu)、工藝水平和制冷技術(shù)等密切相關(guān)。清華大學(xué)科學(xué)史系博士后司宏偉在2021年底發(fā)表的一篇文章中指出, 若以國內(nèi)目前傳統(tǒng)技術(shù)方法構(gòu)建一臺(tái)運(yùn)E級(jí)的超級(jí)計(jì)算機(jī),年能耗將會(huì)超過三峽水庫發(fā)電量的1/3。
根據(jù)美國能源部的指標(biāo),E級(jí)機(jī)的功耗不得超過20兆瓦。錢德沛等人寫道,這意味著不能單純靠擴(kuò)大系統(tǒng)規(guī)模提高系統(tǒng)的性能,E級(jí)機(jī)可采用的技術(shù)手段受到很大限制。
“前沿” 的能耗是21兆瓦。國內(nèi)一位研究超算領(lǐng)域的學(xué)者告訴《知識(shí)分子》,從此次榜單中的這些超級(jí)計(jì)算機(jī)中來看,“前沿” 不僅是運(yùn)算速度最快的,而且能耗比也應(yīng)該是最優(yōu)的。“前沿” 持續(xù)計(jì)算性能約是 “富岳” 的2.5倍,但是功耗卻只有富岳的71%。能耗成為與計(jì)算速度同等重要的度量指標(biāo)后,國際科學(xué)家從2007年起與TOP500同步公布Green500排行榜,來評(píng)價(jià)超級(jí)計(jì)算機(jī)能耗水平。在這個(gè)同期發(fā)布的榜單上,“前沿” 系統(tǒng)同樣排名第一。
劉少山補(bǔ)充說,“前沿” 使用了當(dāng)前最先進(jìn)的水冷系統(tǒng),把整個(gè)系統(tǒng)的峰值溫度控制在了85度以內(nèi),這使得它不僅是現(xiàn)在世界上最快的超算,也是最環(huán)保的超算。
此外,在網(wǎng)絡(luò)架構(gòu)上,“前沿” 系統(tǒng)也有領(lǐng)先之處。傳統(tǒng)企業(yè)級(jí)服務(wù)器,是單一機(jī)器完成獨(dú)立的任務(wù)。比如,如果淘寶要響應(yīng)1000萬個(gè)用戶,可以交給1萬臺(tái)服務(wù)器,每個(gè)服務(wù)器響應(yīng)1000個(gè)用戶。但是,超級(jí)計(jì)算機(jī)是許多臺(tái)計(jì)算機(jī)(被稱為 “節(jié)點(diǎn)”)協(xié)同完成一件任務(wù),隨著規(guī)模越來越龐大,不同節(jié)點(diǎn)間如何 “通信”,告知彼此計(jì)算運(yùn)行狀態(tài)和步驟,就變得關(guān)鍵。如果節(jié)點(diǎn)間網(wǎng)絡(luò)性能不夠好,就很容易成為整個(gè)計(jì)算系統(tǒng)的瓶頸。
“前沿” 節(jié)點(diǎn)間的連接使用了最先進(jìn)的與以太網(wǎng)兼容的 HPE Cray Slingshot-11 網(wǎng)絡(luò)結(jié)構(gòu),能達(dá)到很高的帶寬,讓計(jì)算單元之間的數(shù)據(jù)交互更快,進(jìn)而保證整體系統(tǒng)的運(yùn)算速度更快。
超算領(lǐng)域一直在不斷爭(zhēng)逐越來越快的運(yùn)算速度,這一切是否有盡頭?答案可能是否定的。據(jù)報(bào)道,10E級(jí)超算也已在業(yè)界規(guī)劃之中。
長(zhǎng)期以來,超級(jí)計(jì)算機(jī)一直是國際競(jìng)爭(zhēng)的焦點(diǎn)。當(dāng)美國超級(jí)計(jì)算機(jī)Cray-1在1976年問世時(shí),首先被軍方用于戰(zhàn)略核彈頭。如今,它已經(jīng)在科研與應(yīng)用的很多方面產(chǎn)生影響,包括疫苗研發(fā)、測(cè)試汽車設(shè)計(jì)和模擬氣候變化等等。
著眼當(dāng)下,前述國內(nèi)超算學(xué)者表示,現(xiàn)實(shí)中有很多應(yīng)用還需要比現(xiàn)在的E級(jí)計(jì)算機(jī)更強(qiáng)大的算力,超算還需要不斷發(fā)展。比如,在航空領(lǐng)域,需要進(jìn)行流體力學(xué)模擬,如果要對(duì)部件甚至整機(jī)進(jìn)行全三維模擬,實(shí)際算力可能需要比現(xiàn)在的E級(jí)計(jì)算機(jī)高兩個(gè)數(shù)量級(jí)才能模擬得比較精準(zhǔn)。更強(qiáng)大的計(jì)算能力,還能通過對(duì)氣流粒度的分析越來越精準(zhǔn),而獲得更準(zhǔn)確的天氣預(yù)報(bào)。
經(jīng)過大約三年的研發(fā)之后,“前沿” 將于今年年底準(zhǔn)備好投入科研用途,包括模擬恒星如何爆炸,研究基本粒子的性質(zhì)與核聚變,以及利用人工智能來改善疾病的診斷和預(yù)防等等許多課題。
中山大學(xué)國家超算廣州中心主任盧宇彤曾表示,中國超算之所以能在短短30年內(nèi),實(shí)現(xiàn)跨越式發(fā)展,首先是巨大的需求推動(dòng)。中國第一臺(tái)超級(jí)計(jì)算機(jī)是國防科學(xué)技術(shù)大學(xué)于1983年12月研制成功的 “銀河-I”,中國也成為當(dāng)時(shí)世界上少數(shù)幾個(gè)能夠研制超級(jí)計(jì)算機(jī)的國家之一。此后,國防科大、國家并行計(jì)算中心、中科院計(jì)算所聯(lián)合曙光公司、聯(lián)想集團(tuán)等單位相繼推出了 “銀河” “神威” “曙光” “深騰” 等一系列國產(chǎn)超級(jí)計(jì)算機(jī)系統(tǒng)。
此外,根據(jù)之江實(shí)驗(yàn)室微信公號(hào)的通報(bào),2021年11月19日,來自該實(shí)驗(yàn)室等機(jī)構(gòu)的14名學(xué)者的一篇論文獲得了國際計(jì)算機(jī)協(xié)會(huì)的戈登·貝爾獎(jiǎng)。研究者們基于新一代神威超級(jí)計(jì)算機(jī),研發(fā)量子計(jì)算模擬器SWQSIM,實(shí)現(xiàn)了每秒4.4百億億次的持續(xù)計(jì)算性能,是超算領(lǐng)域全世界當(dāng)時(shí)已知的最高混合精度浮點(diǎn)計(jì)算性能。
2010年~2019年,中國在20屆TOP500榜單上11次排名第一,足以顯示在超級(jí)計(jì)算機(jī)硬件上的實(shí)力。不過,清華大學(xué)科學(xué)史系博士后司宏偉在2021年發(fā)表的文章《中國超級(jí)計(jì)算機(jī)研制反思》一文中指出,中國超級(jí)計(jì)算機(jī)的自主創(chuàng)新之路還任重而道遠(yuǎn),面臨著原創(chuàng)能力不足、人才匱乏及應(yīng)用較少等問題。
文章寫道,2010年11月,“天河一號(hào)” 首次在TOP500榜單上問鼎冠軍,成為當(dāng)時(shí)世界上最快的超級(jí)計(jì)算機(jī),然而,其核心部件CPU和GPU,90%以上采用的是美國英特爾和AMD公司最先進(jìn)的產(chǎn)品?!吧裢ぬ狻?開始探索完全原始創(chuàng)新的研發(fā)模式,不過,其使用的國產(chǎn) “申威26010” 眾核處理器與當(dāng)今國際最先進(jìn)的芯片相比,仍然有不小差距。
相比之下,劉少山分析說,“前沿” 系統(tǒng)所涉及的超過6000萬個(gè)部件基本都可以由美國本土企業(yè)提供?!扒把亍?建造期間,核心零件獲得了國防優(yōu)先權(quán)和分配權(quán),這可能是美國在搭建超級(jí)計(jì)算上的最大優(yōu)勢(shì)。
另一方面,劉少山指出,國內(nèi)超算軟件人才與美國相比還有很大差距,目前絕大多數(shù)超算底層軟件庫都是由美國的科研人員所研發(fā)。中國還很缺能夠利用超算解決應(yīng)用問題的高素質(zhì)人才。國家超級(jí)計(jì)算無錫中心并行優(yōu)化部主管劉釗在接受媒體采訪時(shí)談到,近年來在互聯(lián)網(wǎng)公司的沖擊之下,無錫(超算)中心的人手一直吃緊,特別是應(yīng)用領(lǐng)域人才偏少,大約只占研發(fā)團(tuán)隊(duì)人員的三分之一。
前述國內(nèi)學(xué)者也認(rèn)為,應(yīng)用方面的確是個(gè)問題。有的國產(chǎn)超算系統(tǒng),其硬件對(duì)很多現(xiàn)在使用的軟件兼容性并不好,要在該超級(jí)計(jì)算機(jī)上進(jìn)行計(jì)算,需要先進(jìn)行軟件移植,工作量比較大。
針對(duì)此前媒體報(bào)道提到的超算中心存在一定程度的閑置的現(xiàn)象,他表示,國內(nèi)對(duì)超算的客觀需求是存在的,機(jī)器的數(shù)量也并沒有供過于求,從本質(zhì)來看,還是因?yàn)閲鴥?nèi)的應(yīng)用開發(fā)能力不足,從而限制了對(duì)機(jī)器的利用水平。
制版編輯 | 姜絲鴨