“我們希望構建一個先進的計算平臺,幫助創新者實現下一個突破。我們做的就是面向未來的事情。”
——Graphcore高級副總裁兼中國區總經理 盧濤
第一次知道Graphcore的中文譯名時其實很驚訝。
“擬未”,既不是直譯,也不是音譯。
第二次再見盧總的時候,謎題揭曉。
“很多人覺得我們的名字特別詩意,”盧總笑道,“‘擬未’,其實就是共同定義并建立未來的意思。我們希望構建一個先進的計算平臺,幫助創新者實現下一個突破。我們做的就是面向未來的事情。”
2021年5月21日,第五屆世界智能大會第三屆工業互聯網之智能網聯汽車產城人文協同發展高峰論壇在天津舉辦。會后,盧濤接受了記者的采訪,分享了他對于AI行業的深刻洞見以及Graphcore在中國市場開拓上的規劃。
Graphcore高級副總裁兼中國區總經理 盧濤
Graphcore整體發展策略:仰望星空,腳踏實地,以點帶面
盧濤在參會后表示,在“智能網聯汽車”中,Graphcore還是比較關注和計算相關的“智能”。在汽車領域,公司已經在一些項目上取得進展。
由于AI的應用行業化、場景化程度很高,即便行業間的一部分軟件和算法是共通的,但個性化的情況會更多,因此Graphcore在策略上十分注重頭部的應用。“一般我們會在某一個垂直領域找一兩家頭部合作企業,先把相關能力、行業的Know-How(技術經驗)建立起來,然后再‘以點帶面’地往前突破。不僅在汽車領域,在智能零售、智慧城市等方面,我們也都是類似的策略,這是我們整體的做法,”盧濤如是說,“我一直講‘我們仰望星空,但是腳踏實地’。我們腳踏實地就是要找頭部的合作伙伴,做了典型案例落地之后,我們再‘以點帶面’地鋪開。”
數據中心,Graphcore的全速前進方向
“今天,很多智能其實是在云端發生的,”盧濤講到,“在全球范圍之內,數據中心、互聯網、AI,都屬于‘走得最快’的產業之列。很多人講‘AI產業化’、‘產業AI化’。‘AI產業化’就是把AI變成一個產業。這一點互聯網已經實現了,互聯網數據通過AI、算法已經轉換成各種各樣的商業方式了。‘產業AI化’就是用AI技術‘武裝’各種各樣的產業,數據中心和互聯網就是其中非常重要的一環,原因有兩個:第一,它是整個AI落地的前沿陣地;第二,各種各樣的行業能力要依靠數據中心的能力來支撐。所以基于當前這樣的一個背景,整體上我們在數據中心上的步伐會走得更快。”
對標英偉達DGX Station,Graphcore有IPU-M2000
在4月份舉辦的GTC 2021技術大會上,英偉達宣布將升級DGX Station和DGX SuperPod。當談及Graphcore與之相對的發展規劃時,盧濤表示:“英偉達的產品系列非常多,不僅僅有DGX Station、DGX A100、還有一些針對邊緣應用的。首先,我們必須要承認別人的產品系列跟型號可能會更多一些。我們在目前其實是沒有在規劃Station這種形式的產品的。我們今天在展區(第五屆世界智能大會展區)展出了IPU-M2000組成的IPU-POD4、IPU-POD16和IPU-POD64。我們的產品還在繼續迭代,可能有一些產品形態會跟DGX Station長得不一樣,但是可能能夠起到類似的作用。DGX Station跟DGX A100很大的一個區別,就是DGX A100在6U的機器里面有8個A100,功耗、成本都非常高,而DGX Station是一個規模更小的產品形態,不管是功耗、成本,還是體積,都會更小一點,能夠比較方便地在一些入門級的場景中使用。從某種意義上,目前我們單個的IPU-M2000可以做到類似的事情,因為我們的粒度本來就很細。我們還在進一步地思索我們未來的產品形態,但是目前來講,入門級產品方面,一個IPU-M2000就可以起到類似的作用,成本、功耗比較低,也能進行一些需要比較大規模的平臺來處理的計算。”
IPU跟GPU,到底有啥區別?
GPU本身的優勢是較高的并行處理任務的效率,但是碰到一些強化學習或者是RNN這些模型的時候優勢就不會那么明顯。那么與之相比,“為AI而生”的IPU具體優勢體現在哪些地方呢?盧濤指出了如下幾點:
“從芯片到芯片級別,IPU跟GPU有兩個最大的差異化的特點。第一個是我們比GPU更擅長做并行處理。我們有一千多個處理器內核。第二個,我們的內存架構非常不一樣。GPU是層次化的內存結構,片內有一個大概二三十兆的片內緩存,片外是高速的顯存。我們全部在片內。我們一顆芯片有900兆的處理器內存儲。如果是要擴展成集群,還有一些不同的地方,比如我們的IPU-Link能夠很方便地做芯片與芯片之間的協同。”
此外,和GPU比起來,IPU在LSTM和RNN方面也有巨大的優勢。“強化學習底層的算法邏輯用的是LSTM的cell。RNN就是循環神經網絡。LSTM就是長短期記憶網絡。計算機的記憶存在內存里面,需要用的時候讀一下,它就記得了。它要不停地訪問存儲。這些算法相對來說并行度沒有別的一些算法那么高。那么內存這一塊就非常重要了。”盧濤補充道。
另外,在計算的顆粒度較細,以及對時延要求較為嚴格的場景中,IPU都會存在優勢。“我們既能做訓練,也能做推理。其中在幾類計算上我們會比較有優勢,”盧濤說道,“一類是計算的顆粒度比較細的時候,我們的優勢很大。AI中,很多底層是要算一個矩陣的乘法。矩陣有大矩陣和小矩陣。本來是一個很大的矩陣,我把它拆成一堆小矩陣,就是顆粒度細了。現在有很多算法,像谷歌的科學家做的EfficientNet,其中很重要的一點,就是把很大的矩陣拆成很多很小的矩陣,這樣就降低了算法模型的參數規模,并且提高了算法的精度。這種算法上我們的表現很好。還有一類是推理中有一些場景對時延要求很嚴格。我們的時延很低,與此同時我們整個的吞吐量也非常高。在大量的實際案例中,我們可以看到,我們在這方面具有數量級的優勢。”盧濤最后說道。
CPU、GPU、IPU,人工智能時代的三足鼎立
“我們認為CPU和GPU是會長期存在的,因為它們各自都有自己的應用領域和自己很擅長的方向,” 當談及人工智能時代IPU與CPU、GPU的競爭關系時,盧濤表示,“我們希望CPU、GPU、IPU并存。IPU跟它們比起來也有自己的領域。”
據介紹,Graphcore的第一代產品大概比英偉達V100晚了18個月發布。但是第二代產品在時間上已基本追平(英偉達5月份發布,11月份量產;Graphcore 7月份發布,12月份量產)。所以從某種意義上來說,Graphcore的產品迭代比英偉達還要快。“這是一個很關鍵的點。半導體在過去幾十年很重要的一個產品邏輯和商業邏輯,就是要保持一個很穩定的迭代速度。我們目前在很積極地研發我們后面的一些產品。我們覺得從節奏上我們未必會比他們慢。未來我們也是希望能保持一個比較穩定的迭代周期來往前推進。基本上我們最后也是會像‘一代量產、一代研發、一代架構’這樣的一個過程。”盧濤繼續講到。
“開放、開源,然后擁抱社區”,Graphcore的軟件之路
“軟件是今天GPU最大的護城河,也是用戶從GPU遷到別的平臺上的最大阻力。我們最近也在做一些工作,希望能夠盡量降低用戶在移植工作上的工作量。”談及軟件,盧濤說到。
Graphcore是一家硬件公司,同時也是一家軟件公司。據介紹,目前公司的軟件工程師比芯片工程師要多很多,以后數值差可能還會拉大。“軟件的組件非常多,以GPU為例,從CUDA,到TensorFlow、PyTorch等不同的機器學習框架軟件,到類似于Keras的更高層框架,再到類似ResNet、BERT用戶的算法、模型等等,最后再到圖像的前處理、后處理等。整個軟件棧確實是非常大的。如果一個做AI處理器的公司沒有意識到軟件的重要性,將會是一個很嚴重的問題。”盧濤告訴記者,“當前,軟件方面,從棧的角度來看,我們在層次化的角度上跟英偉達還是比較類似的:比如對應CUDA,我們有Poplar;再上面是cuDNN、cuBLAS,我們上面是PopLibs;再往上面是TensorFlow、PyTorch等等。在這一層,我們正在做對于PaddlePaddle的支持。再往上就是應用。”
在Graphcore看來,軟件的成功并不是靠單家公司的一己之力來實現的。Graphcore會秉承“開放、開源,然后擁抱社區”的整體策略,在整個應用的生態里面盡己所能,與合作伙伴共同打造良好的軟件生態系統。
提及生態,盧濤也表示,Graphcore目前的發展瓶頸就在于生態。“建立生態是一個需要長期投入和努力的事情,我們現在還是一個比較新的公司,建立生態不是一蹴而就的,我們正在不停地加大投資、投入來做。”
壯大中的Graphcore中國團隊
生態的建立同時需要人力的投入。
作為Graphcore在中國的零號員工,盧濤正在帶領本地團隊快速壯大。目前,Graphcore中國團隊共有40人左右,市場、銷售等只占很小一部分,其余的主要都是工程師,當中又有很多人是軟件工程師。
“Graphcore在全球的研發中心主要集中在英國,包括布里斯托、倫敦、劍橋,另外,在挪威奧斯陸以及美國的帕拉奧托也有我們的軟件團隊,中國的軟件團隊目前有20多個人。”
盧濤告訴記者,Graphcore中國軟件團隊的表現無論從業務水平還是執行力上來講,都收獲了大家的認可。因此,在未來12-18個月,Graphcore要在中國打造出一支超過200人的軟件團隊,做機器學習框架相應的一些算法等。
“我覺得我們中國的軟件團隊在全球的軟件團隊里的份額應該會越來越大。雖然當時團隊很小,很長時間一段時間都是十幾個人,但是做的一些成果我覺得大家都比較認可。我們做了一些比較關鍵性的交付,比如我們TensorFlow上的BERT方面的工作,其實是中國團隊做的。”盧濤談到。
在中國建立研發中心也需要進行本地化工作。盧濤提及,Graphcore屬于PaddlePaddle于去年發起的“百度飛槳硬件生態圈”的初始成員之一,因此Graphcore正在做對于PaddlePaddle的支持。另外,Graphcore也正與阿里云合作HALO、與微軟亞洲研究院合作NNFusion。與此同時,Graphcore與國內做框架、做集成的機構也都在探索合作的過程中。