日前,模擬芯片大廠Maxim Integrated發布了一款名為MAX78000的革命性芯片。按照他們的說法,這顆低功耗神經網絡加速微控制器能將人工智能(AI)推向邊緣端,更重要的是,因為其低功耗特性,那就意味著即使在將其應用在電池供電的物聯網(IoT)設備里,芯片性能并未受到影響。
如上圖所示,新芯片MAX78000包括兩個超低功耗內核——Arm Cortex-M4內核和RISC-V內核——一個基于FPU的微控制器和一個卷積神經網絡加速器。按照他們的說法,之所以他們采用了一個RISC-V內核,是因為在將消息傳入加速器之前,RISC-V是一個很好的低功耗選擇。根據MAXIM的設計,客戶可以在使用的時候,選擇兩個集成微控制器內核中的一個。
按照他們的介紹,該芯片具有一些令人印象深刻的規格,特別是在功耗和延遲方面。
Maxim Integrated指出,得益于這個芯片的優越設計,在執行AI推理時,芯片的功耗大幅降低,同時還能在以電池供電的設備中,執行以前被認為是不可能任務的復雜新AI的用例。他們強調,這些功耗改進在延遲或成本上也沒有絲毫妥協。
從他們提供的數據可以看到,在與運行在低功耗微控制器上的軟件解決方案相比,MAX78000執行推理的速度快100倍,而其成本僅為FPGA或GPU解決方案的一小部分。該公司繼續表示,運行MNIST時,MAX78000的能耗降低1100倍;在MNIST時,延遲提高了400倍;與低功耗的Cortex M4F相比,關鍵字發現期間的能耗低600倍;與96 MHz Cortex M4F相比,關鍵字發現的效率提高了200倍。
能獲得以上的AI性能表示,其獨特的加速器設計是關鍵。
此SoC中最獨特的功能是神經網絡加速器,它是專用硬件,旨在最大程度地減少卷積神經網絡(CNN)的能耗和等待時間。
根據他們的說法,這個加速器所采用的體系結構是完全專有和新穎的。它的設計目標是最大程度地減少數據移動,這能極大降低SoC的能量損耗,尤其是在處理CNN鏈中的復雜數學配置時。
Maxim指出,他們的CNN引擎具有442KB的權重存儲,可以支持1位,2位,4位和8位權重(最多支持350萬個權重的網絡)。因為CNN權重存儲器基于SRAM,所以可以實時進行AI網絡更新。CNN引擎還具有512KB的數據存儲器,同時CNN的體系架構是高靈活性,從而允許網絡中像PyTorch和TensorFlow常規工具集來訓練,然后使用Maxim提供的工具將其轉換,讓其在MAX78000上運行。
Maxim方面表示,這個SoC的另一個特征是微控制器的介入最少。一般而言,此架構中的MCU用于配置網絡,加載數據并啟動它。MCU完成其最初的工作后,它基本上就置身事外。因為在他們看來,MAX78000的核心是專用硬件,旨在最大程度地減少卷積神經網絡(CNN)的能耗和等待時間。為此該硬件在運行時幾乎不受任何微控制器內核的干擾,從而極大地簡化了操作。
事實證明,這對于提高能源效率也極為重要。
該設備還可以在執行之前加載數據,從而消除了在推理過程中訪問內存的需求,從而降低了能耗并改善了延遲。Maxim方面強調:“不需要外部存儲器,這實際上是我們節省能源的方法之一,因為所有存儲器都在芯片上。”
根據Maxim Integrated的說法,該設備可能為系統提供了在邊緣執行實時決策的能力(比基于云的計算更快),并且無需擔心安全性。
通過將AI帶到邊緣設備,該設備可以啟用新的應用,例如毫秒之內的面部ID或數據處理助聽器。這樣,MAX78000可能是“切斷嵌入式設備電源線”的重要一步。
Maxim表示,希望MAX78000能夠朝著“嵌入式革命”的道路邁進,就像以前嵌入式來到卓念一樣。他們指出:“在使用微控制器之前,沒有人考慮過微控制器的所有功能。現在,我至少要戴兩個。”
這就是Maxim認為邊緣技術的AI將會變成的東西,希望我們將成為引領潮流的人之一。