增強的DesignWare EV6x系列可為實時視覺處理提供高達每秒4.5 TeraMAC的計算能力
亮點:
·DesignWare EV6x Vision Processor集成了多達4個512位向量DSP和1個CNN引擎,為各種當前和新興的嵌入式視覺應用提供可擴展性能
·含專用可編程CNN引擎的EV6x處理器支持所有CNN圖形
·MetaWare EV Development Toolkit是一套支持OpenCL C、OpenVX和OpenCV的工具,可簡化應用軟件的開發
·MetaWare EV Development Toolkit中的新CNN映射工具可將處理任務自動分派給可用的硬件資源,以便加快執行速度
新思科技(Synopsys, Inc.,納斯達克股票代碼:SNPS)日前宣布:已經增強了DesignWare? EV6x Vision Processor中的卷積神經網絡(CNN)引擎,以應對高性能嵌入式視覺應用越來越高的視頻分辨率和幀率要求。在實施16nm FinFET制程技術時,通常條件下,CNN引擎可提供高達每秒4.5 TeraMAC的計算能力,其性能是以前的Synopsys CNN引擎的4倍。它還支持系數和特征映射壓縮/解壓縮,以降低數據帶寬要求,降低功耗。視覺CPU從一個向量DSP擴展到四個向量DSP,可與CNN引擎并行運行,從而為高級駕駛輔助系統(ADAS)、視頻監控、增強現實和虛擬現實、同步定位與建圖(SLAM)等一系列高性能嵌入式應用提供最大的吞吐量。
Morpho US, Inc.副總裁Toshi Torihara表示:“在神經網絡中,嵌入式視覺應用核心的技術需求需要提供將高精度和高性能與低功耗和小面積相結合的解決方案。DesignWare EV6x Vision Processor獨特地結合了向量DSP和可編程CNN引擎,支持設計人員在其嵌入式設備中實施視覺功能,該嵌入式設備的性能效率高于基于CPU和GPU的替代方案?!?/p>
DesignWare EV6x處理器系列集成了標量、向量DSP和CNN處理單元,可進行高度準確、快速的視覺處理。EV6x支持所有卷積神經網絡,包括AlexNet、VGG16、GoogLeNet、Yolo、Faster R-CNN、SqueezeNet和ResNet等受歡迎的神經網絡。設計人員可以在EV6x的12位CNN引擎上運行原本為32位浮點硬件準備的CNN訓練圖形,從而在維持相同的檢測精度時顯著降低其設計的功耗和面積。在使用16-nm FinFET制程技術實施時(最糟的情況下),引擎提供高達每秒每瓦2,000GMAC的能效。EV6x的CNN硬件還支持為8位精度訓練的神經網絡,以利用內存帶寬較低、圖形類型功耗要求較低的優勢。
為了簡化應用軟件開發,有一套全面的工具和軟件支持EV6x處理器。最新版本DesignWare ARC? MetaWare EV Development Toolkit包括CNN映射工具,它能分析使用Caffe和Tensorflow等受歡迎的框架訓練的神經網絡,并自動生成用于可編程CNN引擎的可執行文件。為了盡可能靈活和防止過時,該工具還能在視覺CPU和CNN資源間分配計算,以支持新興的全新神經網絡算法以及客戶特定的CNN層。結合基于OpenVX?、OpenCV和OpenCL C嵌入式視覺標準的軟件開發工具,MetaWare EV Development Toolkit允許設計人員擁有加速嵌入式軟件開發所需的全套工具。
Synopsys IP營銷副總裁John Koeter表示:“隨著高性能神經網絡在人工智能應用中變得更加普及,設計人員需要硬件技術和軟件技術才能按時提供支持視覺的SoC。憑借經過硅驗證的EV6xVision Processor的性能和功能增強,設計人員可以更有效地設計和部署基于機器學習的應用,使這些應用具有在市場中脫穎而出所需的性能和能效。”
可用性與資源
含可選嵌入式CNN引擎的DesignWare EV61、EV62和EV64處理器計劃于2017年8月發售。MetaWare EV Development Toolkit現已發售。對套件的CNN映射工具中TensorFlow框架的支持計劃于2017年10月提供。