西門子推出Catapult AI NN 以簡化先進晶片級系統設計中的AI加速器開發

【記者吳惠民桃園報導】Catapult AI NN是一款全面的解決方案,可協助軟體工程師合成AI神經網路,軟體開發團隊能夠將使用Python 設計的AI模型無縫轉換為矽基實作,能夠實現比標準處理器更快速、更高能效的執行。
西門子公司表示,該公司數位工業軟體近日推出Catapult AI NN軟體,可幫助神經網路加速器在特殊應用積體電路(ASIC)和晶片級系統(SoC)上進行高階合成(HLS)。Catapult AI NN 是一款全面的解決方案,可對AI架構進行神經網路描述,再將其轉換為 C++ 程式碼,並合成為Verilog或VHDL語言的 RTL加速器,以在矽晶中實作。Catapult AI NN整合了用於機器學習硬體加速的開源套件hls4ml,並整合西門子用於高階合成的Catapult HLS軟體。Catapult AI NN 由西門子與美國能源實驗室部門Fermilab及hls4ml的其他主要貢獻者合作開發,能滿足機器學習加速器設計對客製化矽晶功耗、效能和面積(PPA)的獨特要求。
西門子數位工業軟體副總裁暨高階設計、驗證與能效總經理Mo Movahed表示,無論是神經網路模型的交付流程,或是將此模型手動轉成硬體實作,效率都非常低,且耗時、容易出錯,尤其是建立和驗證為特定功耗、效能和面積量身打造的硬體加速器變體時。透過令科學家和AI專家徹底善用業界標準的AI架構(例如神經網路模型設計),並將這些模型完美合成至針對功耗、效能和面積(PPA)進行過最佳化的硬體設計中,我們為AI和機器學習軟體工程師開創了前所未有的可能性。西門子新的Catapult AI NN解決方案,使開發人員能在軟體開發期間同時進行神經網路模型的自動化和實作,使 PPA 達到最佳表現,為 AI 開發的效率與創新開創新的紀元。
Mo Movahed指出,隨著runtime AI與機器學習任務從資料中心移轉至消費性電器、醫療器材等各式設備,現今對適當大小的AI硬體需求迅速增長,以減少功耗、降低成本並實現最終產品差異化。然而,比起可合成的C++、Verilog或VHDL語言,多數機器學習專家更樂於使用 TensorFlow、PyTorch 或 Keras 等工具。過去,AI專家一直無法經由簡單的途徑,在適當大小的ASIC 或 SoC實作中加速機器學習應用。
Mo Movahed說明,hls4ml計畫即為了彌補此缺陷而生,該計畫從 TensorFlow、PyTorch 或Keras等AI架構中描述的神經網路產生出C++程式碼。接著能部署C++程式碼以進行FPGA、ASIC 或 SoC實作。Catapult AI NN 將 hls4ml的功能擴展至ASIC和SoC設計,其中包含針對ASIC設計量身打造的專用C++ 機器學習函數庫。利用這些函數,設計人員能在各項來自C++程式碼的替代性實作中,對延遲性和資源作出取捨,使 PPA 達到最佳表現。此外,設計人員現在還能評估不同神經網設計的影響,為硬體判定最佳的神經網路結構。
粒子偵測器應用的邊緣AI約束條件極為嚴格,Fermilab新興科技實驗室副主任Panagiotis Spentzouris也表示,我們與西門子合作開發Catapult AI NN 軟體,這個合成架構徹底善用我們科學家及AI專家的專業知識,而他們本身不需要成為ASIC的設計師。此外,這個強大的全新架構也非常適合經驗豐富的硬體專家使用。Catapult AI NN現已開放早期採用者使用,並計劃於2024年第四季向所有使用者全面開放。欲深入瞭解Catapult AI NN軟體,可造訪:https://eda.sw.siemens.com/en-US/ic/catapult-high-level-synthesis/hls/ai-solutions/?。