AI加速: 利用新思科技 QIK和DSO.ai的「暖啟動」將Synaptics的四顯(Quad-Display)晶片遷移到ARC HS58x3

在這個步調快速的數位時代中,能掌握速度、效能和上市時間就是王道;晶片設計人員承受著提供高效能運算同時又不至於影響功耗效能的壓力。對即時數據處理和共享的持續需求正在推動晶片設計創新的界限。在這個背景下,我們重新審視從新思科技使用者大會(SNUG)得到的洞察見解,並進行翻新,進而探索以AI驅動的電子設計自動化 (EDA)如何革新晶片設計和遷移流程,使其更加高效並符合成本效益。

我們已經分享AI如何讓數位設計重新定位到更先進的製程節點,有助於限制或消除重新設計的需求。但是如何遷移那些仍然適用的現有設計到具有更強大功率能力的新處理器?同樣的AI技術能應用於這個挑戰嗎?Synaptics做到了。

Synaptics 是 DisplayLink 技術的開發者,該技術讓任何支持 USB 或 Wi-Fi 的電腦能夠輕鬆連接到任何顯示器,並提供通用的解決方案,適用於企業、家庭和嵌入式應用,其中顯示器的易連接效能夠提升生產力。該公司最新的DisplayLink DL-7400 是一款通用的顯示器對接解決方案,支援高達 4K @ 144 Hz 的超高解析度和刷新率,可從單台電腦同時輸出四個顯示器。透過任何USB甚至更舊的GPU支援2x 8K、4x 4K、5K/6K顯示;一個擴充基座滿足所有 IT 需求,配有2.5G 乙太網路和 IoT 引擎,還具有簽名加密韌體。

為滿足這種高效能運算需求,Synaptics 設計出DL-7400,其可在基於 ARCv3 指令集架構(ISA)的ARC HS58 32位元處理器上運行,並搭載高達 12 核心的同步叢集,具有最多 16 個硬體加速器,以及同步、高頻寬互連(800GB/s)和150多個 DSP 指令。然而,前幾代的 DL-7400 需要較低的處理能力運行在基於 ARCv2 ISA 的 ARC HS38 32位元處理器上,提供單一指令處理(single issue)、10-stage管道(pipeline)和雙/四核心實作。

ARC處理器遷移優化

ARC HS58 的升級為 DL-7400帶來數個必要領域的顯著改進:

  • HS58 的記憶體頻寬提升2.5 倍。
  • 壓縮速度比原來的更快 1.25 倍,而解壓縮速度則快了 1.12 倍。
  • 這款處理器能夠更快地執行儲存在記憶體中的大數據陣列的密集運算,執行相同指令數量的效能提高了 50%。
  • 最後,矽晶上量測時,HS58的效能表現平均提升 48%。

為能成功進行遷移,必須達成多項軟體和實作過程的挑戰。首先,因為在開發獨特和複雜軟體上已投入大量資源,因此軟體必須被保留,且最少量的變動更是關鍵。在實作方面,footprint必須與HS38相匹配,包括物理面積、針腳、位置和電源分配。在符合現有SoC要求的I/O時序和時脈延遲的同時,還需要減少動態漏電功率。為了在不需要完全重新設計的情況下實現ARC HS58處理器的所有優點,Synaptics轉而使用新思科技QuickStart Implementation Kit (QIK)、Fusion Compiler™和DSO.ai™。

Synopsys QIK是一個完整的解決方案,包括一流的IP、知識庫、工具和方法論,以及服務和支援。QIK專為執行新思科技 IP而設計,由於其與IP設計、研發和方法論專家密切合作,可提供符合QoR目標的完整工作範例,包括推薦的流程和實作、ECO、簽核、形式驗證、核心配置和限制等指令,結合平面或分層流程,易於根據特定專案需求進行客製。

Synopsys DSO.ai可自動探索多個設計空間,以優化效能、功耗和面積(PPA)指標,同時最小化目標應用的取捨權衡。它利用人工智慧在設計技術(design-technology)解決方案中巡航,藉由自動調整或微調設計的輸入(例如設定、限制、製程、流程、階層結構和知識庫)來尋找最佳的PPA目標。

針對新設計,Synopsys DSO.ai在所謂的「冷啟動」中接受這些輸入,以確定主要的目標。然而,該解決方案從初始設計優化中學習,並將這些學習應用於衍生設計;因此AI引擎在尋找最佳優化策略以滿足目標規格時不再從「冷啟動」開始,而是從「暖啟動」,可節省5-10倍的運算資源。這項技術應用於遷移至新處理器中,將HS58的配置與建置在SoC中的原始HS38進行比較,然後將HS58設計透過QIK流程和Synopsys DSO.ai的「暖啟動」,達到該處理器的最佳效能目標。

Synopsys DSO.ai流程的「冷啟動」和「暖啟動」

使用Synopsys DSO.ai不僅大幅降低週轉時間,並顯著減少時序要求違規,同時改善功耗和功耗漏電,超過單獨使用Synopsys QIK所能達到的效果。Synopsys DSO.ai降低23%的WNS(最差負時序餘量)、61%的TNS(總負時序餘量)以及降低92%Hold TNS(保持總負時序餘量);總功耗提升2.2%以及減少19.6%漏電功耗。

在使用 Synopsys QIK 和 DSO.ai 時的成果

使用Synopsys DSO.ai不僅大幅降低週轉時間,並顯著減少時序要求違規,同時改善功耗和功耗漏電,超過單獨使用Synopsys QIK所能達到的效果。Synopsys DSO.ai降低23%的藉由利用新思科技 Fusion Compiler 和 DSO.ai 的 AI驅動優化,Synaptics 團隊能夠顯著地縮短設計週轉時間,改善功耗,並最小化時序要求違規。將現有設計遷移到更先進的處理器,提供可行的解決方案,以因應高效能運算日益增加的需求和不斷壓縮的上市時程。

相關資源

下載Synaptics在SNUG SV 2024 的報告內容,以深入瞭解其相關技術發展歷程。

新思科技網路研討會:使用人工智慧驅動技術實現最佳PPA目標