AI驱动的设计应用
在这个快节奏的数字化时代,速度、性能和上市时间都至关重要。对即时数据处理和数据共享的持续需求正在推动芯片设计不断冲破创新极限。芯片开发者承受着巨大的压力,需要在不牺牲能效的前提下提供高性能计算。在这样的背景下,我们重新审视并完善了新思科技用户大会(SNUG)硅谷活动的相关见解,探索了AI驱动型电子设计自动化(EDA)如何突破现有的芯片设计和迁移流程,使其更加高效、更具成本效益。
在之前的文章中,我们曾探讨AI如何帮助将数字设计迁移到更先进的工艺节点,从而减少或避免重新设计工作。但是,如何将仍然可行的现有设计迁移到功能更强大的新处理器上呢?面对这一挑战,同样的AI技术能否奏效?对此,Synaptics交出了满意答卷。
Synaptics专注于开发DisplayLink技术,这可以轻松地将任何显示器连接到任何支持USB或Wi-Fi的计算机上,并为一系列企业、家庭和嵌入式应用提供了通用解决方案,仅需连接显示器便能提高工作效率。该公司新推出了一款通用片上显示扩展坞DisplayLink DL-7400,可支持4K超高分辨率和和144 Hz刷新率,且一台PC可同时向四台显示器输出显示内容。连接任何USB时,该扩展坞能够同时支持2个8K、4个4K或1个5K/6K显示,甚至适用于较旧的GPU,可以满足所有IT需求,不仅具有2.5G以太网和物联网引擎,而且还配备带有签名的加密固件。
为了满足高性能计算需求,Synaptics开发出了DL-7400,它运行在基于ARCv3指令集架构(ISA)的ARC HS58 32位处理器上。该处理器具有多达12个内核相干集群、16个硬件加速器、一致的高带宽互连(800GB/s),且支持150多种DSP指令。不过,前几代DL-7400对处理能力要求较低,运行在基于ARCv2 ISA的ARC HS38 32位处理器上。该处理器提供了单一操作、10级流水线以及双核/四核实现。
新思科技DSO.ai不仅大大缩短了周转时间,而且还显著减少了时序要求违例,同时还改善了功耗和漏电问题,而这是单凭新思科技QIK无法达到的效果。新思科技DSO.ai将WNS降低了23%,将TNS降低了61%,并将Hold TNS降低了92%。相应地,总功耗改善了2.2%,漏电功耗改善了19.6%。
借助新思科技Fusion Compiler和DSO.ai的AI驱动型优化技术,Synaptics团队显著缩短了设计周转时间、改善了功耗并大幅减少了时序要求违例。将现有设计迁移到更先进的处理器有助于提供切实可行的解决方案,满足高性能计算领域日益增长的需求和不断缩小的市场窗口。
升级至ARC HS58为DL-7400在几个关键方面带来了显著改进:
为了完成迁移,软件和实施方面的一些挑战必须得到解决。首先,软件需要保持不变。开发独特而复杂的软件时已经投入了大量的资金,所以必须要尽量减少更改。在实施方面,空间布局必须与HS38保持一致,包括物理面积、引脚数、位置和供电。I/O时序和时钟延迟需要与现有SoC保持一致,同时还需要降低动态漏电功耗。为了充分发挥ARC HS58处理器的所有优势,避免进行全面重新设计,Synaptics转而采用了新思科技QuickStart实施套件(QIK)、Fusion Compiler™和DSO.ai™。
新思科技QIK是一款综合性解决方案,集成了出色的IP、库、工具、方法、服务和支持。QIK诞生于IP设计、研发和方法论专家的密切合作之下,是专为实现新思科技IP而设计的,提供了符合设计质量目标的有效示例,包含带有脚本的推荐流程(比如实现、ECO、签核、形式化验证、内核配置和约束等),整合了扁平或分层流程,并且易于根据项目特定需求进行定制。
新思科技DSO.ai会自主探索多个设计空间,从而优化PPA指标,同时尽可能减少对目标应用的权衡考量。具体来说,该技术利用AI探索设计/技术解决方案空间,通过自动调整或微调设计输入(例如设置、约束、工艺、流程、层次结构和库),帮助开发者找到更优PPA目标。
对于新设计,新思科技DSO.ai通过“冷启动”来获取上述输入,从而识别那些最佳目标。不过,该解决方案会从初始设计优化中不断学习,并将所学知识应用于衍生设计,因此在找寻满足目标规格的最佳优化策略时,AI引擎不再“冷启动”,而是“热启动”,此时所消耗的算力资源只有原来的1/5-1/10。该技术成功帮助开发者迁移到新的处理器。过程中,首先需将HS58配置与SoC中实现的原始HS38进行比较。然后,依次通过QIK流程和新思科技DSO.ai“热启动”来运行HS58设计,从而实现该处理器的最佳目标。