开启下一代人工智能SoC极致性能与终极效率

日期:2018-06-26

                                                   

 
日前,在北京举办 NetSpeedSystems新产品发布会。NetSpeed Systems大中华区销售总监黄啓弘重点介绍了NetSpeedSystem 即将推出的为人工智能系统SoC的片内互连所开发的架构级 IP——Orion.AI,并分享了公司战略及市场远景。他表示,新发布的Orion AI将为下一代人工智能SoC带来极致性能与终极效率。
 
人工智能SoC面对的挑战
黄啓弘认为,人工智能技术在视频、语音、预测、机器人及诊断等应用中正渐入佳境。这些新兴应用对处理能力提出了更高的需求,推动着计算架构发生天翻地覆的变化,并急剧改变着SoC设计模式。但是新应用正让AI计算面临新的挑战。
他说,人工智能的主要挑战在于工作负载具备独特性,在训练侧与推理侧都需要大矩阵乘法;人工智能架构具备独特性,内核数量多,大量并结构,以及点对点通信。所以,人工智能SoC需要以下一些特性:其一是解耦架构,分层堆叠,每层均可扩展或收缩;其二是支持基于广播推送的可配置多播网络IP;其三是非凡的服务质量(QoS),以具备端到端QoS规划的非阻寒路径来控制带宽与延迟。
 

 
由于新SoC内部体现出的是一种新的数据流,一般来说,想实现快速有效的点对点数据交换,就需要大量的计算单元。传统架构运行方式不同,采用中央存储作为数据交换系统。而人工智能系统需要任意位置数据交换,这可以通过广泛的接口而实现,并需要支持长突发传输。Orion AI的一个关键优势就是不仅能够支持多重多播请求,并支持非阻塞传输,而且可以发挥极致性能,具有万亿字节每秒(TB/s)吞吐量,2GHz以上数据带宽高达1024位总线,有1000个内核。其内置人工智能利用先进人工智能算法,在解决方案空间搜寻最有效率解决方案。在功耗方面也实现了终极效率,采用先进低功耗管理技术来提升能效。
 

 
 
让芯片互连成一张网
作为业界领先的内部互连IP供应商,NetSpeed Systems聚焦于人工智能、汽车电子和高性能计算的SoC。此次推出的业界首款以人工智能为基础的SoC芯片内部互连解决方案Orion AI支持多播与广播等先进特性,能极大提升人工智能SoC与加速器ASIC的性能与效率,可广泛应用于数据中心、自动驾驶、AR/VR,以及先进视频分析。Orion AI由NetSpeed经过硅验证的Orion IP构建而成,这些Orion IP已经授权给地平线机器人、寒武纪、百度以及Esperanto等领先的人工智能公司。
黄啓弘在介绍芯片内部互连解决方案时解释说,区别于其它竞争方案,NetSpeed的SoC总线设计是放弃传统的总线理论,将互联网的网络拓扑理念引入到芯片内部设计,即采用数据路由和分组交换技术替代传统总线结构,用互联网的方法分发出去。这从架构上解决了由于地址空间有限导致的传统总线结构可扩展性差,分时通信=效率低下,以及全局时钟同步引起的功耗和面积较大等一系列问题。
 

 
他表示,Orion AI为极致性能而生,片上带宽高达万亿位,并具备支持数千计算引擎的底层架构。它提供超宽数据通路,接口位宽高达1024位,内部结构位宽更高,并可支持高达4K字节的长突发传输。
 
加快SoC上市时间
Orion AI还有一个重要优势,即节省SoC设计时间,它由NetSpeed的图灵机器学习引擎提供支持,该引擎使用监督学习来探索和优化SoC设计与架构。这是一种以人工智能为核心的设计方法,就像有一位随时在线的建筑大师给出设计建议。处理器架构师可以采纳图灵的建议,然后花时间去解决SoC设计中的其他难题。这样就大大缩短了SoC的开发设计时间。
黄啓弘表示,利用NetSpeed Orion AI的帮助,特斯拉自动驾驶芯片从设计到流片只花了9个月的时间,这在以前是难以想象的。除了特斯拉,还有上面提到的其他几家中国顶级人工智能公司,如地平线机器人、寒武纪和百度,都是这方面的成功案例。
他最后总结道,今天,以SoC应用为代表的新技术正在改变全世界沟通与交互的方式,而NetSpeed正是下一代SoC技术的核心。不论是正在为缓存一致性解决方案殚精竭虑的硬件架构师,还是试图用高性能、高效率互连技术打破性能瓶颈的SoC设计师,抑或是为构建高弹性、高容错性系统而百转千回的安全产品经理,都能在NetSpeed找到最佳的解决方案。
 
www.netspeedsystems.com
 

订阅我们的通讯!

电子邮件地址