高性能计算的次世代,要移平三座大山

访客2年前AI生活223

“我们总是高估未来2年会发生的改变,低估了未来10年将发生的变化。”比尔盖茨这句名言用到如今的高性能计算(HPC)领域再贴切不过.

十年前,谁能想到高性能计算能够让普通人在智能手机上就能点外卖,电影大片的特效渲染也需要高性能计算的加持。

十年前,几乎没有人能料想到英伟达和高通在2022年发布的智能汽车芯片AI算力能高达2000T,未来的智能汽车将是“装了四个轮子的超级计算机”。

高性能计算的应用早已不再局限于天气预测、药物研发、油田分析等少数应用,如今的高性能计算正在进入次世代,应用的领域不仅更加广泛,与普通人的生活联系的也更加紧密。

新思科技研究团队早在几年前就预测,高性能计算和云将会被用于多种不同类型的应用中,无论大小。

在AI、元宇宙、智能汽车等诸多技术和应用的推动下,面对越来越大的芯片和越来越复杂系统,高性能计算的计算、存储、网络挑战应该如何解决?

十年变革,高性能计算正在进入次世代

最近几年,高性能计算受到越来越多的关注。新冠疫情下,高性能计算对于疫苗和药物的研发发挥了重要的作用。越来越智能的汽车也依赖算力的大幅度提升。还有近两年备受关注的元宇宙,也需要高性能计算作为支撑。

而这些大大小小的应用,也正是推动高性能计算进入下一个时代的动力。知名市场分析机构Mordor Intelligence在2021年的一份报告中指出,高性能计算市场在2020年到2025年预计将以每年6%以上的速度增长。

高性能计算的主要作用其实就是为数据中心的运行提供所需的计算能力。

过去,数据中心处理的数据只是某个特定组织业务运营的输出,通过对由人机交互生成的大量数据进行测量、推理或分析实现更高商业价值,比如药物研发和油田分析。

如今,数据不再由人类实践所生成,比如,一辆自动驾驶汽车每行驶1小时可以生成5TB的数据,随着自动驾驶汽车数量的增多,产生的数据量也将十分惊人。研究型数据统计公司Statista预计,2010年全球的数据量为2ZB,这一数据在2025年将增长至181ZB,数据正在以超乎想象的速度增长。

数据生成方式发生根本性转变的同时,数据处理和存储技术近十年间也发正了变革。这进一步引发了数据中心架构的重大变化,分布式网络应运而生。

CPU已经不能满足数据爆炸式增长带来的计算需求,需要性能更强的专用处理器。同时,新的数据中心架构对于通信性能的要求也大幅提升,独立网卡(NIC)和服务器机架上的架顶式交换机的性能和延迟,对于在数据中心内部高效移动数据而言也不再适用。

数据爆发对于存储技术和容量带来的挑战,也需要创新性技术满足云计算和高性能计算的需求。IDC预测,从2020年到2025年,全球存储容量将以每年19.2%的速度增长。

新的应用确实在推动高性能计算进入次世代,但在摩尔定律放缓的背景下,高性能计算无论是提升计算性能,还是降低通信延迟和实现存储技术创新,都面临着诸多挑战。

追求高性能,先破复杂性挑战

过去几十年间,得益于摩尔定律,芯片的性能持续快速提升。然而,先进的制程正在接近物理极限,这一方面让依靠先进制程提升单芯片性能的难度和复杂度越来越高。另一方面,想要将小芯片集成到单个系统中也带来了复杂性和设计的挑战。

这就意味着,无论采用何种方式提升计算性能,都同样面临着更高复杂度的设计挑战。

先看提升单芯片性能面临的挑战,单芯片性能的提升正在将裸片尺寸推向制造工艺的极限,这就不仅要克服单芯片设计规模的挑战,还面临整体成本增加的问题。

3DIC Complier是一个不错的解决方案,它可以将设计分解为多个集成芯片设计。要使用3DIC Complier设计性能强大的芯片,从一开始,开发者就需要使用新思科技的3DIC Compiler 等工具进行更多的早期版图规划和基于封装的信号完整性分析。

3DIC Compiler是统一的多裸晶芯片设计实现平台,不仅效率高,还能扩展容量和性能,为各种异构工艺和堆叠裸片提供无缝支持。

新思科技已经与台积电紧密合作,无缝集成了基于台积公司3DFabric技术的设计方法, 为客户提供完整的“初步规划到签核”的设计平台,能够满足芯片开发者对性能、功耗和晶体管数量密度的要求。

为应对不断增长的单芯片设计规模的挑战,开发者则需要使用像新思科技的Fusion Design Platform,这一平台能让芯片开发者在不断增加的计算内核上进行操作,并且这些工具能在云环境中使用。在云环境中,开发者可以访问成千上万的计算资源,这对提升芯片的整体性能以及加快上市时间有重要意义。

今年,新思科技也和三星达成合作,通过Fusion Design Platform提供经认证的数字实现、时序和物理签核参考流程,开发者可以利用新思科技平台的自动化功能和集成优势来提高工作效率,并在三星的先进工艺节点上最大限度地提高PPA,还能加速高性能计算芯片的设计。

Arm也已利用新思科技的Fusion Design Platform和Verification Continuum Platform,实现了Neoverse V1和N2云端到边缘基础设施内核的快速开发和理想PPA指标,加快了高性能计算和AI应用领域中基于Arm的产品上市时间。

提升单芯片性能的设计难度,以及先进制程带来的高成本都是大部分芯片设计公司难以承受的。从系统的角度看,下一代高性能计算架构将出现分解架构和异构系统的爆炸式增长,不同的专用处理架构将集成在单个节点中,在模块之间实现精密、灵活的切换。

于是,将不同性能和功能的芯片封装在一起的小芯片技术受到欢迎,Die-to-Die接口对于不受封装成本和装配限制的高性能计算应用SoC非常有吸引力。

小芯片的设计可以根据应用需求集成各种小芯片和IP资源,但即使是较大的公司也负担不起所有IP的开发费用,采购第三方IP可以节省时间和金钱,是更理想的选择。

作为全球顶级的IP提供商,新思科技提供一系列Die-to-Die IP,包括UCIe和基于SerDes的PHY和控制器。

一边提升单芯片的性能,一边通过小芯片的设计不断提升性能,高性能计算在解决计算挑战的同时,还需解决网络和存储的挑战。

HPC是全面硬实力的考验

用于大数据处理、模拟和预测的模型越来越复杂,推动了对更高计算能力和更大存储容量,以及更低网络延迟的需求,这是一个全面硬实力的考验。

据估算,数据中心的运行和冷却服务器的用电各占约40%,20%的用电用于存储和网络。只有同时解决新型数据中心计算、存储和网络的挑战,才能迈入高性能计算的新时代,实现数据中心的碳中和。

高性能计算要实现性能提升,就要求数据网络和设备接口需要增加带宽满足计算和存储节点间的数据传输需求。这给高性能计算的存储系统带来了包括带宽、容量、延迟、安全性、访问管理、功率等诸多挑战。

十年前,人们对于带宽需求的估计很低,大概是现在的一半甚至三分之一。但如今,全球对带宽的需求以前所未有的速度增长,以太网正在成为数据中心高性能计算的选择。以太网、PCIe和其它接口技术都在逐渐增加带宽以满足需求,以太网正在从100Gbps过渡到800Gbps。

虽然访问支持10Gbps到800Gbps以太网的各种配置的IP很重要,但SoC开发者也在寻找能够提供更多差异化的解决方案,比如可根据特定设计需求进行配置的最低延迟以太网IP;能够缩短上市时间的集成MAC、PCS和PHY的解决方案等。

作为业界为数不多能够提供高性能计算端到端解决方案的公司,新思科技也有高质量的IP解决方案帮助开发者应对网络挑战。

新思科技全面的112G以太网PHY解决方案结合了自身的布线可行性研究、封装基板指南、信号和电源完整性模型以及深入的串扰分析,可实现快速可靠的SoC集成。112G以太网PHY是新思科技面向高性能计算应用的综合IP产品组合的一部分,除此之外还包括广泛使用的协议如PCI Express 、DDR、HBM、Die-to-Die、CXL和 CCIX。

网络性能的提升的同时,存储设备上的数据接口速度也在提高,NVMe SSD采用PCIe 5.0和6.0,传输速率可以达到32Gbps和64Gbps。

与提升产品性能一样重要的,是对芯片全生命周期的追踪,特别是高性能计算这样对芯片品质、安全性和可靠性要求极高的应用。生命周期管理(SLM)的出现,让设备运作的一整个生命周期都可持续提供资料反馈和优化,帮助开发者设计出更优秀芯片。

SLM很可能会改变整个先进工艺设计领域的游戏规则,新思科技也将发挥重要作用。得益于在TEST和DFT领域丰富的经验和强大的实力,新思科技建立了SLM平台,并且,新思科技还将SLM平台与领先的EDA和IP技术相整合,建构了完整的一体化平台,帮助芯片设计团队最大化芯片的PPA,加速产品上市。

另外,一些额外的存储技术也能满足次世代高性能计算的需求。比如持久内存技术、远程直接内存访问(RDMA)和RoCE、NVMe-oF、计算存储。

新思科技与业界一起解决高性能计算的存储挑战,提供广泛的高性能IP产品组合,例如DDR、HBM、以太网和PCIe PHY和控制器、ARC处理器以及设计工具。

一个很好的例子是,Socionext采用了新思科技的HBM2E IP,运行速度为3.6Gbps的HBM2E IP,满足了Socionext创新AI引擎和加速器片上系统(SoC)对于容量、功耗和计算性能的严苛要求,成功将5nm工艺HBM2E IP部署于AI和高性能计算SoC。

端到端解决方案是进入高性能计算次世代关键

人们常说,科技改变生活。芯片作为技术革命底层的支撑,一直在影响着科技未来的走向。随着高性能计算的持续发展,以及高性能计算更加广泛的应用,我们将迎来更加智能的生活,体验到云计算带来的数字化普及带来的便利,智能汽车带来的全新体验,以及元宇宙的全新世界。这一切的背后,新思科技高性能计算端到端的全面解决方案,以及高效、安全的IP和工具,更是支撑高性能计算进入新时代的关键。

本站部分文章来自互联网,文章版权归原作者所有。如有疑问请联系QQ:362580117!

相关文章

速卖通开启本地化业务

据消息,速卖通正在加大本地化业务,今年将重点布局西班牙。目前,速卖通正在本地引入更多供给,并在西班牙马德里为首站推出本地退货服务。 2021年...

「霰弹枪测序法」推动者、ACM Fellow姜涛:从中科大计算机,走入AI生命科学的光辉岁月

「霰弹枪测序法」推动者、ACM Fellow姜涛:从中科大计算机,走入AI生命科学的光辉岁月

姜涛是极少数能同时把计算机理论和生物学都做好的学者。 近四十年的工作学习生涯中,姜涛最初并非从事生物信息学工作,而是研究计算机理论和算法。 直...

ChatGPT隐形危机、数据泄漏、勒索攻击风险需警惕!专家解读《2023产业互联网安全十大趋势》

在信息化时代,数字化转型几乎已经成为所有企业的必选项,但随着数字化转型的加速,产业互联网安全问题日益突出。尤其,在后疫情时代,全社会、全行业、...

奇瑞汽车开启狂飙模式,火星架构-超级混动平台、瑞虎9双剑齐发

奇瑞汽车开启狂飙模式,火星架构-超级混动平台、瑞虎9双剑齐发

在过去的2022年,奇瑞集团基于前瞻科技战略,依托自身体系力优势,厚积薄发,不惧挑战,变革突破,实现逆势增长,各项主要经营指标达到历史最佳...

镁伽科技完成约3亿美元C轮融资:用AI、自动化,提升生命科学产业链研发、生产效率

镁伽科技完成约3亿美元C轮融资:用AI、自动化,提升生命科学产业链研发、生产效率

2022年6月15日,镁伽科技宣布完成约3亿美元C轮融资,由高盛资产管理、亚投资本、纪源资本联合领投,老股东创新工场持续超额加注,新加坡蘭亭投...

小米 618 不开心:销量冠军的“压货心病”

小米 618 不开心:销量冠军的“压货心病”

压库存又成了小米的难题,仅仅一个618显得不够用。 今年第二季度财报的电话会上,小米CFO林世伟表示,随着供应短缺有所缓解,在国内市场年中61...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。