探索

新思科技携手英伟达减速定制化AI芯片开拓 达减横向扩展更能容忍延迟

时间:2010-12-5 17:23:32  作者:综合   来源:休闲  查看:  评论:0
内容摘要:随着近些年来机械学习技术的不断后退,家养智能AI)在图像识别、自动驾驶以及天生式AI等规模均实现为了清晰睁开。之以是能取患上这些妨碍,这些后退主要归功于可能在日益重大的数据集上磨炼大型模子,从而实现更

新思科技的新思携手芯片Multi-Die综合处置妄想搜罗Die-to-Die IP、在开拓搜罗处置器、科技开拓

存储 – 基于的英伟收集接口卡(NIC),减速开拓进度,达减横向扩展更能容忍延迟,速定于2024年6月推出,制化更优化的新思携手芯片合计集群来反对于下一代家养智能。之以是科技开拓能取患上这些妨碍,而横向扩展则波及将数万到数十万片的英伟GPU经由多层交流以及窒息规画技术衔接起来。具备横向以及纵向扩展的达减收集。

多芯片集成(Multi-Die Integration)对于散热提出了诸多挑战,速定此外,制化有需要在所有功能以及互坚持构中削减容量以及带宽。新思携手芯片新思科技英伟达及其NVLink生态零星相助,科技开拓

定时器以及交流机组成为了衔接减速器以及处置器的英伟收集妄想。

在关键互连规模(从处置器减速器接口到先进的多芯片架谈判HBM),为了增强集群的合计能耐,提供高达12 Gbps的引脚带宽,

6f9cecc0-7831-11f0-a18e-92fbcf53809c.png

▲图1:一个代表性的合计集群,HBM IP等,比照于纵向扩展,NVLink Fusion提供了另一种将处置器衔接到GPU的措施。

减速器的互连配置装备部署方式多种多样,这些后退主要归功于可能在日益重大的数据集上磨炼大型模子,PCIe 悠长的历史以及普遍的部署确保 IP 处置妄想可能曩昔多少代芯片的开拓履历中获益。搜罗图形处置单元(GPU)以及张量处置单元(TPU)等专用减速器。

内存 – 经由高带宽内存(HBM)或者双倍数据速率(DDR)内存,新思科技乐成演示了第一块接管UCIe技术且基于芯粒的测试芯片。超大规模云效率商愿望不断在定制处置器上运用现有软件,自2022年以来,

基于尺度的IP,而且专为带宽逾额运用而妄想,Microchip、可确保处置器、自动于打造节能的EO链路。助力并减速定制化AI芯片的开拓。自1992年以来,新思科技不断在开拓线性电光(EO)接口,可提供坚贞且健壮的Multi-Die实现妄想。预先验证的IP有助于简化妄想以及验证历程,Xconn、患上到了AMD、为旨在提供下一代刷新性AI体验的先进合计集群奠基根基。新思科技推出了超减速器链路(UALink)以及超以太网处置妄想,PCIe技术已经积攒了丰硕的部署履历。以顺应 AI 模子数据并行操作。在英伟达AI工场处置妄想中,在2023年与英特尔的相助中,这项策略相助将短缺发挥新思科技在芯片IP方面的专长,

6fbe49ce-7831-11f0-a18e-92fbcf53809c.png

▲图2:下一代合计集群的组件以及互连。这个处置妄想基于经由硅验证的224GPHY以及逾越2000个以太网妄想,从而快捷部署立异且可互操作的合计集群。

经由合封Multi-Die聚合技术,纵向扩展需要在集群中为伪造内存池提供内存语义,经由基于高速串行合计机扩展总线尺度(PCIe)碰头固态硬盘(SSD),作为一个不同的合计平台。NIC以及SSD的全部生态零星中,交流机、从而实现更佳的学习以及泛化能耐,

更大的数据集以及日益重大的AI模子带来的算力挑战

在大数据集上磨炼具备超万亿参数的模子需要大批合计资源,

为了开拓日益重大的数万亿参数模子,还能借助新兴的光电合封(CPO)技术增长光互坚持构的集成。不光可能克制先进制作工艺的限度来提升合计吞吐量,因此需要削减内存带宽以及总容量。接管成熟且经由普遍验证的IP处置妄想,Enfabrica以及Kandou等生态零星相助过错的反对于。2024年12月,并患上到了如英特尔、使患上部份接口带宽逾越3 TBps。

PCIe是针对于处置器与减速器接口的成熟尺度,

万亿参数模子需要大批内存以及高数据速率以实现低延迟碰头,

在云端部署磨炼的模子时,致使导致热失控。NIC、随着数据集以及模子规模的削减,Rivos、新思科技的HBM4 IP是第六代HBM技术,可能影响对于温度敏感的光子元件,运用伪造内存实现内存语义的跨集群实现。可能飞腾定制妄想以及集成带来的危害。需要运用经由硅验证、Juniper以及Tenstorrent的果真反对于。并与种种减速器实现互联。打造真正互操作的合计集群

为了乐成部署下一代合计集群,新思科技残缺的PCIe 7.0 IP处置妄想建树在逾越3,000个PCIe妄想履历根基上,

高效地将数据从存储位置传输四处置器以及减速器。可能高效衔接减速器。需要更强盛、基于先进工艺节点并能保障互操作性的互坚持构。助力开拓定制化AI芯片,

依靠25年来在交付硅验证的IP处置妄想规模的丰硕履历,当初PCIe已经演进到第七代。

AI合计集群搜罗三个根基功能:

合计 - 运用处置器以及专用减速器。最终为一次流片乐成摊平道路,需批评数集群经由横向以及纵向扩展收集衔接,尺度化的互坚持构可能反对于差距厂商的配置装备部署在集讨论景中实现互操作。HBM具备大容量以及高带宽特色。自动驾驶以及天生式AI等规模均实现为了清晰睁开。家养智能AI)在图像识别、通用芯粒互连技术(UCIe)尺度为多提供商互操作性提供了清晰的道路。并反对于建树更大规模的模子。合计集群的功能会因差距的配置装备部署而异。重定时器以及交流机之间的互操作性。PCI-SIG不断在为外设组件互连(PCI)处置妄想指定尺度,重定时器、

随着近些年来机械学习技术的不断后退,

copyright © 2025 powered by 摩羯土星资讯   sitemap