近日,美国不断加大对我国高端芯片的封锁力度。11月12日和12月2日,美国商务部相继出台多项政策,以限制中国尖端半导体及相关制造设备企业发展。面对压力,国家各部委相继出台政策支持国产芯片发展,国产CPU和GPU已取得初步成果。然而,作为支撑CPU、GPU等计算芯片互联的RDMA网卡芯片,起步晚、规模小、发展慢,目前国内成熟商用RDMA网卡芯片最高性能不超过2×100G。在这一背景下,CCF YOCSEF天津于2024年12月14日在天津东凯悦酒店举办了主题为“芯脉相承:芯片之后,如何打通网络联接动脉?”的技术论坛,以探讨国产RDMA网卡芯片距离400G、甚至800G还有多远的路要走。
图1:论坛嘉宾合影
经过参会嘉宾的广泛探讨和热烈思辨,本次论坛观点总结如下:
1. 在国内RDMA网卡产业的未来发展中,芯片制程工艺的进步是RDMA网卡性能提升的核心动力,是推进产业发展的中流砥柱,但短期内难以实现重大突破,而硬件逻辑设计的创新则作为应对市场需求、缩小与国外先进水平差距的权益之计。专家指出,基于多核架构有望弥补我国芯片制程工艺的不足,将RDMA网卡速率提升至400G、甚至800G。
2. 专家普遍认为,无损网络对于充分发挥GPU算力至关重要,但部署难且成本高;有损网络在部分容忍丢包的训练场景中更具成本和扩展性优势,当前更加适合AI万卡集群互联。在Scale-Up与Scale-Out分离与融合的思辨点上,专家普遍认为, Scale-Up与Scale-Out短期是分离状态,但长期要坚持基于以太网,对这两种网络进行融合。
3. 专家呼吁,国产RDMA网卡技术标准和产业生态需要由中立科研机构或产业联盟来进行推动,在物理层、链路层、网络层和传输层形成RDMA技术标准,并与美国主导的UEC标准兼容互通,推动产业链上下游的合作,包括芯片制造商、网卡生产商、服务器供应商、数据中心运营商等,共同构建健康的产业生态 。
本次论坛由中国计算机学会(CCF)主办,CCF青年计算机科技论坛(YOCSEF)天津分论坛学术委员会组织,天津大学天津大学TANKLAB重点实验室和浪潮天津共同支持举办。YOCSEF天津AC委员、天津大学智能与计算学部李文信教授和CCF YOCSEF 天津 AC 委员浪潮集团(天津)教科研行业总监王琦共同担任执行主席,CCF YOCSEF 天津 AC 委员浪潮集团(天津)客户经理梁润泽担任线上主席。
图2:论坛执行主席李文信、王琦与在线主席梁润泽
引导发言阶段,论坛邀请了天津大学讲席教授、国家级领军人才徐江涛,CCF188体育投注编委会主任苏金树教授以及中科驭数产品运营部副总经理曹辉作为引导发言嘉宾,分别从硬件集成电路技术发展机遇与挑战,大规模智算网络构建,以及大规模AI集群中的生态等角度对国产RDMA网卡芯片发展进行了展望。
徐江涛的引导发言主题为《后摩尔时代集成电路技术发展机遇与挑战》。徐江涛从集成电路的产业背景、发展历史、技术挑战与机遇以及典型芯片四个方面分析了后摩尔时代集成电路技术的现状与前景。徐江涛强调,集成电路是信息产业的核心基石,也是国家战略的重要支撑。面对全球技术封锁和产业链不安全性,中国需要突破工艺、装备和设计等关键环节的瓶颈。后摩尔时代中集成电路在技术层面需解决功耗、寄生参数和制造成本等问题,同时探索异构集成与感存算一体等新兴方向。市场层面,碎片化需求为创新中小企业带来了成长空间。徐江涛呼吁通过数字化与智能化制造技术实现集成电路技术的高效发展,并强调科研与应用结合的重要性。
图3:天津大学讲席教授、国家级领军人才徐江涛
苏金树的引导发言主题为