阿里云:2026年基于内存语义的在网计算开放标准IFEC v1.0报告
VIP专免
IFEC Spec V1.0
文档说明
本文旨在定义一种 xPU 与交换芯片的协同计算范式 IFEC(In Fabric Extended-Computation),该范式为满足
超节点架构中跨 xPU 的通信加速与卸载需求而设计,交换芯片可在数据传输路径中直接完成分布式数据的
汇聚、计算及结果分发。本文希望通过详细阐述 IFEC 加速的规范和实现细节,为 xPU 厂商、交换机厂商、
IP 厂商作为设计参考
1 术语
术语
解释
IFEC
In Fabric Extended Computation
UCIE
Universal Chiplet Interconnect Express
MoE
Mixture of Experts
EP
Expert Parallelism
SM
Streaming Multiprocessor
AXI
Advanced eXtensible Interface
NOC
Network-on-Chip
CBFC
Credit-Based Flow Control
VC
Virtual Channel
ASIC
Application-Specific Integrated Circuit
MMU
Memory Management Unit
2 Scale up 网络性能演进
随着大模型训练/推理持续规模化爆发后,xPU 通过 Scale Up 网络进行高效数据访问的需求日益增
长。在早期,xPU 服务器通常为机内八卡 Scale Up 互联,用于提供高带宽低时延通信,跨机仍依赖 Scale-
out 网络,张量/流水并行在 Scale Up 边界处出现带宽与延迟落差。随着并行度提升与 MoE 通信增多,机柜
级别,甚至更大规模的 Scale Up 网络成为了业界的主要关切。随着 Scale Up 网络规模不断扩展,机架级互
连成为基本算力单元,同时内存语义的边界也得到了极大的扩展。
随着更多的流量被纳入 Scale Up 网络中,Scale Up 网络需要承载更多的集合通信种类,容纳更复杂的流量
特征,Scale Up 网络的互联性能将会成为决定集群规模扩展与性能提升的关键。其中基于内存语义的网络
加速作为更高级的计算特性,会极大的优化算力成本与时延,从而全方位的提升部署在此基础设施之上的
训练推理应用的性能。
3 下一代可计算 ASIC 需求
集合通信算子的加速需求可以分为多播与计算两类,在此基础上,IFEC 支持动态通信组,即对于 MOE
ALL2ALL 这类算子,可通过数据平面创建动态多播组,用于确保其时延性能。同时,IFEC 也支持静态通信
组模式,即通过 GNMI 等控制面下发的方式提前创建通信组。
图1. 交换机在网计算引擎
所以在高带宽域内,下一代用于交换芯片需要满足“动态多播”与“可计算”的能力,实现交换芯片与 xPU 高质
量的计算协同。
● 交换芯片可以通过计算引擎提供计算能力,支持以 INTx/Floatx/BFloatx 为主的数据类型
● 支持以 Min/Sum/Max 为主的计算类型
● 支持 MMU(Memory Management Unit)到计算引擎的精细流控
● 支持多种规约数据长度
图2. 交换机在网计算引擎
交换机内部将数据类型转化为FP32,同时每次计算时都按既定的顺序相加,最大程度减少精度损失,IFEC
将会基于下一代可计算 ASIC 进行实现
4 IFEC 协议设计
IFEC 秉持开放解耦、分层设计的思想,旨在通过扩展计算头 (ECH) 支持内存语义下的集合通信加速操作,
摒弃定制化,形成通用开放的内存语义加速标准,在最小化开销的同时满足一定的扩展性。
IFEC 完全与上层协议解耦,上层协议则无需携带任何与通信卸载相关的信息,支持简单,比如标准以太网
头可通过 Ether-type 进行支持,ETH+(高通量以太网)协议已通过 Next-Header 进行支持,详细信息可参
考ETH+ Spec
图3. ECH 灵活封装
4.1 ECH option1
IFEC 通过 ECH 来识别加速或卸载相关的信息。当 xPU 需要通信卸载与加速时,xPU 按需封装 ECH 发送,
支持 IFEC 的交换机需要从 ECH 头判断接下来的行为
标签: #报告
本资料由有户自行上传,仅供个人参考学习使用(禁止商用)。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本内容侵犯了原著者的合法权益,可联系我们进行处理。
相关推荐
-
湖区自然景区旅游品牌传播创意方案【旅游】【文旅】VIP专免
2024-12-25 147 -
肛泰大橘猫电梯投放【梯媒,电梯广告,户外广告】VIP专免
2025-01-14 137 -
B2B市场人DeepSeekAI提示词手册VIP专免
2025-02-19 178 -
清华大学:2025年迈向未来的AI教学实验报告VIP专免
2025-03-29 158 -
智变2025:互联网AI应用元年VIP专免
2025-03-29 164 -
AI如何变革能源化工行业?VIP专免
2025-03-29 169 -
6秒钟情商:2025年EI&AI职场现状报告VIP专免
2025-04-10 131 -
浙江大学:2025年大模型:从单词接龙到行业落地报告VIP专免
2025-04-19 135 -
代理式AI的拐点之年:CEO的两年转型路线图VIP专免
2025-10-28 144 -
AI重塑中国互联网前沿洞察VIP专免
2026-03-05 119
作者:我是水手
分类:研究报告
价格:免费
属性:19 页
大小:2.58MB
格式:PDF
时间:2026-02-05
相关内容
-
2026年春节AI应用、游戏和电影跟踪:AI应用加速迭代,内容消费格局凸显
分类:研究报告
时间:2026-02-26
标签:AI
格式:PDF
价格:免费
-
token跳动:2026AI业务落地白皮书春节特刊
分类:研究报告
时间:2026-02-26
标签:白皮书
格式:PDF
价格:免费
-
电子行业深度报告:2026年端侧AI产业深度,应用迭代驱动终端重构,见证端侧SoC芯片的价值重估与位阶提升
分类:研究报告
时间:2026-02-26
标签:AI
格式:PDF
价格:免费
-
新经济中工作的四个未来__2030年的AI与人才
分类:研究报告
时间:2026-02-26
标签:AI
格式:PDF
价格:免费
-
AI重塑中国互联网前沿洞察
分类:研究报告
时间:2026-03-05
标签:AI
格式:PDF
价格:免费


