4月30日消息,英特尔和 AMD 联合发布人工智能计算扩展 ACE 白皮书,定位为 x86 架构的标准矩阵加速方案。ACE 引入基于外积运算的矩阵加速机制,在消耗相同数量输入向量的前提下,计算密度比等效的 AVX10 乘加运算高出 16 倍。
ACE 作为 x86 指令集的关键扩展,无缝集成 AVX10,支持 INT8、OCP FP8、BF16 等主流 AI 数据格式,设计兼顾灵活性与扩展性,旨在构建覆盖笔记本电脑到超级计算机的全场景矩阵加速框架。
软件生态方面,ACE 集成低精度 GEMM 等深度学习和高性能计算库,并启动适配 NumPy、SciPy 等 Python 库以及 PyTorch、TensorFlow 等主流机器学习框架。两大 CPU 巨头的联合推进对 x86 生态意义重大。