多款英特尔锐炫多卡方案上线，让全场景AI部署更高效-DIY装机专区

多款英特尔锐炫多卡方案上线，让全场景AI部署更高效

作者：辛文辉编辑：辛文辉 2025-10-16 18:04 IT168网站原创

2025年10月16日，深圳——在今日举行的湾区半导体大会上，英特尔发表了题为《英特尔锐炫多卡方案助阵AI应用落地部署》的演讲。演讲着重阐释了英特尔为加速企业AI部署所推出的创新路径——通过打造基于英特尔锐炫多卡的Battlematrix（战斗阵列）推理工作站平台，突破单GPU的算力和应用瓶颈，为从边缘、工作站到服务器的广泛应用场景，提供高效且极具成本效益的AI部署方案，让更多企业将AI转化为实际生产力。

英特尔中国区显卡和AI高级产品总监徐金平发表演讲

在AI时代，企业面临的是一个充满机遇与挑战的局面：一方面，大模型规模化商用进展突飞猛进，蕴藏的机遇近在咫尺。另一方面，无论是海量图像、文本、音视频数据的处理，还是复杂精细化AI模型的部署等等，都给传统算力架构的性能和能耗带来了挑战。AI浪潮的确是席卷而来，但如何将AI潜力有效地转化为实际生产力，仍是一道横亘在前的难题。

英特尔锐炫多卡方案希望凭借灵活的扩展能力，不仅高效承接多模态数据的密集型计算需求，又能降低企业AI部署的成本与复杂度，为AI的大规模、普惠化落地筑牢支撑。

作为方案的核心硬件，英特尔锐炫™ Pro B60 GPU有着为AI推理量身打造的关键亮点——24GB的大显存和456GB/s的高内存带宽，满足了AI推理对显存容量的迫切需求，让大参数模型流畅运行，让海量数据高效吞吐；同时，197 TOPS的峰值算力则为各类复杂AI推理任务提供了源源不断的动力。

英特尔锐炫Pro B60 GPU的另一大亮点是支持多显卡协同工作。考虑到边缘端和服务器等更广泛应用场景的需求，英特尔设计了基于锐炫Pro B60 GPU的多卡互联方案——Battlematrix（战斗阵列）推理工作站平台。它最多可搭载8/16张英特尔锐炫Pro GPU，显存最高可达192GB/384GB，支持100B+参数模型，可顺畅处理大规模数据集与复杂模型等任务，契合企业对“高算力+大显存+成本效益”的多重诉求。在实际应用中，英特尔工程师团队借助该方案，将原本需数天完成的代码修复全流程缩短至数小时，充分验证了多卡互联方案在复杂任务处理中的高效与可靠。

以英特尔锐炫Pro B60和锐炫多卡解决方案为核心，英特尔为不同场景的AI部署提供了灵活的产品形态选择。具体而言：

·个人和边缘侧轻量级AI推理场景：提供搭载1块英特尔® 酷睿™ 处理器和1-2块英特尔锐炫Pro B60 GPU的方案，支持7B至32B模型，实现单用户到16+多用户的并发处理。

·通用工作站及服务器场景：通过搭载英特尔® 至强® 处理器平台，并配置4块英特尔锐炫Pro B60 GPU，可支持32B至70B模型，满足50+用户的并发需求。

·专用AI服务器场景：可借助2块英特尔® 至强® 处理器平台和8-16块英特尔锐炫Pro B60，支持32B至100B模型，服务100+以上用户。

由此一来，无论是个人电脑、边缘设备、通用工作站/服务器，乃至专用AI服务器，都能找到与之匹配的高效且具备成本优势的部署方案，这正是英特尔助力更多企业快速推进AI部署与实践的具体体现。

今年，英特尔已经推出了英特尔锐炫多卡AI算力一体机方案，而基于英特尔锐炫Pro B系列的多卡方案的到来，进一步丰富了英特尔支持AI大模型部署的硬件形态。在AI快速迭代的当下，英特尔强调的是软硬结合的综合价值，将通过底层硬件创新与开放软件生态，让AI部署更普惠、更便捷。

关注我们