指令集对处理器的性能有巨大影响,而在2017年以后,Intel逐步将AVX-512指令集及其拓展下放到更多产品线上,截至目前,代号为Cascade Lake的至强可拓展处理器、至强W工作站以及酷睿X处理器都支持AVX-512指令集,甚至轻薄本上采用Sunny Cove架构的Ice Lake-U低功耗处理器也支持半吞吐AVX-512。
根据Intel官方的表述,满吞吐AVX-512借助多达两个 512 位融合乘加 (FMA) 单元,应用程序在 512 位矢量内的每个时钟周期每秒可打包 32 次双精度和 64 次单精度浮点运算,以及八个64位和十六个32位整数。因此,AVX-512指令集与AVX2指令集相比,其数据寄存器的宽度、数量以及 FMA 单元的宽度都增加了一倍,能帮助专业用户处理最苛刻的计算任务,带来翻倍的性能提升。
为了完善软硬件生态,更好的让高端处理器发挥出最大性能,Intel近日推出了一款光追渲染开发工具OSPRay,基于Apache 2.0开源。在去年8月份的SIGGRAPH大会上,Intel高级副总RajaKoduri就预告了全新版本的OSPRay 2.0,这是OSPRay系列的一个重大版本升级,会带来诸多新功能,升级Embree光追内核、支持Open Image Denoise,它使用Open Volume Kernel Library(OpenVKL)进行体积渲染,大幅提升了光追渲染的性能及功能。
OSPRay 2.0除了支持Intel的SSE4、AVX、AVX2等传统指令集以外,还支持最新的AVX-512指令集,去年皮克斯动画工作室宣布他们的Renderman软件利用二代至强可扩展处理器的AVX-512指令集实现了2倍以上的渲染速度,可见AVX-512指令集这一指令集对生产力速度的巨大提升。