因为设计思想和技术工艺的限制问题,RV610/630所采用的US方式与G84/86有很大不同。一个标量进行一次运算的操作称为1D操作,G84/86采用的是类似G80的MIMD(多指令流多数据流)的架构设计,每个运算单元为1D的单元,共有32个1D单元;而RV610/630采用的是SIMD(单指令多数据流)的设计,运算单元内有一个分支执行单元一个复杂算术子单元和四个简单算术子单元。
![]() |
每个US内共有5个可执行简单算术的子单元,因此在合适的驱动程序下,理论上能够驱动5个单元能够相互独立的进行1D的标量运算。也就是说理想条件下,RV610/630US中的每个算术子单元都能等效于G84/86的一个US,也就是一个SP(Stream Processor),所以RV610/630号称具有40/120个SP也并非夸大其辞。
每组纹理单元具有8个纹理定址单元,20个FP32的纹理采样器,4个纹理过滤单元,每组纹理每周期能执行4个双线缓冲。采用了L1、L2的纹理缓存架构,RV630具有128K的L2,而RV610只有64K L2。每组渲染后端每周期输出4个色彩像素。简单说每组纹理单元等效于以前一般意义上的4个纹理贴图单元,而每组渲染后端等效于4个光栅操作处理器。
引入新的抗锯齿模式CFAA,最高可实现24X的CFAA,MSAA的等级也提升到了8XMSAA。采用双向环形总线,进一步提高了显存使用的灵活性,降低线路延迟。