ROP、記憶體控制器
ROP
ROP 是 AMD 前一世代的另一弱項:啟用反鋸齒功能時效能表現差勁。至於紋理單元,工程師則是從無到有設計,目標同樣是最大化相同裸晶區域上單元的效率。
首先要提的改良就是 Z 渲染 (rendering)。ATI 先前架構帶來了 depth pass 充填率加倍的可能性,但仍落後 Nvidia,後者的充填率可在這些情況下提供八倍速度。到了 RV770 世代,AMD 仍然落後,只將充填率提升為四倍-成為每個周期 64 個像素。讓我們用可靠的充填率測試程式來核對:

再次並無意外,如我們所見的純充填率數字。在另一方面,Z 渲染就有點令人失望。數字的確有所改善,但在 RV670 接近其理論值 (x1.89,而非 x2) 的地方,RV770 則有很大落差 (x2.41 而非 x4)。這仍不足以與 G92 競爭,後者也遠遠偏離其理論值 (x5.2 而非 x8),但仍遠遠領先對手。
不過這並非 ROP 的主要改良。ATI 工程師專注於修正前一代的反鋸齒效能-當時較之競爭對手可謂「悲慘」。RV670 在 MSAA 2X 或 4X 模式時每個周期只能寫入 8 個像素-充填率除以二-但 RV770 卻沒有效能損失,此時每周期仍能寫入 16 個像素。以相同方式,一個 FP16 畫面緩衝 (frame buffer) 的渲染已經優化,現在可以全速進行,相同情況下以前 RV670 的充填率也被除以二。
記憶體控制器
從 R520 導入環圈匯流排 (ring bus) 的設計後,AMD 一直改良其記憶體控制器。新架構的最新特色之一是分隔開「頻寬耗用高」(如 L2 紋理快取或 ROP) 的用戶端與可容許頻寬較少的用戶端 (如 PCI Express 控制器、顯示控制器等)。頻寬較低的用戶端共享相同的集線器 (hub),而記憶體控制器分佈在接近高頻寬「消費者」的晶片上。