幾何效能,PowerPlay
AMD 不但改良其架構的缺失,該公司工程師也進一步提升顯卡的既有強項。幾何著色器的效能已經改良,這並不令人意外,這種類型的著色器也才誕生不久,前一代架構即是 AMD 或 Nvidia 建置的第一版本,現在他們終於有時間來改良其第一版本了。就像 Nvidia,AMD 增加了幾何著色器的輸出緩衝大小,以在 GPU 上保存更多資料。同一時間內處理的幾何著色器執行緒數已經增加為四倍,現在讓我們來看看這些改良之處的實際效果:

雖然 RV770 在 Galaxy 效能測試表現並不令人印象深刻 (讀者可以注意到 GT200 超出 G92 的幅度有限,似乎不太受緩衝大小的影響),但在 Hyperlight 就發揮了潛能,落在 GTX 280 之後成為第二。
讓我們將重點放在幾何效能上繼續測試,這次搭配頂點著色:

再次不意外的是,AMD 架構仍然領先。但還是有另人失望之處,因為通常我們會期待具有 800 ALU 的架構能創造更佳的分數。但實際上目前所有 GPU 仍受到設定引擎的限制,在最佳情況下也只能每個周期跑一個三角形。The Vertex Shader 3.0 測試無法在 RV770 上執行。

讓我們繼續看頂點著色器的效能,不過這次專門鎖定在紋理擷取 (fetching) 上-這是個實用的技巧,尤其是置換貼圖 (displacement mapping) 時。Nvidia 在 Earth 測試保有些微的優勢,但在 Waves 測試中,AMD 遠遠超前-甚至讓 Nvidia 最夯的新系列產品落後。
PowerPlay
AMD 也改善了 GPU 功耗的管理方式,尤其是導入了可在晶片的特定元件不使用時關閉的時脈選通 (gating) 功能。AMD 也修正了搭配中階或低階 CPU 時 RV670 上所出現的電源管理錯蟲。以前在搭配上述 CPU時,RV670 有時候會使用率不足而切換為低耗電模式,當 CPU 完成資料處理並突發傳送資料時,GPU 必須轉移回高效能模式,此時需要幾個周期處理,因此會造成頓頓的現象。
GPU 上的微控制器也可以讀取以下數據:
- 散佈在 GPU 上不同感測器的溫度;
- 不同 GPU 區域的活動。這個微控制器也控制了根據讀數反應的時脈選通功能與 GPU 的頻率,降低了驅動器層面的成本。
