可擴充的處理器陣列

架構中沒有大幅度更改,採用的仍然是Nvidia所謂的可擴充處理器陣列(或稱為串流處理器陣列,各方說法不一)。G80的SPA的排列方式如下:

8個TPC(紋理處理器叢集),每個叢集包含1個紋理單元和2個串流多重處理器(SM)。在GT200中,Nvidia將單元數增加到10個TPC,每個TPC的紋理單元仍然是1個,但現在多重處理器增加到3個。

這項改變凸顯了新型著色引擎的發展趨勢,特別著重在算術指令方面。每個TPC的紋理單元使用的模型和G84及G92相同,其定址容量和濾鏡容量相同,G80就不是這樣,它的濾鏡容量是定址容量的2倍。因此,在RGBA8(最近或雙線性)紋理的簡單濾鏡模式下,G84/G92/GT200的紋理單元的效能為G80的兩倍。在更先進的濾鏡模式或RGBA16紋理中,這項改變沒有造成差別。

在一項專屬於GT200的改良中,Nvidia表示他們現在採用效率更高的排程器來管理紋理運算,如此應該可更接近G92的最高效能。我們使用Fillrate Tester來測試看看:

紋理單元從64個增加到80個,再加上繪圖處理器頻率的差異,只讓GTX 280取得比9800 GTX領先11%的優勢。不過我們在四倍材質項目測得43%的領先,雙倍材質更高達118%!單單排程器的改良不足以解釋這樣的差距。不過,像素管線數目增加(成為2倍)也有所貢獻。無論如何,GTX280在單一或雙重紋理下(97%)顯然比9800 GTX(80 91%之間)接近理論填充率得多,也就是說,Nvidia所做的改良產生了實際效用。就如我們先前曾經提過,AMD雙處理器顯示卡的時脈頻率同樣高於Nvidia的產品,但在四倍紋理下只比GTX 280落後32%。

現在一起來看看針對紋理搜尋進行測試的RightMark3D 2.0 PS 4.0紋理測試結果。

第一個著色引擎(Fur)的結果相當令人驚訝:提升幅度為14%,由於混色、幾何著色引擎和填充率都與著色引擎的製作方式有關,因此這個數字並不算高。另一方面,Steep Parallax Mapping 項目中測出的59%提升就比較引人注目,不僅符合預期,而且相當讓人寄予厚望。


Google 廣告
廣告
Ads
的文章和評比
smartad
Recherches populaires