nVidia GeForce GTX 470 / 480 的效能


nVIDIA 在 ATI Radeon HD 5000 系列推出後,其實算是被打壓了好一陣子。而 nVIDIA 在 GT200 後的新架構 Fermi,由於他以計算出發的設計架構、而且好資段時間都一直只有 nVIDIA 官方放出來的消息,卻沒有看到實際的測試,再加上製程良率等等的問題,一直讓人擔心 nVIDIA 基於 Fermi 的新一代 GF100 系列的顯示卡,到底有沒有問題?

而 3/26,nVIDIA 的 GF100 也終於解禁了!目前的 GF100 顯示卡,基本上就是 GeForce GTX 470GeForce GTX 480;而各大國際測試網站,也都陸續地放出了自己的效能測試結果與評測!下面就是一些連結的整理:

首先,還是看這兩張顯示卡的規格吧~

GeForce GTX 470
GeForce GTX 480
CUDA Core
448
480
Graphics Processing Cluster
/Streaming Multiprocessor
4 組 GPC、14 組 SM
*關閉兩組 SM
4 組、15 組 SM
*關閉一組 SM
Texture Unit
56
60
ROP Unit
40
48
繪圖時脈
607 MHz
700 MHz
處理器時脈
1215 MHz
1401 MHz
材質填充率
34 GigaTexels/s
42 GigaTexels/s
記憶體配置
1280 MB GDDR5
1536 MB GDDR5
記憶體時脈
1674 MHz
1848 MHz
記憶體介面頻寬
320bit
384bit
記憶體頻寬
133.9 GB/s
177.4 GB/s
最高 GPU 溫度
105 C
最高功耗
215W
250W
電源接頭
6-pin x2
6-pin + 8-pin
接頭
Dual-Link DVI *2 + miniHDMI
僅能使用兩個輸出
其他
晶片為 40nm 製程
使用 PCI-Express 2.0 x16 介面
支援 OpenGL 4.0 / DirectX 11
支援 2-way / 3-way SLI
支援 3D Vision / 3D Vision Surround
支援 CUDA / PhysX / OpenCL
預計售價
$350 美元
$500 美元

而實際測試呢?基本上,由於各家遊戲所使用的技術、演算法都不同,再加上設定配置的不同,其實對於不同的遊戲,常常會有不同的結果,所以很難說不同家、不同架構的顯示卡,到底哪個快。

不過大致看了幾家的評測,Heresy 自己目前的感想主要是:

  1. 效能雖然有出來,但是沒有預期的要好,並沒能把差距拉開。
  2. 這種等級的卡,就開高解析度、然後拉高反鋸齒參數吧。
  3. 另外,不虧是以計算為導向而設計的顯示卡!
  4. 但是相對的耗電量和溫度,其實都滿可觀的。
  5. 就連 GeForce GTX 480 都被閹割過了…

真要講細節的話:

  • 在效能方面

    • 在 3D 遊戲的方面,現有的 GF100 並沒有辦法能夠把 ATI Radeon HD 5870 完全地甩到後面去;雖然以整體的測試結果來看,應該算是有領先的,但是卻沒有能把差距拉的很大。
      不過整體來說,GTX 480 應該會比 Radeon HD 5870 快GTX 470 應該會比 Radeon HD 5850 快。(以 AnandTech 的結論來看,480 大約比 5870 快 10~15%、470 大約比 5870 慢 5~10%)

    • 不過,該說 GF100 不虧是以計算為導向而設計的顯示卡嗎?在 GPGPU 的方面,它的效能算是有相當的成長的!這部分可以參考 AnandTech 文章的《Compute》的部份,雖然說是 case by case,但是大部分的測試,GTX 480 都能是 GTX 285 的兩倍以上!以 GPU 版的 Folding@Home 來說,GTX 480 每天沒計算的 Node 數目,就比 GTX 285 多了 3.5 倍

  • 但是在這樣的 3D 效能差距下,GTX 480 的 500 美元定價,實在是讓人覺得有點不值得了…不過相對的,GTX 470 的 350 美元,或許會有機會可以搶 5870 的市場。

  • 在耗電量和溫度的部分,基本上 GF100 就是被 ATI 5000 系列打假的了…

    • 在溫度方面,以 AnandTech 的測試來看,GTX470 / 480 閒置時的溫度是在 46 / 51 度左右,基本上大概比 ATI 5850 / 5870 高了 10 度。
      而在全負載時,GTX 470 / 480 都衝到了 9x 度的高溫!雖然 ATI 5850 / 5870 也飆到了60 – 80 度,大致的差距變成在 10-20 度左右了。可見 GTX 470 / 480 的熱量的確頗為可觀…

    • 在耗電量方面,nVIDIA 就真的要哭了…
      在閒置狀態下,GTX 470 / 480 的全系統耗電量,大約在 173 / 190 W 左右,相對於 5850 / 5870 的 163 / 164 W,已經算有一些差異了;而且 GTX 480 的耗電量,甚至超過 5870 CrossFire 的 181W…
      到了負載狀況下,GTX 470 / 480 的耗電量更是到達 408 / 479W!而此時 5850 / 5870 的耗電量還在 207 / 375W,基本上差異已經到達 100W 了…

  • 感覺上,GTX 480 雖然是目前 Fermi 架構最高端的卡,但是實際上也是因為溫度、耗電量、良率等問題,而被閹割過的產品。

    • 像以 CUDA Core 的數目來說,理論上四個 GPC 下,應該是會有16 組 SM,而每組 SM 又有 32 個 CUDA Core,所以完整的 4GPC Fermi 架構,應該會有 512 個 CUDA Core;而由於 GTX 480 被關閉了一組 SM,所以也只剩下了 480 個CUDA Core…GTX 470 則因為被關閉了兩組,所以變成 448 個了。(不知道是不是 40nm 晶圓良率的問題?)

    • 在時脈上,GTX 480 所有的時脈基本上都被設定的比上一代的 GTX 285 還要低,不管是核心、還是記憶體都是如此;所以以材質填充率來說,GTX 480 也還比不上 GTX 285…這點基本上,也是會壓制整個效能非常關鍵的一點。會這樣的設定,基本上應該就是因為溫度和耗電量的關係了吧…

  • 其他想法:
    • 如果在製程技術上有新的突破、發展的話,理論上 Fermi 的圖形效能應該還可以透過拉高時脈、再往上一層?不過這應該也是以後的事了。
    • 在 Quadro Plex 或 Tesla 這一類的特製化系統裡,或許可以無視耗電量和熱量,再把時脈往上調、增加效能?

另外,其他的評測整理,也可以參考:

順便追加:流言中的 Fermi 中低階卡 GF104 規格,可以參考 Geeks3D 的文章《NVIDIA GF104 Specs: GeForce GTS 430, GTS 440 and GTS 450》。

About these ads

關於 Heresy Ku
http://kheresy.wordpress.com

3 Responses to nVidia GeForce GTX 470 / 480 的效能

  1. Heresy 說道:

    個人是這樣認為的:理論上 Tesla, GeForce, Quadro FX 都是同一架構的 GPU,但是應該是有作一些微調、還有驅動程式上的不同,nVidia 就是透過這種調整來作市場區隔的。而效能上的差異,應該就是這部分來的。

  2. Kemu 說道:

    Heresy, 我一直不明白的是, GEFORCE卡和TESLA卡, 为什么有同样多的GTX200 SM, 价格却差距那么大. 我比较过FX卡和GEFORCE的比较, 同样的测试程序, 如果编排不好的话, FX 明显速度上比较快, 当然如果处理的比较好的话, 速度基本是一样的.

  3. Heresy 說道:

    NVIDIA GTX400 Tech-Demos Available
    http://www.geeks3d.com/20100327/nvidia-gtx400-tech-demos-available/

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / 變更 )

Twitter picture

You are commenting using your Twitter account. Log Out / 變更 )

Facebook照片

You are commenting using your Facebook account. Log Out / 變更 )

Google+ photo

You are commenting using your Google+ account. Log Out / 變更 )

連結到 %s

Follow

Get every new post delivered to your Inbox.

Join 409 other followers

%d bloggers like this: