Fermi三部曲,專業繪圖卡Quadro 5000亮相

hoinsb

一般般會員
已加入
6/18/09
訊息
71
互動分數
0
點數
0
2009年9月30日,NVIDIA發表了全新的繪圖GPU核心Fermi。Fermi的架構設計,主要是針對GPGPU的CUDA運算做出許多的改進,同時也利用了更先進的製程,將大量的平行運算繪圖核心包裝在單一個晶片當中,以上代晶片兩倍的運算核心數量,卻能提供超越兩倍以上的運算能量。不過,Fermi此次主要針對CUDA運算的架構改良,卻遭到許多質疑。因為許多的特性和功能,都是針對高效能運算領域的需求,來作為設計或強化的。這樣的作法不免令人擔心,在繪圖的本業方面是否可以像先前的G80一樣,以絕佳的效能和特性,帶給使用者許多的驚喜。而這次Fermi的問世,更是打破以往的慣例,並非由一般市場導向的GeForce開始推出,卻是從平行運算的TESLA系列作為首波上市的產品,接著才是GeForce系列,但在專業繪圖卡產品線的部份,卻整整晚了快一年才上市,也就是今天要介紹的Quadro 5000。

不多說,來看看熱燙燙的5000吧
NQFX5001.jpg


背部也加上了金屬散熱片
NQFX5002.jpg


自上一代開始就採用的雙DP+DVI-I的輸出配置,不過一樣只能夠輸出兩個螢幕
安裝把手的螺絲孔以及單6pin的電源配置,身為第二階5000應該不會很耗電才是
NQFX5004.jpg


Dual Slot的設計
NQFX5003.jpg


NVIDIA原廠散熱器
NQFX5005.jpg


SLI接口和專業繪圖專用的G-Sync/SDI附加卡連接口
NQFX5006.jpg


這次的型號把FX給拿掉了
NQFX5007.jpg



用GPU Caps Viewer來看看Quadro的規格
支援了OpenGL 4.0
TQ5008.png


驅動程式所顯示出來的訊息
TQ5009.png


從規格的部份看來,NVIDIA也將專業繪圖卡的功能提昇到了新的層面。軟體的API支援性,在專業繪圖卡強調的跨平台OpenGL部份提昇到了4.0的版本,而微軟獨家的DirectX 11,也是這次專業繪圖卡產品的升級重點。可是在硬體部份,我們可以發現5000的繪圖核心只有352個,只能對應到GeForce的GTX 465,這和之前的作法可以說是大相逕庭。一直以來,高階到中階的繪圖卡部份一直都是和GeForce有著一對一個關係,一般而言Quadro的核心和記憶體時脈可能稍低,不過核心的規格和運算單元的數量卻會是一樣的。雖然如此,規格終究是規格,如果實際使用的效能可以有大幅度增進的話,這樣也可說是一個成功的產品呀。

測試去...
 

MaY_bE

一般般會員
已加入
3/27/10
訊息
82
互動分數
6
點數
8
GF104的會比較好嗎? 2張行個SLI應該比較好吧
 

hoinsb

一般般會員
已加入
6/18/09
訊息
71
互動分數
0
點數
0
既然5000是NVIDIA第二高階的專業繪圖卡,那麼當然要找個相稱的對手來較量較量,才會讓這場測試有他的參考價值。所以我找來了ATI(根據官方消息指出,明年這三個字就會消失了,所以有機會就讓它亮亮相)同樣是專業繪圖卡的高階產品FirePro V8800,來作為這次測試的比較對象。

不囉唆直上主菜

SPEC viewperf 10 1280x1024 64 bit
SVP10508801.png

看到這個分數我整個眼睛都亮了起來,比起一般的遊戲卡來說,NVIDIA這次真的大翻盤了
尤其是在ATI的傳統強項MAYA,5000硬是得到了V8800將近兩倍的分數
以Fermi為基礎的Quadro 5000可以說是在專業繪圖領域的指標性測試軟體SPEC viewperf 10當中大獲全勝

那新的11版狀況會如何呢?
SPEC viewperf 11 1280x1024 64 bit
SVP10508802.png


SPEC viewperf 11 1920x1200 64 bit
SVP10508803.png


最新的11版分數也直指Quadro 5000
絕大多數的結果都幾乎是V8800的兩倍
而CATIA更是超越到達五倍之譜
難道FirePro V8800真的這麼不濟嗎?

我再來找幾個東西測測...
 

falcon-man

一般般會員
已加入
9/27/10
訊息
67
互動分數
0
點數
6
請問大大 不知道2者性價比呢?查了價格 ATI V8800價格幅度好大 ... 不過都接近9萬之譜 雖然用不到那麼好的專業顯卡 不知道哪時候才有哪位大大 測試一下 新款 1萬內~1.5萬的專業繪圖卡測試? 畢竟我想這比較多人想知道...
 

hoinsb

一般般會員
已加入
6/18/09
訊息
71
互動分數
0
點數
0
接著來

看圖說故事
Lightsmark 2008(一款採用OpenGL即時渲染GI的測試軟體)
Quadro 5000
LM08_Q50.png


FirePro V8800
LM08_V88.png

好像看出端倪了


ISLAND DX 11 Tessellation DEMO
(NVIDIA推出的Tessellation DEMO,也可當作BM來使)
Quadro 5000
DX11NI_Q50.png

FirePro V8800
DX11NI_V88.png

這邊如果NVIDIA本家的5000輸了,那就該去填海吧
開玩笑的,從各方資料我們知道Fermi的Tessellation效率是比較好的


CineBench 11.5(出名的MAXON公司Cinema 4D對應的BM軟體,最近可能會有更新)
Quadro 5000
CB115_Q50_64.png

CB115_Q50_32.png


FirePro V8800
CB115_V88_64.png

CB115_V88_32.png

這邊也得到和Lightsmark類似的結果

ShaderToyMark(如其名,以OpenGL為基礎,專測OpenGL的Pixel Shader效能來著)
Quadro 5000
GLSTM_Q501280.png

GLSTM_Q502560.png


FirePro V8800
GLSTM_V881280.png

GLSTM_V882560.png



Unigine Heaven 2.1(加入了OpenGL 4.0 Tessellation的著名引擎BM)
Quadro 5000
UHDX11_Q5012808.png

UHDX11_V8812808.png


FirePro V8800
UHGL_Q5012808.png

UHGL_V8812808.png

OpenGL的Tessellation也是NVIDIA的效率比較好


測試結果整理
SVP10508804.png


SVP10508805.png


SVP10508806.png


SVP10508807.png



從這邊的幾項以OpenGL為基礎的測試結果發現,幾乎是一面倒的局面,和SPEC viewperf的結果截然不同,只有在Tessellation的幾個項目能看到5000的光芒,令人不禁對viewperf的測試結果感到疑惑。

待續...
 

虛空

榮譽會員
已加入
9/20/05
訊息
3,028
互動分數
0
點數
0
相信樓主是專業人士才會用到這兩張卡
不過上面都是理論值測試,有沒有跑個大型的模擬能來看看兩家實際使用的能耐?
 

hoinsb

一般般會員
已加入
6/18/09
訊息
71
互動分數
0
點數
0
經過一番的OpenGL和DirectX 11交互洗禮之後
大家對於這兩張專業繪圖卡的能耐應該更加清楚了
可是BenchMark終究是BenchMark
相較於實際運行的軟體來說
BenchMark所能給予我們的就是以預設好的環境來得到相對的一個比較
接下來我們利用幾套軟體來開啟設計好的場景
來看看這兩張專業繪圖卡在實際軟體當中的效能表現

首先我們看到的是法國DASSAULT的Virtools
Virtools是一套多功能的3D場景製作軟體
可用來開發虛擬實境、教學導覽、即時動畫和3D遊戲等許多不同的應用
我們藉由增加一具螺旋槳引擎模型的數量來模擬複雜的場景
讓場景當中的多邊形面數到達近一千八百萬面再加上些許光源
藉此來觀察繪圖卡對於這樣沈重的運算能夠發揮多少實力

Quadro 5000
VTQ50.png


FirePro V8800
VTV88.png




今年推出的Showcase 2011版是一套能夠即時呈現高品質複雜光影變化的即時渲染軟體
Showcase能藉由HDR場景和組件的更換提供一個高互動性的概念提案環境
無論是材質顏色的變動或者是零件機構的更換都能夠即時的在畫面當中得到相片般畫質的呈現
這邊使用官網下載的Showcase 2011試用版
利用內建的Frame Counter來擷取運作時的效能數據
(若圖片太小,無法清楚看到數據,請複製圖片網址,去掉「s800/」後另行貼上網址即可看見原圖)

Quadro 5000
SC2011Q5025600.png

SC2011Q5019200.png

SC2011Q5012800.png


FirePro V8800
SC2011V8825600.png

SC2011V8819200.png

SC2011V8812800.png


數據整理
Q50V88SC2011.png


在Showcase的部份我們發現,無論解析度如何,V8800的表現大致相同,這可能是CPU的關係,也可能是兩家繪圖卡的運算方式不同所造成的,這個部份要另外找時間來驗證看看。不過在高解析度的狀態下5000的表現足足落後V8800有25%,這實在不像是新一代王卡(暫)該有的表現。

接下來登場的是...
Temp03.jpg
 

hoinsb

一般般會員
已加入
6/18/09
訊息
71
互動分數
0
點數
0
先整理一份兩張卡片的規格和功能特性表
SPECQ50V88.png



這份表格是根據兩張繪圖卡官方網頁的規格資料製作,同時也加入同等級的Consumer產品作為參考。我們先從Quadro 5000的規格看起,依照官方網頁的規格,核心數量352個的部份很容易讓人以為5000和GTX 465是同一顆核心,不過仔細看到記憶體介面的時候,我發現320-bit的記憶體寬度和GTX 470相同,所以5000的核心應該還是以GF100第二階的470為基礎修改而成,只是因為「不明的原因」,把核心的數量縮減到了352個。同時,核心時脈和記憶體時脈也都比470還要來得低許多(請參考括號內的470原始規格數據),所以只需要外加一組6-pin電源供應就可以應付5000的需求。在FirePro V8800的規格部份,毫無意外的V8800採用了最高階RV870的Cypress核心,只有在核心和記憶體的時脈稍微降低一點。

在專業繪圖卡的功能特性方面,就是各家展露手腳的地方啦,各家的獨門技術其實很多都是殊途同歸,各有巧妙不同罷了。

聯卡運算
當單一卡片的效能無法滿足需求時,聯卡運算的功能就是使用者的救贖,廠商的肥肉啦,兩張卡片都有各自的聯卡運算技術。NVIDIA的腳步比較快,在Quadro 4400的世代就已經推出SLI的功能,而ATI卻一直到FirePro的第一代產品推出時,才將CrossFire Pro的功能帶進來。雖然ATI的腳步比較慢,可是第一代推出CrossFire Pro的功能時,卻連低階的V3750都能支援,新一代的V8800、V7800、V5800、V4800更是全部支援CrossFire Pro聯卡運算。聯卡運算的好處在於能夠針對需求作階段性的效能提昇,可是聯卡運算在不同的軟體有不同的效果,並不是每一套軟體都能得到效能提昇,此時不如直接針對卡片升級,得到的效果還更為直接顯著。兩家公司對於聯卡運算的設計思維不同,我認為NVIDIA的想法是在效能不能被滿足時,以單卡規格升級的方式來提昇效能,等到不能再升級時才依靠SLI來提昇效能,這樣的好處在於能夠避免SLI效果的不確定性。而ATI的部份則是不管現在使用的是高階或低階,只要有效能提昇的需求,就能有不同方式的升級選擇。

3D立體顯示
近年來最熱門的3D立體顯示的支援部份,一直以來都是專業繪圖卡的選項之一,高階的專業繪圖卡帶有3-pin立體顯示接頭已經是標準配備,透過3-pin立體顯示接頭可以輸出主動式立體眼鏡的同步訊號,而且專業繪圖卡本身即支援Quad Buffer的OpenGL立體顯示方案,只要軟體能夠支援,不一定要搭配主動式的眼鏡也能夠產生立體顯示的效果。可是NVIDIA在推出3D Vision之後,也計畫針對專業繪圖的領域推出3D Vision Pro,提供立體眼鏡使用者另一個選擇。也算是以大市場的開發能量,轉移到專業特殊市場的例子之一。

繪圖API
兩張專業繪圖卡都完整的支援OpenGL 4.0,DirectX 11(這已經是基本功了,誰不會就去旁邊罰站)

GPGPU GPU通用運算
用GPU來做通用運算是前兩年興起的熱門項目,今年的熱度已經稍稍消退了些。GPGPU指的就是把一般我們常用CPU來做運算的任務,交給GPU來進行運算,因為GPU上面有大量的平行運算單元,不僅適合用來作圖形處理,對於大量資料的運算也是有相當的助益,一般比較常見的就是影片轉檔加速或是各種分散式運算計畫。於是便有人打算將運算交由GPU來處理,早期多是透過GLSL或HLSL等著色語言來將資料交付給GPU運算,可是這樣的方式不僅不方便,入門的門檻也很高。2008年時,NVIDIA和ATI都針對自己的繪圖GPU推出專屬的GPGPU開發環境,NVIDIA的叫CUDA,ATI的叫Stream。目前來看CUDA已經做出相當多的成績,Stream卻只有在一些專業的領域當中才有表現。DirectX 11推出後MicroSoft也不缺席的在其中加入了DirectCompute的GPGPU運算技術。可是目前來看應該是由Khronos Group這個組織許多尖端技術公司的團體所主導的OpenCL的遠景較為可期,因為OpenCL不僅支援GPU的運算,也支援不同種核心(如CPU、GPU)跨平台(Linux、Mac、Windows)的運算。

特殊顯示功能
面對ATI的Eyefinity功能,NVIDIA也將原本Quadro Plex獨占的SLI Mosaic下放到高階的專業繪圖卡產品線,但不同之處在於,Eyefinity能夠提供單卡多輸出(目前最多6輸出),而且能夠將所有輸出合併成一個解析度,而不是只有六個單獨顯示解析度輸出(6個各自獨立解析度也可以)。而SLI Mosaic則是將不同顯卡間的輸出合併成一個,這原本是FireMV或是NVS系列專屬的功能,但SLI Mosaic更同時提供了高解析度的3D運算效能。

特殊顯示技術
NVIDIA PhysX 物理運算能讓3D畫面的顯示更加的真實,不過目前似乎沒有專業繪圖軟體支援,若動畫製作軟體有相關功能,會相當有幫助
ATI 10-bit色深顯示 將色彩的變化細分成更多階層,呈現更多細節,目前用於PS CS4之後及醫療領域,製造及動畫產業也可因此減少色彩的誤差

特殊擴充功能
顯示同步化
NVIDIA Quadro G-Sync 單機兩張顯卡及多機系統間的畫面同步,使拼接畫面協調無撕裂
ATI FirePro S400 單機四張顯卡及多機系統間的畫面同步,使拼接畫面協調無撕裂

數位廣播擴充
NVIDIA 可擴充SDI擷取及輸出,在廣播製作流程中任意加入即時運算的3D場景特效


................................我是分隔線................................

這是傳說的小點點
聽聞只要有小點點
溫度多少一測便知
現在的室溫是27度
Temp03.jpg


專業繪圖卡實際的工作溫度測試
我們使用TessMark(FurMark毛毛馬克的好朋友凸凸馬克)來燒卡並測量GPU核心背部的溫度以及顯示輸出旁擋板的溫度
TessMark和FurMark都是以OpenGL為API開發出來的燒卡軟體
不同的是TessMark加入了OpenGL 4.0的Tessellation功能
除了能有效的提昇溫度外也能夠盡量利用到所有的運算單元
因應兩張專業繪圖卡都已經支援到OpenGL 4.0的規範所以採用這套軟體

Quadro 5000
TSQ5006.jpg


FirePro V8800
TSV8806.jpg


這些是卡片外表所量測到的溫度
那麼卡片本身偵測器所量測到的溫度呢?

Quadro 5000
TQ5002.png

TQ5001.png



FirePro V8800
TV8802.png

TV8801.png


前幾回都是綠色的比較短
這回綠色的有比較長了喔
Q50V88TEMP.png


耗電量的部份一同送上
不過這是使用GPU Caps Viewer的OpenGL3.x Illuminated Torus來將顯卡的耗電量推至極限

Quadro 5000
WattQ501.jpg


FirePro V8800
WattV881.jpg



長條圖
Q50V88WATT.png



總結
這次會以ATI FirePro V8800作為NVIDIA Quadro 5000的比較對象主要的原因,第一個就是他們本身在各家產品線當中的定位,在這兩張卡片之上都各自有一款更高規格的產品預計要發表上市,所以會以中駟對中駟作為比較的基礎,而且在相較下一階層的產品時無論是規格或定位都完全不同(拿雙槽的卡打單槽,就跟大人打小孩一樣不公平)。第二個就是他們的規格相近,在記憶體容量和立體眼鏡以及顯示同步的功能都是這兩張卡片的基本配備,只不過FirePro的第二階產品都是採取雙輔助電源設計就是了(所以其實V8800是優規產品)。

NVIDIA的新一代Quadro專業繪圖卡系列,算是初代Fermi的最後一個分支,從Fermi系列發表以來,我們就知道他並不單單只為了圖形領域而設計,更加入許多因應平行運算需求的設計在裡面,就如我先前所提,Fermi在繪圖部份的表現是令人有所疑慮的。而從這一連串的測試結果我們可以看到,Quadro 5000除了在SPECviewperf的各項測試當中和FirePro V8800有著天差地遠的表現,還有NVIDIA的Tessellation和Unigine的OpenGL項目有領先之外,其他的項目卻都是完敗。我們知道Fermi的架構在Tessellation運算單元設計比RV870來的多,所以跟Tessellation有關的項目Fermi領先是可以預期的,不過單純的繪圖運算或是以現有的APP來測試時,則是可以看出V8800有相當顯著的優勢,這個部份可以說是硬體的功能太新了,所以舊的軟體跟不上的結果嗎?不過若單單以Showcase而言,先前有消息指出,NVIDIA和AUTODESK合作對Showcase的顯像技術Opticore作最佳化(http://forums.cgsociety.org/showthread.php?t=855841),可是看來似乎成效不彰。

一般來說,專業繪圖卡首重的就是運作時的穩定性,其次才是效能和功能,任誰都不想要在工作到一半的時候出現當機或是錯誤的情形吧。從Quadro 5000的核心數量和頻率的規格來看,這次NVIDIA應該是花費了許多的心力在達成這個目標,也導致了5000的效能在和同級競爭對手(同級指的是在產品線當中的定位,而規格面也是如此)相比時的艱困局面。而在發熱以及功耗的部份就如上表所示,光就溫度而言5000的表現就真的令人倒退三步,更遑論耗電量的表現了,雖然工作站的產品對於耗電量其實不怎麼在意,兩張卡片的待機和全速的耗電量也都不高,可是再怎麼看V8800都是一張雙6-pin的產品,耗電量居然比5000還低,真不知道是有人太保守還是怎麼回事。從發熱和耗電的部份來看,ATI對於40nm製程的工藝掌握程度是毋庸置疑的,RV870的設計應該可以延續二到三個世代吧(這算好事嗎?難怪有人對HD6的命名很敏感)。

整體來看,Quadro 5000算是一個名符其實的產品,對於自家前代產品是有長足的進步,在專業繪圖產品的功能部份也是集所有功能於一身。只是在面對比較早上市的競爭對手時,無法全面壓制對方的火力,而且在影響穩定性和產品壽命的關鍵因素「溫度」上表現的也十分不理想,所以除非是對Quadro系列特殊功能有需求的用戶,否則若單以效能層面來看再加上價格考量的話,我想Quadro 5000的競爭力還有待加強。
 

fireseduce

高級會員
已加入
1/18/08
訊息
666
互動分數
0
點數
0
好好玩哦!最後的功耗測試綠條全勝,有點給他KUSO到
 
▌延伸閱讀