序言
在剛過去的 CES 2025,NVIDIA 正式發表針對主流遊戲玩家的 GeForce RTX 50 系列顯示卡,當中憑著全新 Blackwell 核心,配搭各種 AI 及技術,讓當中整體的效能得到大幅提升,無論是遊戲以至 AI 運算應用都有更好的體驗。針對整個 GeForce RTX 50 系列,GeForce RTX 5090 D 將會是首款正式解禁的型號,今次就為大家從架構、技術、效能及功耗等,分析全新一代 RTX 50 顯示卡。
Blackwell 核心架構
今次,NVIDIA GeForce RTX 50 顯示卡採用全新 Blackwell 架構,採用 TSMC 4nm 製程,當中包含多達 920 億個晶體,並提供高達 4000 AI TOPS 的運算性能。這一代的 SM(流式多處理器)單元達到了 125 TFLOPS 的 FP32 性能,並引入了第五代 Tensor 核心,為人工智能和圖形運算提供更高的算力。此外,第四代光線追蹤核心(RT Cores)帶來了 Mega Geometry 處理能力,令光線追蹤的效率提升了多達 8 倍,並顯著降低了記憶體使用需求。
採用全新 GDDR7 記憶體
配搭 GeForce RTX 50 顯示卡,採用最新 GDDR7 記憶體,當中能夠提供高達 1.8TB/s 的頻寬,為目前使用的 GDDR6 兩倍,並且功耗更低。GDDR7 記憶體還支援最新的 PAM4 訊號技術,進一步提升數據傳輸效率。
DLSS 4 + 全新 Frame Generation
對於有了解 NVIDIA 顯示卡技術的用家,應該都不會對 DLSS 感到陌生,當中主要透過運算技術以提升整體的遊戲體驗。隨著 RTX 50 顯示卡的推出,NVIDIA 亦為各用家帶來全新 DLSS 4,採用全新的 Transformer 引擎,能夠同時在多個數據集上訓練,並具備兩倍的參數量和四倍的運算能力。加上全新加入的多幀生成模式(Multi Frame Generation)能夠每幀運行五個模型,大幅提升了圖像品質,並減少了變異性。
全新 DLSS 4 當中採用的 Transformer 模型,不單止應用在全新 RTX 50 系列顯示卡之上,更可同時支援 RTX 20/30/40 系列的顯示卡。在全新 Transformer 模型下,使用了比 CNN 模型多兩倍的參數,能夠更精準地分析和重構畫面的技術,評估每個畫面中的所有像素,並根據其重要性進行處理,甚至在多幀畫面之間進行交叉分析,進而生成更加細緻的影像,並可解決以往 CNN 模型下的動態模糊和鬼影問題。
為滿足玩家對遊戲的流暢度要求越來越高,在 RTX 40 系列就能透過 Frame Generation 技術以提升幀數。以往雖然透過 DLSS 已經能夠大幅提升遊戲性能,但若果要同時開啟如 Ray Tracing 等畫質特效,整體遊戲性能還是有相當明顯的下降。在 RTX 40 系列上,NVIDIA 就加入 Frame Generation 技術,透過預先計算畫面中下一個幀的畫面來提升整體表現。RTX 50 系列則加入了全新專屬 Multi Frame Generation(MFG)技術,進一步通過生成多三幀畫面來提升性能,使遊戲的畫面更新率大幅提高,更適合於高幀率的遊戲環境,以實現 200FPS+ 以上的遊戲體驗。DLSS 4 在推出的第一天便支援多達 75 款遊戲和應用程式,配合 Reflex 2 技術令整體系統反應提升 75%,對於電子競技玩家來說,將可帶來全新的遊戲體驗。
全新渲染及幾何細節技術
另外,隨著新一代核心的推出,NVIDIA 同時加入更多全新渲染及針對幾何圖形的技術,能夠大大提升當中的效能及提升整體的畫面質素。Neural Rendering 是今次當中的其中一個重點,涵蓋了多項創新功能,包括 Neural Textures、Neural Volumes 和 Neural Radiance Cache 等。這些技術在於利用 AI 模型壓縮和優化材質與光線數據,從而減少內存使用量並提升渲染效率。例如,Neural Materials 技術可以將遊戲中的材質和紋理內存需求降低多達三分之一,對於記憶體容量有限的顯示卡來說是一大福音。
另外,Mega Geometry 則可應對當前遊戲中幾何細節需求,以往遊戲場境內可能出現的數千萬個多邊形,在全新 Mega Geometry 下則可以提升至上億的規模。尤其是在支援 Unreal Engine 5 的遊戲中,NVIDIA 的新技術能與 Nanite 技術結合,進一步提升細節表現。憑著 Blackwell 核心內的第四代 RT Core,其處理光線-三角形交叉測試時的吞吐量翻倍,並新增支援 Mega Geometry 技術的硬體單元。Mega Geometry 通過引入 CLAS 和 PTLAS,大幅提高了幾何細節和效能,為遊戲引擎如 Unreal Engine 5 提供了更高的幾何真實度。
iGameGeForce RTX 5090 D Advanced 32GB
今次用作測試的是 iGameGeForce RTX 5090 D Advanced 32GB,當中的基本核心架構與 GeForce RTX 5090 相同,只是限制了當中針對 AI 的運算效能以配合中國及香港市場。核心方面採用 GB202-250-A1,Blackwell 核心擁有 11 個 GPCs、85 個 TPCs 和 170 個 SMs,每個 SM 內包含 128 個 CUDA,因此 GeForce RTX 5090 / 5090 D 內就擁有 21760 個 CUDA。另外,針對 AI 運算及 Ray Tracing 運算的 Tensor Core 及 RT Core 都作出升級,分別擁有 680 個 Tensor Cores(5th Gen)和 170 個 RT Cores(4th Gen),其中 RT Cores 能夠提供高達 317.5 RT TFLOPS 運算能力,較上代 GeForce RTX 4090 的 191 RT TFLOPS 提升 65%。記憶體方面,GeForce RTX 5090 D 配搭 512-bit 32GB GDDR7,記憶體時脈為 28Gbps,並提供高達 1792GB/s 記憶體頻寬。至於用家另一個最關心的功耗問題,全新 GeForce RTX 5090 D 的 TGP 同樣是 575W,透過 16-pin 供電,同時 PCIe 亦升級至 PCIe 5.0 標準。
三風扇配 Vortex 散熱器
iGameGeForce RTX 5090 D Advanced 32GB 與現時主流的高階顯示卡,為了要有效解決散熱問題,因此都採用了三風扇散熱器,左右兩側的風扇為 107mm,中間的風扇則是 101mm,配搭風鐮扇葉,以提升整體風流量及增加風壓。同時,可以留意到顯示卡背板加上一個圓形通風設計,能夠讓核心的熱力更直接排走,以減少熱力囤積的問題。散熱器方面則採用了 Vortex 散熱器,與核心接觸部份為真空凍片技術,能加快把核心的熱力帶走,配搭散熱器上多達 9 組導熱管,能夠更快速平均把熱力帶走。顯示卡更加入一個一鍵切換 BIOS 按鈕,讓玩家能夠根據需要快速切換 Normal 或 Turbo BIOS。
實際效能測試
率先推出為 GeForce RTX 5090 D,測試上會以 GeForce RTX 4090 作比較。測試項目上,針對遊戲玩家會以 3DMark 與及 4 款遊戲作效能測試,並同時測試 DLSS 3 和 DLSS 4 之間的差異;另外,同時加入 V-Ray Benchmark、Geekbench、 Procyon UL 及 PugetBench for DaVinci Resolve 針對圖像處理的測試。
測試平台
3DMark
3DMark(DLSS)
Cyberpunk 2077
Dragon Age The Veilguard
Alan Wake 2
F1 22
短評:整體效能上,GeForce RTX 5090 D 較上代旗艦 GeForce RTX 4090 提升不少,就算在沒有 DLSS 4 的幫助之下,在遊戲表現上都有超過 50% 的增長,部份遊戲更有 100% 的提升。至於 DLSS 部份的效能增長更為明顯,普遍遊戲都能有 80% 以上的提升,若果遊戲支援 DLSS 4 x4 的話,遊戲效能更可以提升數倍以上。
Geekbench 6
V-Ray Benchmark
Procyon UL
PugetBench for DaVinci Resolve
短評:針對圖像處理及渲染部份的測試,同樣可以看到 GeForce RTX 5090 D 較 GeForce RTX 4090 提升不少。針對 Ray Tracing 運算的 V-Ray Benchmark 下,GeForce RTX 5090 D 的效能可提升 30%。用作測試 AI 圖像處理的 Procyon UL 測試,由於 GeForce RTX 5090 D 能夠對 FP4 有更好的支援,FP4 利用 GeForce RTX 4090 需時 17 秒,而使用 GeForce RTX 5090 D 則只需 4 秒即完成。至於針對影片處理的 PugetBench for DaVinci Resolve,同樣看到 GeForce RTX 5090 D 的整體效能較 GeForce RTX 4090 高出數倍。
溫度及功耗測試
NVIDIA GeForce RTX 5090 D 的 TGP 較 GeForce RTX 4090 高,這部份就會比較兩款顯示卡的整體功耗及溫度測試作參考,當中的溫度測試則只針對今次測試用的 GeForce RTX 5090 D,始終各大廠商的散熱器設計都會有所不同。從結果上可以看到,GeForce RTX 5090 D 在測試過程中的 TGP 會超過 600W,至於核心最高溫度方面則有不錯的控制,以測試用的 iGameGeForce RTX 5090 D Advanced 32GB 能把核心溫度控制在 70 度以下。
總結
今次推出的 GeForce RTX 5090 D 在全新 Blackwell 架構下,無論是運算以至遊戲表現上,都較上代的 GeForce RTX 4090 有不少提升,雖然 GeForce RTX 5090 D 在針對 AI 運算效能上可能會有少許損失,但在遊戲表現上則與 GeForce RTX 5090 沒有差異。不過用家要注意是 GeForce RTX 5090 D 的 TGP 高達 600W,因此火牛選擇上 1000W 以上的型號會較為適合。