您現在的位置是:首頁 > 單機遊戲首頁單機遊戲

老黃擠爆牙膏!Ada Lovelace顯示卡效能值得期待

簡介在具體的視訊記憶體上,採用AD102核心的GeForce RTX 4090使用與上一代相同的384-bit位寬和21Gbps的GDDR6x視訊記憶體,視訊記憶體頻寬與RTX 3090 Ti相同的1008GBs,但至少沒有開“倒車”

不帶供電的顯示卡好嗎

在時隔兩年之後,NVIDIA終於推出Ada Lovelace架構顯示卡,首款產品GeForce RTX 4090將於10月12日正式上市;RTX 4080 16GB/12GB也將於11月上市。與Ampere使用三興8nm工藝相比,Ada Lovelace架構的製造工藝終於不再“拖後腿”,臺積電N4(第一代4nm)帶來巨大的能效提升,同時也讓顯示卡頻率更高。

老黃擠爆牙膏!Ada Lovelace顯示卡效能值得期待

憑藉更多的CUDA和更高的頻率,GeForce RTX 4090(82。6TFlops)理論傳統效能(FP32)是RTX 3090 Ti(約40 TFlops)的兩倍。就算16GB版RTX 4080(48。7 TFlops)還是比RTX 3090 Ti高23。5%左右,對比RTX 3080 Ti(34 TFlops)高40%。

有趣的是,12GB版RTX 4080(40 TFlops)的理論傳統效能與RTX 3090 Ti相同,意味著Ada Lovelace首發的三款產品,理論效能至少達到上一代旗艦產品的水平,旗艦產品的對比甚至實現翻番。雖然FP32無法直接提現到遊戲、專業加速軟體中,但NVIDIA至少實現了在釋出會上效能翻番的目標。

老黃擠爆牙膏!Ada Lovelace顯示卡效能值得期待

在Ada Lovelace的快取系統存在極大的差異。老黃在釋出會上隻字未提3D封裝的快取,意味著這一代GPU以然是傳統設計方案。不過沒有3D快取系統並非不可理解,隔壁AMD在銳龍7 5800X3D(105W熱設計功耗)上的選擇就可以看到,3D封裝必然要犧牲一定的散熱效能。考慮到首款三款顯示卡(285W-450W)都是發熱大戶,使用3D封裝帶來的效能提升,或許不遠不如提升散熱效能重要。

在視訊記憶體上,三款顯示卡更是體現出巨大的差異,這些差異未來將會體現到全系列的產品線上。不同核心將會直接決定GPU的視訊記憶體位寬,AD102最高384-bit位寬,未來不排除RTX 3080 Ti/Super會使用AD102核心,同時將視訊記憶體位寬削減至320-bit;AD103核心最高視訊記憶體位寬定在256-bit,除了某些缺陷特別嚴重的核心需要遮蔽更多單元外;至於AD104核心,它的最高視訊記憶體位寬為192-bit,對應RTX 4070系列顯示卡(12GB版RTX 4080大機率是原RTX 4070)。

老黃擠爆牙膏!Ada Lovelace顯示卡效能值得期待

在具體的視訊記憶體上,採用AD102核心的GeForce RTX 4090使用與上一代相同的384-bit位寬和21Gbps的GDDR6x視訊記憶體,視訊記憶體頻寬與RTX 3090 Ti相同的1008GB/s,但至少沒有開“倒車”。至於為何沒有使用RTX 4080 16GB的23Gbps視訊記憶體,筆者猜測有兩種可能,第一是視訊記憶體產能較低,無法滿足NVIDIA的需求;第二就是考慮到顯示卡的供電和散熱需求,無法搭載發熱更高的23Gbps視訊記憶體。

與AD102核心不同,使用AD103核心的GeForce RTX 4080 16GB在視訊記憶體頻寬上就開了“倒車”,主要原因還是視訊記憶體位寬從上一代RTX 3080的320-bit看到256-bit,雖然視訊記憶體頻率從19Gbps提升到23Gbps,但頻寬依然從760GB/s降低至736GB/s。只是,未來不排除NVIDIA會推出256-bit位寬的RTX 4070 Ti/Super。

最後是使用AD104核心的RTX 4080 12GB,在192-bit位寬和21Gbps視訊記憶體下,其視訊記憶體頻寬僅有504GB/s,比RTX 3070高12。5%,大幅落後RTX 3070 Ti的604GB/s。如果說RTX 4080 16GB保住80級別定位的話,那RTX 4080 12GB就是拿來湊數的,更準確的命名應該是RTX 4070。

老黃擠爆牙膏!Ada Lovelace顯示卡效能值得期待

老黃擠爆牙膏!Ada Lovelace顯示卡效能值得期待

使用者最關心的效能方面,NVIDIA官方提供部分遊戲的效能預覽。從給出的資料來看,RTX 4090相對於RTX 3090 Ti,微軟的飛行模擬提升將近一倍;賽博朋克更是超過4倍。至於為何提升幅度如此之大,應該是NVIDIA精選遊戲有關。兩款RTX 4080對比的是RTX 3080 Ti,提升幅度在1。5倍到3倍之間。

事實上,NVIDIA在Ada Lovelace上堆料,Tensor Core從上一代的320個提升至1400個,並加入從Hopper上下放的各種Transformer Engine引擎,能夠帶來更好的加速訓練效果。最重要的DLSS 3,基於光流的補幀設計可以帶來更高的理論幀率。

在功耗不變的情況下,NVIDIA採用比8nm先進兩代的4nm工藝,能耗比的提升應該會遠超想象。最直觀的對比,就是從Maxwell(GTX 980 Ti)到Pascal(GTX 1080 Ti),兩者的熱設計功耗都是250W,但實際遊戲效能提升超過60%,這就是Ada Lovelace的遊戲表現值得期待的原因。

老黃擠爆牙膏!Ada Lovelace顯示卡效能值得期待

寫在最後:從目前公開的資料來看,NVIDIA Ada Lovelace的效能提升是非常值得期待。NVIDIA精選了部分對自家顯示卡最佳化更到位的遊戲來展示效能提升,雖然實際遊戲提升不如宣傳,是同樣值得期待。

另外,NVIDIA兩款RTX 4080顯示卡更像為清空RTX 30系列顯示卡做出來的產品,兩款顯示卡明顯有“智商稅”的嫌疑。筆者認為NVIDIA不會大量出貨這兩款RTX 4080,在完成30系顯示卡清倉後更新產品線,帶來更具價效比的產品,以滿足使用者的使用需求。

Top