蘋果的GPU,言過其實
蘋果已經披露了其新 M2 處理器的大部分主要細節(jié)。該披露充滿了常見的 Apple 式夸張,包括與未能準確披露正在測試的 PC 硬件的比較。盡管如此,M1 一直是一款不錯的芯片,尤其是對于 MacBook 筆記本電腦而言,而 M2 看起來會改進設計并將其提升到一個新的水平。但是,Apple 必須遵守與所有其他芯片公司一樣的規(guī)則,不能輕易創(chuàng)造奇跡。
M1 是 2020 年第一款上市的 5nm 級處理器。兩年后,臺積電的下一代 3nm 技術還沒有完全準備好,因此蘋果不得不湊合著使用優(yōu)化的 N5P 節(jié)點,即“第二代5納米工藝?!?這意味著晶體管密度并沒有真正發(fā)生太大變化,這意味著蘋果必須使用更大的芯片來獲得更多的晶體管和性能。這從數(shù)據(jù)可以看到,M1 有 160 億個晶體管,而 M2 將增加到 200 億個。
總體而言,Apple 聲稱 CPU 性能將比其之前的 M1 芯片快 18%,而 GPU 將快 35% - 請注意,Apple 在此討論中不包括 M1 Pro、M1 Max 或 M1 Ultra。不過,我對 GPU 功能更感興趣,坦率地說,它們并沒有給人留下深刻的印象。
是的,M2 的圖形速度很快對于集成解決方案,但這究竟意味著什么,它與最好的顯卡相比如何?如果手頭沒有用于測試的硬件,我們無法確切說明它將如何執(zhí)行,但我們確實可以進行一些合理的比較。
讓我們從原始性能數(shù)據(jù)開始。并非所有的 teraflops 都是平等的,因為架構設計決策肯定會發(fā)揮作用,但我們仍然可以通過查看我們所知道的來獲得一些合理的估計。
例如,Nvidia 在其RTX 3050 GPU上具有 9.0 teraflops 的理論單精度性能,而AMD 的 RX 6600具有 8.9 teraflops 的理論性能。在紙面上,這兩個 GPU 看起來相對相等,它們甚至具有相似的內存帶寬——兩張卡都是 224 GB/s,這得益于具有 14Gbps GDDR6 的 128 位內存接口。然而,在我們的GPU 基準測試層次結構中,RX 6600 在 1080p 時快 30%,在 1440p 時快 22%。(請注意,在我們的光線追蹤測試套件中,RTX 3050 大約快 15%。)
在架構上,Apple 的 GPU 在基于 teraflops 的實際性能方面看起來與 AMD 相似。例如,M1 的額定理論值為 2.6 teraflops,帶寬為 68 GB/s。這大約是 AMD RX 5500 XT 的一半 teraflops 和三分之一的帶寬,在圖形基準測試中,M1 通常運行速度大約是其一半。我們預計 M2 GPU 不會有任何大規(guī)模的架構更新,因此它應該與 AMD 的 RDNA 2 GPU 相對相似。
AMD 和 Apple 都沒有 Nvidia 的雙 FP32 管道(其中一個也處理 INT32 計算),并且 AMD 擁有 Infinity Cache,至少在實踐中應該類似于 Apple “更大的 L2 緩存”的說法。
M2 GPU 的額定速度僅為 3.6 teraflops。這還不到 RX 6600 和 RTX 3050 的一半,也低于 AMD 備受詬病的RX 6500 XT(5.8 teraflops 和 144 GB/s 帶寬)。這不是游戲的世界末日,但我們不希望 M2 GPU 能夠以最大設置和 60 fps 的速度通過 1080p。
誠然,Apple 正在做集成顯卡,就集成解決方案而言,3.6 teraflops 相當不錯。最接近的比較是 AMD 的 Ryzen 7 6800U 與 RDNA 2 顯卡。該處理器有 12 個計算單元 (CU),時鐘頻率高達 2.2 GHz,達到 3.4 teraflops。它還在雙通道 128 位總線上使用共享 DDR5 內存,因此像華碩 Zenbook S 13 OLED中的 LPDDR5-6400將提供 102.4 GB/s 的帶寬。
這基本上就是我們對 Apple 的 M2 GPU 所期望的性能水平,再次,給予或接受。它比英特爾現(xiàn)有的集成顯卡解決方案快得多,并且完全擊敗了上一代基于英特爾的 MacBook 中使用的第 8 代英特爾酷睿 GPU。但這不會是一個很棒的游戲解決方案。我們的目標更多是足夠的。
另一個值得注意的有趣事項是,Apple 沒有提及 AV1 編碼/解碼支持。AVI 得到了一些大公司的支持,包括亞馬遜、谷歌、英特爾、微軟和 Netflix。到目前為止,英特爾是唯一一家支持 AV1 編碼的 PC 圖形公司,而 AMD 和 Nvidia 在其最新的 RDNA 2(Navi 24 除外)和 Ampere GPU 上支持 AV1 解碼。
蘋果還詳細介紹了其即將推出的MetalFX 升級算法,這是非常有意義的。Apple 在其所有產品上都使用高分辨率 Retina 顯示屏,如果沒有任何幫助,3.6 teraflops GPU 和 100 GB/s 帶寬將無法處理原生 2560 x 1664 游戲。假設 Apple 獲得與 FSR 2.0 或 DLSS 2.x 類似的縮放比例,M2 GPU 可以使用“質量”模式并渲染 1706 x 1109,放大到原生 2560 x 1664,大多數(shù)人不會真正注意到差異。這小于 1920 x 1080,當然 M2 應該能夠處理得足夠好。
我們也不要忘記,這只是迄今為止宣布的基本型號 M2。就像之前的 M1 變體一樣,它被用于 MacBook Air 和 MacBook Pro 13,但蘋果很有可能也會制造出功能更強大的 M2 解決方案。與基本 M1 的 8 個內核相比,M1 Pro 擁有多達 16 個 GPU 內核。將 GPU 核心數(shù)量和帶寬加倍應該會將性能提升到 7.2 teraflops 范圍——理論上大致相當于 RX 6600 或 RTX 3050。對于具有 40 個 GPU 內核和 14.4 teraflops 的 M2 Max 而言,再將其翻倍將使 Apple 處于與RX 6750 XT甚至 RX 6800 相同的領域。
對于在 65W 功率范圍內運行的集成顯卡解決方案,這將是非常令人印象深刻的。但是,在得出任何最終結論之前,我們仍然需要查看芯片的實際運行情況,并且可以肯定的是,專用圖形解決方案將繼續(xù)提供更高的性能。
Apple 的芯片繼續(xù)向 CPU 和 GPU 領域的老牌廠商進軍,但請記住,首先瞄準效率通常意味著較低的性能。專用的 AMD 和 Nvidia GPU 在臺式機上可能使用 300W 或更多功率,但相同的芯片可以用于筆記本電腦并僅使用 100W,同時仍可提供臺式機等效產品的 70-80% 的性能。
如果沒有硬件和真實世界的測試,我們無法確切知道 Apple 的 M2 GPU 的速度會有多快。然而,即使是蘋果也只聲稱比 M1 GPU 性能高出 35%,這意味著 M2 將比 M1 Pro 慢很多,更不用說 M1 Max 或 M1 Ultra。這很好,因為它進入的筆記本電腦更多的是關于全天電池壽命而不是玩最新游戲。
性能合理的集成 GPU 與 MetalFX Upscaling 相結合也很有希望,追逐 Apple 市場的游戲開發(fā)者肯定會考慮使用 upscaling。這應該至少在本機顯示分辨率(升級后)下提供可播放的性能,這是一個很好的起點。我們也有興趣了解被動冷卻的 MacBook Air 如何在持續(xù)的游戲工作負載下保持穩(wěn)定。
聲明:本文版權歸原作者所有,轉發(fā)僅為更大范圍傳播,若有異議請聯(lián)系我們修改或刪除:zhangkai@cgbtek.com