NVIDIA GeForce 800
NVIDIA GeForce 800系列,是輝達研發的圖形處理器產品系列,用於筆記型電腦平台。此代顯示核心將採用新的Maxwell微架構(晶片代號將以『GM』開頭),以蘇格蘭理論物理學家詹姆士·克拉克·麥克斯韋的名字命名。2014年初悄然發表的行動型顯示核心GeForce 820M,儘管列入GeForce 800系列,但仍採用GeForce 500系列『Fermi』架構的GF117顯示核心,因此僅僅是舊型號顯示核心更名而已。[1][2]首款基於Maxwell微架構的顯示核心實際為GeForce 700系列上的GeForce GTX 750以及750 Ti。[3][4][5]後來,NVIDIA也陸續發布行動平台的GeForce 800M系列的其他型號,除GeForce 830M、840M、GTX 850M以及GTX 860M的部分批次以外,其餘的均使用舊有顯示核心。NVIDIA宣佈新一代Maxwell核心的首發兩款產品將被命名為NVIDIA GeForce 900系列,分別為GTX 970和GTX 980。[6][7]而預計GeForce 800系列將使用在OEM市場,就像之前的GeForce 100和GeForce 300系列。
发布日期 | 2014年 |
---|---|
代号 | Fermi (28nm) GF117 Kepler(28nm) GK104 Maxwell (28nm/20nm) GM107 GM108 |
显示卡 | |
入门GPU | 行動平台:820M、830M、840M |
中端GPU | 行動平台:GTX 850M、GTX 860M |
高端GPU | 行動平台:GTX 870M、GTX 880M |
API支持 | |
Direct3D | Direct3D 12 Shader Model 5.0 |
OpenGL | OpenGL 4.4 |
OpenCL | OpenCL 1.2 |
历史 | |
前代产品 | GeForce 700系列 |
后继产品 | GeForce 900系列 |
概觀
用於GeForce 800系列上的『Maxwell』顯示核心架構,是用於GeForce 600以及700系列『Kepler』顯示核心架構的下一代,將首次在顯示核心上內建ARM架構的CPU核心。[8][9]NVIDIA的CEO黃仁勳稱,這樣做使得GPU更加獨立於主CPU[10]。NVIDIA稱『Maxwell』顯示核心架構對比『Kepler』架構,會有更高的圖形處理效能、更簡化的可程式性以及更好的能效比。[11]
2010年9月NVIDIA宣布下一代顯示核心架構『Maxwell』。[12]首款基於『Maxwell』架構的消費級顯示核心的產品將於2014年早期發賣。[13]稍後將有基於『Maxwell』顯示核心的NVIDIA Tesla運算卡以及NVIDIA Quadro專業圖形卡。最後會有供手持式裝置使用的基於該架構的NVIDIA Tegra系統單晶片出現。[11]
架構特性
初期,Maxwell架構顯示核心,仍採用台積電的28nm製程,核心規模也較為有限。首代Maxwell顯示核心有GM107和GM108,均面向消費級市場,相比Kepler而言僅是多了一些Kepler架構所沒有的附加功能特性,性能、功耗及能效比上與Kepler相去不遠。這些新增的特性主要有:
- NVENC效能的加強。NVENC是NVIDIA開發的視訊解碼器,在初代Maxwell顯示核心上的效能為1.5倍到2倍於Kepler顯示核心,在6到8倍的回放速率使仍能實時解碼。[14]
- PureVideo效能加強。NVIDIA提升了Maxwell的視訊解碼快取和記憶體存取效率,稱在Pure Video E功能集視訊解碼時,比以往的有8到10倍效能提升。然而,H.265硬體解碼的支援度仍然不完整,需要軟體以及硬體共同執行。[14]
- 新增一個電源模式『GC5』。當顯示核心進行視訊解碼作業時,會進入一個新的『GC5』電源模式,只保留視訊解碼所需的電路單元的電力供應,節省電力。[14]
顯示記憶體
GM107的L2快取,由GK107的256KB,大幅增加到2MB,大大降低對顯示記憶體的頻寬需求。相應地,NVIDIA僅為GM107的使用128位元的記憶體控制器位寬,而GM107的效能與kepler的192位元記憶體位寬的GK106不相上下,除此以外,減少了記憶體位寬,還會節省電能。[14]
SMM
Kepler時代,CUDA核心/流處理器陣列被NVIDIA稱作SMX,而Maxwell的設計,則改稱SMM。SMM陣列中,各陣列是分離獨立的,因此陣列中的4個排程引擎控制各自所屬的FP32 CUDA核心、載入/存儲單元以及特殊功能單元,不像Kepler那樣一個排程引擎需要共用資源。不過,紋理單元以及FP64 CUDA核心則仍然是共用的。[14]SMM提供比SMX更細粒度的資源分配,當負載並非為共用資源最佳化時節省電力。NVIDIA稱128個CUDA核心的SMM可以達到192個CUDA核心的SMX的90%的效能。[14]
通用運算
相比GK110/GK208支援CUDA 3.5,GM107可以支援CUDA 5.0通用運算庫。在GK110/GK208上現身的動態並行以及HyperQ,基於Maxwell架構的顯示核心會全面支援。Maxwell架構為32位元整數的原子操作提供原生共用記憶體,支援32位元和64位元的數據比較和交換(compare-and-swap,CAS),可實現其它形式的原子操作功能。
API
Maxwell架構全面支援DirectX 12。[15]
繼任架構
接替『Maxwell』顯示核心架構的,是NVIDIA於2013年3月宣布的代號『Volta』的顯示核心架構。[16]2014年,這個構想的架構被定名為『Pascal』[17][18] 『Pascal』將實現片上堆疊式動態隨機存取記憶體(DRAM),或稱『片上顯示記憶體』,統一記憶體架構以及NVLink。[19][20]
產品介紹
桌上型平台
首款基於Maxwell架構的顯示核心是GM107,但它卻被劃入GeForce 700系列,是為GeForce GTX 750和GTX 750 Ti,均使用28奈米製程,[14]它們均於2014年2月18日發布。GeForce GTX 750和GTX 750 Ti的TDP分別僅為55瓦和60瓦,這樣使得它們都能直接從PCIe插槽中獲取足夠的電能而無需輔助供電連接埠。[14]第二款基於Maxwell架構的顯示核心GM204被劃入GeForce 900系列,是為GeForce GTX 970和GTX 980,它們均於2014年9月19日發布。
行動平台
GeForce 800M的首發產品是GeForce 820M[21] - 使用『Fermi』顯示核心架構的GF117顯示核心,僅支援PCI-E 2.0,但支援DirectX 11.2、OpenGL 4.4、OpenCL 1.1、FXAA以及Optimus雙顯示核心切換,搭載DDR3顯示記憶體。其後發布的GeForce 830M、840M使用規格較低,但基於Maxwell架構的GM108顯示核心。GeForce GTX 850M以及GTX 860M後來推出的批次,採用GM107顯示核心。GeForce GTX 860M早期版本、870M以及880M均使用GK104核心,但各型號的核心配置不一。
晶片規格
GeForce 800系列本代僅供筆記型電腦使用,而同架構的桌上型電腦用圖形處理器產品,則為GeForce 900系列以及GeForce GTX 750/750Ti。
- 1 統一渲染器/流處理器數量 : 紋理映射單元數量 : 渲染輸出單元數量
- 2 畫素填充率的估算:ROP的數量乘以基準核心時脈速率(時脈單位Hz),單位畫素數每秒(P/s)
- 3 紋理填充率的估算:TMU的數量乘以基準核心時脈速率(時脈單位Hz),單位紋理數每秒(T/s)
- 4 全系列可支援Direct3D 12,但功能層級會是更低的Feture Level 11_0
- 5 單精度浮點數處理效能的估算,由著色器時脈乘以CUDA核心/流處理器數量和每時鐘週期CUDA核心/流處理器指令數;雙精度浮點數處理效能的估算:核心代號「GMxxx」的為單精度浮點數的1/32,核心代號「GKxxx」的為單精度浮點數的1/24
- 6 時脈資料與實際使用的可能有差別,核心代號「GFxxx」的核心時脈分為兩部分:CUDA核心時脈/著色器時脈
型號 | 推出年分 | 晶片代號 | 製程 (奈米) |
電晶體數 (百萬個) |
晶粒面積 (平方毫米) |
匯流排介面 | 核心配置 SPs:TMUs:ROPs1 |
時脈配置 | 填充率 | 顯示記憶體配置 | API支援(版本)4 | 運算效能 (GFLOPS) |
熱設計功耗 (W) | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
預設 (MHz)6 |
加速 (MHz) |
記憶體 (MT/s) |
像素 (GP/s)2 |
材質 (GT/s)3 |
容量 (MiB) |
匯流排類型 | 匯流排寬度 (位元) |
頻寬 (GB/s) |
DirectX | OpenGL | OpenCL | Vulkan | 單精度浮點數5 | 雙精度浮點數5 | |||||||||
GeForce 800M[22][23] | 2014年3月17日 | GF117 | 28 | 585 | 116 | PCIe 2.0 x8 | 48:8:8 (1 SM) |
738/1476 | N/A | 1800 | 1.476 | 5.9 | 2048 | DDR3 | 64 | 14.4 | 11.0 | 4.5 | 1.1 | 未知 | 141.7 | 未知 | 15 |
GeForce 810M (GF117)[24] | 2014年3月24日 | GF117 | 28 | 585 | 116 | PCIe 2.0 x16 | 48:8:8 (1 SM) |
738/1476 | N/A | 1800 | 1.576 | 5.9 | 1024 2048 |
DDR3 | 64 | 16 | 11.0 | 4.4 | 1.1 | 未知 | 141.7 | 未知 | 15 |
GeForce 810M (GK107)[25] | 2015年3月21日 | GK107 | 28 | 1270 | 118 | PCIe 3.0 x16 | 384:32:16 (2 SMX) |
810 | 未知 | 1800 | 6.48 | 25.92 | 1024 2048 |
DDR3 | 128 | 28 | 11.2 | 4.5 | 1.2 | 未知 | 622.1 | 未知 | 45 |
GeForce 820M (GF117)[26][27] | 2013年11月27日 | GF117 | 28 | 585 | 116 | PCIe 2.0 x16 | 96:16:4 (2 SM) |
625/1250~775/1550 | N/A | 1800 | 2.5~3.1 | 10~12.4 | 1024 2048 |
DDR3 | 64 | 14.4 | 11.0 | 4.4 | 1.1 | 未知 | 240~297.6 | 未知 | 15 |
GeForce 820M (GK107)[28] | 2015年3月21日 | GK107 | 28 | 1270 | 118 | PCIe 3.0 x16 | 384:32:16 (2 SMX) |
810 | 未知 | 1800 | 6.48 | 25.92 | 1024 2048 |
DDR3 | 128 | 28 | 11.2 | 4.5 | 1.2 | 未知 | 622.1 | 未知 | 45 |
GeForce 825M[29] | 2014年3月12日 | GK208 | 28 | 未知 | 87 | PCIe 3.0 x16 | 384:32:16 (2 SMX) |
850 | 未知 | 1800 | 6.8 | 27.20 | 1024 2048 |
DDR3 | 64 | 14.4 | 12.0 | 4.5 | 1.2 | 1.0 | 652.8 | 未知 | 33 |
GeForce 830M[30] | 2014年3月12日 | GM108 | 28 | 未知 | 未知 | PCIe 3.0/2.0 x16 | 256:16:8 (2 SMM) |
1082 | 1150 | 1800 | 8.66 | 17.31 | 2048 | DDR3 | 64 | 14.4 | 12.0 | 4.5 | 1.2 | 1.0 | 554 | 未知 | 33 |
GeForce 840M [31] | 2014年3月12日 | GM108 | 28 | 未知 | 未知 | PCIe 3.0/2.0 x16 | 384:24:8 (3 SMM) |
1029 | 1124 | 2000 | 8.2 | 24.7 | 1024 2048 |
DDR3 | 64 | 16.02 | 12.0 | 4.5 | 1.2 | 1.0 | 790.3 | 未知 | 33 |
GeForce 845M (GM107)[32] | 2015年2月7日 | GM107 | 28 | 1870 | 148 | PCIe 3.0 x16 | 512:32:16 (4 SMM) |
863 | 未知 | 2000 | 13.81 | 27.62 | 1024 2048 |
DDR3 | 64 | 16 | 12.0 | 4.5 | 1.2 | 1.0 | 883.7 | 未知 | 45 |
GeForce 845M (GM108)[33] | 2015年8月26日 | GM108 | 28 | 未知 | 未知 | PCIe 3.0 x16 | 384:24:8 (3 SMM) |
1071 | 1176 | 5000 | 17.14 | 34.3 | 1024 2048 |
GDDR5 | 64 | 40 | 12.0 | 4.5 | 1.2 | 1.0 | 822.5 | 未知 | 33 |
GeForce GTX 850M[34] | 2014年3月14日 | GM107 | 28 | 1870 | 148 | PCIe 3.0 x16 | 640:40:16 (5 SMM) |
936 | 未知 | 5000 | 14.4 | 36.1 | 2048 | GDDR5 DDR3 |
128 | 80 32 |
12.0 | 4.5 | 1.2 | 1.0 | 1198.1 | 未知 | 45 |
GeForce GTX 860M (GK104)[35][36] | 2014年3月10日 | GK104 | 28 | 3540 | 294 | PCIe 3.0 x16 | 1152:96:16 (6 SMX) |
797 | 915 | 5000 | 19.13 | 76.5 | 2048 | GDDR5 | 128 | 80 | 12.0 | 4.5 | 1.2 | 1.0 | 1836.3 | 未知 | 75 |
GeForce GTX 860M (GM107)[35][37] | 2015年2月5日 | GM107 | 28 | 1870 | 148 | PCIe 3.0 x16 | 640:40:16 (5 SMM) |
1020 | 1085 | 5000 | 16.32 | 41.2 | 2048 | GDDR5 | 128 | 80 | 12.0 | 4.5 | 1.2 | 1.0 | 1317.1 | 未知 | 75 |
GeForce GTX 870M[38] | 2014年3月12日 | GK104 | 28 | 3540 | 294 | PCIe 3.0 x16 | 1344:112:32 (7 SMX) |
941 | 967 | 5000 | 30.1 | 105.4 | 3072 | GDDR5 | 192 | 120 | 12.0 | 4.5 | 1.2 | 1.0 | 2529.4 | 未知 | 100 |
GeForce GTX 880M[39] | 2014年3月12日 | GK104 | 28 | 3540 | 294 | PCIe 3.0 x16 | 1536:128:32 (8 SMX) |
954 | 993 | 5000 | 30.53 | 122.1 | 4096 8192 |
GDDR5 | 256 | 160 | 12.0 | 4.5 | 1.2 | 1.0 | 2930.7 | 未知 | 122 |
參考資料
- . mydrivers.com. [2014-02-10]. (原始内容存档于2014-02-20).
- . pconline.com.cn. [2014-02-10]. (原始内容存档于2014-02-21).
- Details on Nvidia's GeForce GTX 750 Ti, GTX 750 cards leak 页面存档备份,存于 - techspot.com
- GTX750Ti、GTX750长这样:规格也定了 页面存档备份,存于 - mydrivers.com
- 新Maxwell显卡GTX750 Ti居然开放预定 页面存档备份,存于 - inpai.com
- . gamersky.com. [2014-09-06]. (原始内容存档于2014-09-06).
- . 网易. [2014-09-06]. (原始内容存档于2014-09-06).
- Nvidia Maxwell to be first GPU with ARM CPU in 2013 页面存档备份,存于, Guru3d.com
- . [2015-06-20]. (原始内容存档于2013-10-20).
- Nvidia Maxwell Graphics Processors to Have Integrated ARM General-Purpose Cores. 页面存档备份,存于, xbitlabs.com 页面存档备份,存于
- Nvidia: Next-Generation Maxwell Architecture Will Break New Grounds.. 页面存档备份,存于, xbitlabs.com 页面存档备份,存于
- NVIDIA reveals upcoming GPU architectures. 页面存档备份,存于, hexus.net 页面存档备份,存于
- . [2014-02-10]. (原始内容存档于2014-01-16).
- Smith, Ryan; T S, Ganesh. . AnandTech. 18 February 2014 [18 February 2014]. (原始内容存档于2014年2月18日).
- . [2014-04-02]. (原始内容存档于2015-09-11).
- Smith, Ryan. . AnandTech. 19 March 2013 [19 March 2013]. (原始内容存档于2013-03-21).
- . [2014-04-02]. (原始内容存档于2014-03-25).
- Smith, Ryan. . AnandTech. 26 March 2014 [26 March 2014]. (原始内容存档于2014-04-04).
- . [2014-02-10]. (原始内容存档于2014-02-21).
- . [2014-04-02]. (原始内容存档于2014-03-25).
- . [2014-02-12]. (原始内容存档于2015-12-19).
- . [2016-05-30]. (原始内容存档于2016-06-10).
- . [2015-02-28]. (原始内容存档于2016-06-24).
- . [2016-05-30]. (原始内容存档于2016-06-24).
- . [2016-05-30]. (原始内容存档于2016-06-24).
- . [2014-02-12]. (原始内容存档于2015-12-19).
- . [2016-05-31]. (原始内容存档于2016-06-25).
- . [2016-05-31]. (原始内容存档于2016-05-23).
- . [2016-05-30]. (原始内容存档于2016-06-24).
- . [2014-04-02]. (原始内容存档于2015-12-10).
- . [2014-04-02]. (原始内容存档于2015-12-17).
- . [2016-05-30]. (原始内容存档于2016-06-24).
- . [2016-05-30]. (原始内容存档于2016-06-24).
- . [2014-04-02]. (原始内容存档于2015-12-06).
- . [2014-04-02]. (原始内容存档于2015-12-04).
- . [2016-05-31]. (原始内容存档于2016-05-19).
- . [2016-05-30]. (原始内容存档于2016-05-19).
- . [2014-04-02]. (原始内容存档于2015-12-19).
- . [2014-04-02]. (原始内容存档于2015-12-10).