Přeskočit na obsah

Pascal (mikroarchitektura)

Z Wikipedie, otevřené encyklopedie

Pascal je kódové označení pro GPU mikroarchitekturu společnosti Nvidia, která vyšla v dubnu roku 2016 jako nástupce architektury Maxwell. Byla pojmenována po francouzském matematikovi Blaisi Pascalovi.

Tato architektura je používána u spotřebitelských grafických karet GeForce série 10 a u grafických karet pro pracovní stanice, servery a superpočítače s označením Quadro a Tesla.

Architektura

[editovat | editovat zdroj]

Prvním vydaným čipem architektury Pascal byl GP100 používaný především v modelu Tesla, který je cílen na datová centra, velké servery a superpočítače.[1]. Následoval grafický čip GP104, který se nachází ve výkonných grafických kartách a jehož shaderové jednotky jsou více podobné těm u Maxwellu.

Mezi vylepšení architektury čipu GP100 oproti Maxwellu patří:

  • Jedna renderovací jednotka (Render Output Unit - ROP) Pascalu má 64 CUDA jader. Pro srovnání, Maxwell jich měl 128, Kepler 192, Fermi 32 a Tesla pouze 8.
  • Podpora CUDA 6.0.
  • High Bandwidth Memory 2 - některé karty mají 16 GB HBM2 s 4096bitovou datovou sběrnicí a rychlostí paměti 720 GB/s.
  • Unified memory (unifikovaná paměť) - umožňuje CPU a GPU využívat jak paměť RAM, tak paměť VRAM za pomocí technologie Page Migration Engine.
  • NVLink - datová sběrnice vysoké rychlosti pro komunikaci mezi GPU a CPU nebo mezi více GPU. NVLink umožňuje mnohem vyšší přenosovou rychlost než má SLI Bridge. Podle odhadů 80-200 GB/s. NVLink se používá pouze u profesionálních karet (Quadro, Tesla) nebo u nové "herní" generace Turing (RTX 2080 Ti atd.).[2]
  • 16bitové operace (FP16) s desetinnými čísly jsou dvakrát rychlejší než s 32bitovými čísly (FP32) a čtyřikrát rychlejší než s 64bitovými čísly (FP64).
  • Dvakrát více registrů na každé CUDA jádro než měl Maxwell.
  • Více sdílené paměti.
  • Dynamic Load Balancing Scheduling system. Umožňuje rozplánovat využití GPU pro různé operace, což umožňuje plné využití grafické karty.

Mezi vylepšení architektury čipu GP104 patří:

  • Podpora CUDA 6.1
  • GDDR5X - nový paměťový standard podporující přenos dat rychlostí 10 Gbit/s navíc s vylepšenou kontrolou paměti.
  • Simultaneous Multi-Projection - vytváření více projekcí jediného geometrického obrazu.
  • DisplayPort 1.4, HDMI 2.0b.
  • Delta Color Compression čtvrté generace.
  • Enhanced SLI Interface - zrychlení rozhraní SLI oproti předchozím verzím
  • Hardwarové dekódování HEVC Main10, Main12 a VP9.
  • NVENC Hardwarové kódování HEVC Main10.
  • Podpora HDCP 2.2 pro přehrávání DRM chráněného 4K obsahu.
  • GPU Boost 3.0.
  • GP100 - Využíván v modelech Nvidia Tesla P100 a Quadro GP100. Je určen pro GPGPU aplikace, které často počítají s 64bitovými (a také jednoduššími) desetinnými čísly, nebo pro deep learning. Využívají HBM2 paměť.
  • GP102 - Využíván v modelech TITAN Xp, Titan X, GeForce GTX 1080 Ti, které disponují pamětí GDDR5X, a také v modelech Quadro P6000 a Tesla P40.
  • GP104 - Využíván v modelech GeForce GTX 1070 a GTX 1080. GTX 1070 má čtvrtinu shaderových jednotek deaktivovanou a na rozdíl od GTX 1080, která disponuje GDDR5X pamětí, má paměť GDDR5.
  • GP106 - Využíván v modelu GTX 1060 s pamětí GDDR5 a v modelu Quadro P2000.
  • GP107 - Využíván modely GTX 1050, GTX 1050 Ti, Quadro P1000, Quadro P600 a Quadro P400.
  • GP108 - Využíván v modelu GeForce GT 1030.

Seznam produktů GeForce série 10

[editovat | editovat zdroj]

Desktopové

[editovat | editovat zdroj]
Model Proces
(nm)
Tranzistory
(miliardy)
Rozhraní Počet
CUDA jader
Takt Paměť Tepelný
výkon
(W)
Základní
takt
jádra
(MHz)
Boost
takt
jádra
(MHz)
Takt
paměti
(MT/s)
Velikost
(GB)
Typ Šířka
sběrnice
(bit)
GeForce
GT
1030
14 1,8 PCIe 3.0
x4
384 1227 1468 6000 2 GDDR5 64 30
GeForce
GTX
1050
3,3 PCIe 3.0
x16
640 1354 1455 7000 128 75
GeForce
GTX
1050 Ti
768 1290 1392 7000 4
GeForce
GTX
1060 3GB
16 4,4 1152 1506 1708 8000/
9000
3 192 120
GeForce
GTX
1060 6GB
1280 6
GeForce
GTX
1070
7,2 1920 1683 8000 8 256 150
GeForce
GTX
1080
2560 1607 1733 10000/
11000
GDDR5X 180
GeForce
GTX
1080 Ti
11.8 3584 1481 1582 11008 11 352 250
NVIDIA
TITAN
X
1417 1531 10008 12 384
NVIDIA
TITAN
Xp
3840 1405 1582 11408

Externí odkazy

[editovat | editovat zdroj]