Nvidia geforce 9800 gt, ktorá séria produktu. Definujte produktový rad grafických kariet Nvidia. ROP bloky, zápis do vyrovnávacej pamäte snímok, anti-aliasing

  • 05.11.2019
technológia (nm)90 80 65/55 tranzistory (M)681 289 210 754 505 314 univerzálne procesory128 32 16 128 64 32 textúrne bloky32 16 8 64 32 16 miešacie bloky24 8 16 8 pamäťová zbernica384 (64 x 6)128 (64x2)256 (64x4)128 (64x2) typy pamäteDDR, GDDR2, GDDR3, GDDR4 čipová systémová zbernicaPCI-Express 16xPCI-Express 2.0 16x RAMDAC2 x 400 MHz rozhraniaTV výstup
TV-In (vyžaduje snímací čip)
2 x DVI Dual Link
Výstup HDTVTV výstup
TV-In (vyžaduje snímací čip)
2 x DVI Dual Link
Výstup HDTV
HDMITV výstup
TV-In (vyžaduje snímací čip)
2 x DVI Dual Link
Výstup HDTV
HDMI
DisplayPort vertex shadery4.0 pixel shadery4.0 pixelová presnosťFP32 vrcholová presnosťFP32 textúrové formátyFP32)
16. RP
I8
DXTC, S3TC
3Dc vykresľovacie formátyFP32
16. RP
I8
10
iné PÁN Texistuje Anti-aliasingTAA (priehľadné polygóny AA)
CSAA 2x-16x
Generácia Z2x v bezfarebnom režime stencil bufferbilaterálne tieňová technológiahardvérové ​​tieňové mapy
optimalizácia geometrických tieňov

Špecifikácie referenčných kariet založených na rodine G8X

mapačip
pneumatika
ALU / TMU blokyfrekvencia jadra (MHz)frekvencia pamäte (MHz)veľkosť pamäte (MB)Šírka pásma pamäte (GB)texel (mtex)Phill
rýchlosť (Mpix)
GeForce 8500 GTG86
PEG16x
16/8 450 400(800) 256 DDR212.8
(128)
3600
GeForce 8600 GTG84
PEG16x
32/16 540 700(1400) 256 GDDR322.4
(128)
8600 4300
GeForce 8600 GTSG84
PEG16x
32/16 675 1000(2000) 256 GDDR332.0
(128)
10800 5400
GeForce 8800 GTS 320 MBG80
PEG16x
96/24 500 800(1600) 320 GDDR364.0
(320)
12000 10000
GeForce 8800 GTS 640 MBG80
PEG16x
96/24 500 800(1600) 640 GDDR364.0
(320)
12000 10000
GeForce 8800 GTXG80
PEG16x
128/32> 575 900(1800) 768 GDDR386.4
(384)
18400 13800
GeForce 8800 UltraG80
PEG16x
128/32 612 1080(2160) 768 GDDR3104.0
(384)
19600 14700
GeForce 8800 GT 256 MBG92
PEG16x
112/56 600 700(1400) 256 GDDR344.8
(256)
33600 9600
GeForce 8800 GT 512 MBG92
PEG16x
112/56 600 900(1800) 512 GDDR357.6
(256)
33600 9600
GeForce 8800 GTS 512 MBG92
PEG16x
128/64 650 1000(2000) 512 GDDR364.0
(256)
41600 10400
GeForce 8800 GSG92
PEG16x
96/48 550 800(1600) 384 GDDR338.4
(192)
26400 6600
GeForce 9400 GTG96
PEG16x
16/8 550 800(1600) 256/512 GDDR225.6
(128)
4400 4400
GeForce 9500 GTG96
PEG16x
32/16 550 800(1600) 256/512 GDDR2 / GDDR325.6
(128)
8800 4400
GeForce 9600 GSOG92
PEG16x
96/48 550 800(1600) 384 GDDR338.4
(192)
26400 6600
GeForce 9600 GTG94
PEG16x
64/32 650 900(1800) 512 GDDR357.6
(256)
20800 10400
GeForce 9800 GTG92
PEG16x
112/56 600 900(1800) 512 GDDR357.6
(256)
33600 9600
GeForce 9800 GTXG92
PEG16x
128/64 675 1100(2200) 512 GDDR370.4
(256)
43200 10800
GeForce 9800 GTX+G92
PEG16x
128/64 738 1100(2200) 512/1024 GDDR370.4
(256)
47200 11800
GeForce 9800 GX22xG92
PEG16x
2x (128/64)600 1000(2000) 2x512 GDDR32x64,0
(2x256)
76800 19200
GeForce GTS 250G92
PEG16x
128/64 738 1100(2200) 512/1024 GDDR370.4
(256)
47200 11800
mapačip
pneumatika
ALU / TMU blokyfrekvencia jadra (MHz)frekvencia pamäte (MHz)veľkosť pamäte (MB)Šírka pásma pamäte (GB)texel (mtex)Phill
rýchlosť (Mpix)

Podrobnosti: G80, rodina GeForce 8800

Špecifikácie G80

  • Oficiálny názov čipu je GeForce 8800
  • Kódové označenie G80
  • 90 nm technológia
  • 681 miliónov tranzistorov
  • Jednotná architektúra s radom zdieľaných procesorov na streamovanie vertexov a pixelov a ďalších možných druhov údajov
  • Hardvérová podpora pre najnovšie inovácie DirectX 10, vrátane nového modelu shadera - Shader Model 4.0, generovanie geometrie a zaznamenávanie prechodných údajov z shaderov (streamový výstup)
  • 384-bitová pamäťová zbernica, 6 nezávislých 64-bitových radičov, podpora GDDR4
  • Takt jadra 575 GHz (GeForce 8800 GTX)
  • 128 skalárnych jednotiek ALU s pohyblivou rádovou čiarkou (formáty celého čísla a pohyblivej rádovej čiarky, podpora FP 32-bitovej presnosti v rámci štandardu IEEE 754, MAD + MUL bez straty taktu)
  • ALU bežia na viac ako dvojnásobnej frekvencii (1,35 GHz pre 8800 GTX)
  • 32 textúrových jednotiek, podpora komponentov FP16 a FP32 v textúrach
  • 64 blokov bilineárneho filtrovania (t. j. je možné bezplatné poctivé trilineárne filtrovanie, ako aj anizotropné filtrovanie s dvojnásobnou rýchlosťou)
  • - Veľkosť plánovacieho bloku - 8x4 (32) pixelov.
  • 6 širokých blokov ROP (24 pixelov) s podporou režimov antialiasingu až 16 vzoriek na pixel, vrátane formátu vyrovnávacej pamäte snímok FP16 alebo FP32 (t. j. možné sú HDR + AA). Každý blok pozostáva z radu flexibilne konfigurovateľných ALU a je zodpovedný za generovanie a porovnávanie Z, MSAA, miešania. Špičkový výkon celého subsystému je až 96 vzoriek MSAA (+ 96 Z) na cyklus, v režime iba Z - 192 vzoriek na cyklus.
  • Všetky rozhrania sú prenesené na externý prídavný čip NVIO (2 RAMDAC, 2 Dual DVI, HDMI, HDTV)
  • Veľmi dobrá škálovateľnosť architektúry, môžete blokovať alebo odoberať pamäťové radiče a ROP (celkovo 6), shader jednotky (celkovo 8 TMU + ALU) jednu po druhej

Špecifikácie referenčnej karty GeForce 8800 GTX

  • Frekvencia jadra 575 MHz
  • Frekvencia procesorov na všeobecné použitie 1350 MHz
  • Počet textúrových jednotiek - 32, miešacích jednotiek - 24
  • Kapacita pamäte 768 megabajtov
  • Šírka pásma pamäte 86,4 gigabajtov za sekundu.
  • Maximálna teoretická rýchlosť plnenia 13,8 gigapixelov za sekundu.
  • Teoretická rýchlosť vzorkovania textúry 18,4 gigaexelov za sekundu.
  • SLI konektor
  • PCI-Express zbernica 16x
  • MSRP 599 USD

Špecifikácie referenčnej karty GeForce 8800 GTS

  • Frekvencia jadra 500 MHz
  • Frekvencia procesorov na všeobecné použitie 1200 MHz
  • Počet univerzálnych procesorov 96
  • Počet textúrových jednotiek - 24, miešacích jednotiek - 20
  • Typ pamäte GDDR3, 1,1 ns (nominálna frekvencia 2 * 900 MHz)
  • Veľkosť pamäte 640 megabajtov
  • Maximálna teoretická rýchlosť plnenia 10,0 gigapixelov za sekundu.
  • Teoretická rýchlosť vzorkovania textúry 12,0 gigatexelov za sekundu.
  • Dva DVI-I konektory (Dual Link, podporuje výstup v rozlíšení až 2560x1600)
  • SLI konektor
  • PCI-Express zbernica 16x
  • TV výstup, HDTV výstup, podpora HDCP
  • Odporúčaná cena 449 dolárov

Architektúra

Na prechod na unifikované grafické architektúry sme čakali dlho. Teraz môžeme konštatovať fakt - s príchodom GeForce 8800 k tomuto prechodu došlo a kritický vrchol je už prekonaný. Nasledovať bude postupný zostup takýchto architektúr do stredného a rozpočtového segmentu a ich ďalší rozvoj až po spájanie s viacjadrovými procesorovými architektúrami v dlhodobom horizonte. Poďme sa teda zoznámiť s prvou zjednotenou architektúrou od NVIDIA:

Toto je celý čipový diagram. Čip pozostáva z 8 univerzálnych výpočtových jednotiek (shader procesorov) a hoci NVIDIA hovorí o 128 procesoroch, pričom uvádza, že každá ALU je taká, je to trochu nesprávne - jednotka na vykonávanie inštrukcie je taká procesorová jednotka, v ktorej sú 4 TMU a 16 ALU. zoskupené. Celkovo teda máme 128 ALU a 32 TMU, ale zrnitosť vykonávania je 8 blokov, z ktorých každý môže v jednom momente vykonávať svoju vlastnú vec, napríklad vykonať časť vrcholu, pixelu, alebo geometrického shadera nad blok 32 pixelov (alebo blok zodpovedajúceho počtu vrcholov a iných primitív). Všetky vetvy, prechody, podmienky atď. sú aplikované úplne na jeden blok, a preto je najlogickejšie ho nazvať shader procesor, aj keď veľmi široký.

Každý takýto procesor je vybavený vlastnou vyrovnávacou pamäťou prvej úrovne, do ktorej sa teraz ukladajú nielen textúry, ale aj ďalšie dáta, ktoré si môže shader procesor vyžiadať. Je dôležité pochopiť, že hlavný dátový tok, napríklad pixely alebo vrcholy, ktoré sa spracúvajú a pohybujú sa v kruhu pod kontrolou sivého kardinála (blok označený na diagrame procesora vlákien), sa neukladajú do vyrovnávacej pamäte, ale prúdia, v čom spočíva hlavné čaro dnešných grafických architektúr – absencia úplne náhodného prístupu na úrovni spracovaných primitív.

Okrem riadiacej jednotky a 8 výpočtových shader procesorov je tu 6 ROP, ktoré vykonávajú detekciu viditeľnosti, zápis do vyrovnávacej pamäte rámca a MSAA (modrá, vedľa blokov vyrovnávacej pamäte L2) zoskupené s radičmi pamäte, frontmi zápisu a vyrovnávacou pamäťou L2.

Získali sme teda veľmi širokú (8 blokov, každá časť spracovania 32 pixelov) architektúru, ktorá sa dá plynulo škálovať v oboch smeroch. Pridanie alebo odstránenie pamäťových radičov a shader procesorov zodpovedajúcim spôsobom zmení šírku pásma celého systému bez narušenia rovnováhy alebo vytvárania úzkych miest. Ide o logické a krásne riešenie, ktoré implementuje hlavnú výhodu jednotnej architektúry – automatickú rovnováhu a vysokú efektivitu využívania dostupných zdrojov.

Okrem shader jednotiek a ROP existuje aj sada riadiacich a administratívnych jednotiek:

  • Bloky, ktoré spúšťajú dáta rôznych formátov (Vertex, Geometry a Pixel Thread Issue) na spustenie sú akési vrátnice, ktoré pripravujú dáta na drvenie čísel v shader procesoroch v súlade s formátom dát, aktuálnym shaderom a jeho stavom, podmienkami vetvenia atď. .
  • Setup / Raster / ZCull - blok, ktorý premieňa vrcholy na pixely - tu sa vykonáva inštalácia, rastrovanie trojuholníka na bloky 32 pixelov, predbežný blok HSR.
  • Input Assembler je blok, ktorý vyberá geometrické a iné počiatočné dáta zo systémovej pamäte alebo lokálnej pamäte a zbiera zo streamov pôvodné dátové štruktúry, ktoré pôjdu zvonku na vstup nášho „kolotoča“. A na výstupe, po mnohých kruhoch pod kontrolou vertexu, geometrie, pixel shaderu a nastavení prelínania, dostaneme pripravené (a v prípade potreby vyhladené) pixely z ROP blokov.

Mimochodom, malá odbočka: je jasne vidieť, že v budúcnosti tieto bloky nadobudnú všeobecnejší charakter a nebudú až tak viazané na konkrétne typy shaderov. Tie. sa jednoducho zmenia na univerzálne bloky, ktoré spúšťajú dáta na výpočet a konverziu formátu – napríklad z jedného shadera na druhý, z vrcholu na pixel atď. Neprinesú sa tým žiadne zásadné zmeny v architektúre, schéma bude vyzerať a fungovať takmer rovnako, s výnimkou menšieho počtu špeciálnych „sivých“ blokov. Už teraz sú všetky tri bloky Thread Issue s najväčšou pravdepodobnosťou (naozaj) jedným blokom so spoločnou funkcionalitou a kontextovými doplnkami:

Shader procesor a jeho TMU / ALU

Takže v každej z 8 shader jednotiek je 16 skalárnych ALU. Čo nám opäť dáva potenciál zvýšiť efektivitu ich záťaže až o 100%, bez ohľadu na shader kód. ALU pracujú na dvojnásobnej frekvencii a teda zodpovedajú alebo prekračujú (v závislosti od operácií v shaderi) 8 starých štvorzložkových vektorových ALU (G70) na rovnakej základnej frekvencii jadra. NVIDIA poskytuje nasledujúci výpočet špičkového výkonu:

Pre ostatných však platí pre tú najnevýhodnejšiu možnosť, keď dôjde k dvom násobeniam. V reálnom živote stojí za to rozdeliť túto výhodu na polovicu. Ale v každom prípade tieto skalárne ALU vďaka vyššej taktovacej frekvencii a ich počtu predbehnú všetky už existujúce čipy. Snáď okrem SLI konfigurácie G71, v prípade shaderov, ktoré nie sú pre novú architektúru najvýhodnejšie.

Je zaujímavé, že presnosť všetkých ALU je FP32 a vzhľadom na novú architektúru nepredpokladáme žiadnu výhodu pre shadery FP16 so zníženou presnosťou. Ďalším zaujímavým bodom je podpora výpočtov v celočíselnom formáte. Táto položka je potrebná na implementáciu SM4. Pri implementácii aritmetiky sa dodržiava štandard IEEE 754, vďaka čomu je vhodný pre seriózne neherné výpočty - vedecké, štatistické, ekonomické atď.

Teraz o interakcii textúrových jednotiek a ALU v rámci jednej shaderovej jednotky:

Operácia vzorkovania a filtrovania textúr nevyžaduje zdroje ALU a teraz sa dá vykonávať úplne paralelne s matematickými výpočtami. Generovanie súradníc textúr (v diagrame - A) stále zaberá časť času ALU. Je to logické, ak chceme využívať tranzistory čipu na 100 %, pretože generovanie súradníc textúr si vyžaduje štandardné plávajúce operácie a bolo by nerozumné pre to spúšťať samostatné ALU.

Samotné textúrové jednotky majú nasledujúcu konfiguráciu:

K dispozícii sú 4 moduly pre adresovanie textúr TA (určenie súradníc presnej adresy pre vzorkovanie) a dvakrát toľko modulov pre bilineárne filtrovanie TF. prečo je to tak? To umožňuje pri miernej spotrebe tranzistorov poskytnúť bezplatné poctivé trilineárne filtrovanie alebo znížiť pokles rýchlosti na polovicu s anizotropným filtrovaním. Rýchlosť pri bežných rozlíšeniach, pri konvenčnom filtrovaní a bez AA už dávno nemá zmysel – a predchádzajúca generácia urýchľovačov si v takýchto podmienkach dobre poradí. Nový čip podporuje aj formáty textúr FP16 / FP32, ako aj gama korekciu SRGB na vstupe (TMU) a výstupe (ROP).

Tu sú špecifikácie shader modelu nových procesorov, ktoré spĺňajú požiadavky SM4:

Dochádza k výrazným kvantitatívnym a kvalitatívnym zmenám – čoraz menej obmedzení pre shadery, stále viac spoločných s CPU. Zatiaľ bez väčšieho náhodného prístupu (takáto operácia sa objavila v SM4, - položka Load Op v diagrame, ale jej účinnosť pre všeobecné účely je zatiaľ otázna, najmä v prvých implementáciách), ale niet pochýb, že tento aspekt bude Počas týchto 5 rokov bola vyvinutá podpora pre formáty FP – od prvých vzoriek v NV30 až po kompletnú, teraz už kompletnú zostavu FP32 vo všetkých režimoch – v G80.

Ako si pamätáme, okrem 8 shader jednotiek existuje 6 jednotiek ROP:

Diagram ukazuje dve samostatné cesty pre Z a C, ale v skutočnosti ide len o jednu sadu ALU, ktoré sa pri spracovaní pixelov farbou rozdelia do dvoch skupín alebo pri spracovaní v režime Z-Only fungujú ako jedna skupina, čím sa zdvojnásobí priepustnosť. V dnešnej dobe nemá zmysel počítať jednotlivé pixely – je ich už dosť, dôležitejšie je vypočítať, koľko vzoriek MSAA je možné spracovať za cyklus. V súlade s tým môže čip s MSAA 16x produkovať 6 celých pixelov na takt, s 8x - 12 atď. Zaujímavosťou je, že škálovateľnosť práce s frame bufferom je na výške – ako si pamätáme, každá ROP jednotka pracuje s vlastným pamäťovým radičom a neruší susedné.

A nakoniec je tu plná podpora formátov framebufferov FP32 a FP16 spolu s anti-aliasingom, teraz neexistujú žiadne obmedzenia pre fantáziu vývojárov a HDR v celom potrubí nevyžaduje zmenu celkovej sekvencie snímok, dokonca ani v režime AA.

CSAA

Existuje aj nová metóda vyhladzovania - CSAA... Jeho podrobná štúdia bude čoskoro na stránke, ale zatiaľ poznamenávame, že táto metóda je v mnohom podobná prístupu ATI a zaoberá sa aj pseudo-stochastickými vzormi a šírením počtu do susedných geometrických zón (dochádza k rozmazaniu pixelov pixely nemajú ostré ohraničenie, ale akoby prechádzajú jeden do druhého s takzvaným AA, ktorý pokrýva určitú oblasť). Farby vzoriek a hĺbka sa navyše ukladajú oddelene od informácií o ich umiestnení, takže na jeden pixel môže pripadnúť 16 vzoriek, ale napríklad iba 8 vypočítaných hodnôt hĺbky - čo navyše šetrí šírku pásma a taktovacie cykly. .

Je známe, že klasické MSAA v režimoch väčších ako 4x sa stáva veľmi náročným na pamäť, pričom kvalita rastie čoraz menej. Nová metóda to koriguje a umožňuje dosiahnuť 16x antialiasingový režim, ktorý je výrazne lepší ako 16x MSAA, s výpočtovými nákladmi porovnateľnými so 4x MSAA.

NVIO

Ďalšou inováciou v G80 sú rozhrania mimo hlavného akceleračného čipu. Teraz je za ne zodpovedný samostatný čip s názvom NVIO:

Tento čip integruje:

  • 2 * 400 MHz RAMDAC
  • 2 * Dual Link DVI (alebo LVDS)
  • Výstup HDTV

Výstupný subsystém vyzerá takto:

Presnosť je vždy 10 bitov na komponent. Samozrejme, v strednom segmente a ešte viac v rozpočtových riešeniach nemusí byť zachovaný samostatný externý čip, ale pre drahé karty má toto riešenie viac výhod ako nevýhod. Rozhrania zaberajú významnú oblasť čipu, sú vysoko závislé od rušenia a vyžadujú špeciálne napájanie. Odstránením všetkých týchto problémov pomocou externého čipu môžete získať kvalitu výstupu a flexibilitu konfigurácie, pričom návrh už aj tak zložitého čipu bude jednoduchší zvážením optimálnych režimov pre integrované RAMDAC.

Podrobnosti: rodiny G84 / G86, GeForce 8600 a 8500

Špecifikácie G84

  • Oficiálny názov čipu je GeForce 8600
  • Kódové označenie G84
  • 80nm technológia
  • 289 miliónov tranzistorov
  • Frekvencia jadra až 675 MHz (GeForce 8600 GTS)
  • ALU pracujú na viac ako dvojnásobnej frekvencii (1,45 GHz pre GeForce 8600 GTS)
  • 16 textúrových jednotiek, podpora komponentov FP16 a FP32 v textúrach
  • 16 blokov bilineárneho filtrovania
  • Možnosť dynamického vetvenia v pixelových a vertexových shaderoch
  • Zaznamenávajte výsledky s až 8 vyrovnávacími pamäťami snímok súčasne (MRT)

Pozrite si špecifikácie GeForce 8600 GTS

  • Frekvencia jadra 675 MHz
  • Frekvencia univerzálnych procesorov 1450 MHz
  • Typ pamäte GDDR3
  • Kapacita pamäte 256 megabajtov
  • Šírka pásma pamäte 32,0 gigabajtov za sekundu.
  • Maximálna teoretická rýchlosť plnenia 5,4 gigapixelov za sekundu.
  • Teoretická vzorkovacia frekvencia textúr je 10,8 gigatexelov za sekundu.
  • Príkon až 71W
  • SLI konektor
  • PCI-Express zbernica 16x
  • TV výstup, HDTV výstup, podpora HDCP
  • Odporúčaná cena 199-229 $

Referenčné špecifikácie GeForce 8600 GT

  • Frekvencia jadra 540 MHz
  • Frekvencia procesorov na všeobecné použitie 1180 MHz
  • Počet univerzálnych procesorov 32
  • Počet textúrových jednotiek - 16 (pozri syntetika), miešacích jednotiek - 8
  • Typ pamäte GDDR3
  • Kapacita pamäte 256 megabajtov
  • Šírka pásma pamäte 22,4 gigabajtov za sekundu.
  • Maximálna teoretická rýchlosť plnenia 4,3 gigapixelov za sekundu.
  • Teoretická rýchlosť vzorkovania textúry 8,6 gigaexelov za sekundu.
  • Spotreba energie až 43W
  • SLI konektor
  • PCI-Express zbernica 16x
  • Odporúčaná cena 149-159 $

Špecifikácie G86

  • Oficiálny názov čipu je GeForce 8500
  • Kódové označenie G86
  • 80nm technológia
  • 210 miliónov tranzistorov
  • Jednotná architektúra s radom zdieľaných procesorov na streamovanie vrcholov, pixelov a iných typov údajov
  • Hardvérová podpora pre DirectX 10, vrátane nového modelu shaderov - Shader Model 4.0, generovanie geometrie a zaznamenávanie prechodných údajov z shaderov (streamový výstup)
  • 128-bitová pamäťová zbernica, dva nezávislé 64-bitové radiče
  • Frekvencia jadra až 450 MHz (GeForce 8500 GT)
  • ALU pracujú s dvojnásobnou frekvenciou (900 MHz pre GeForce 8500 GT)
  • 16 skalárnych ALU s pohyblivou rádovou čiarkou (formáty celého čísla a pohyblivej rádovej čiarky, podpora pre FP 32-bitovú presnosť v rámci štandardu IEEE 754, MAD + MUL bez straty taktu)
  • 8 textúrových jednotiek, podpora komponentov FP16 a FP32 v textúrach
  • 8 blokov bilineárneho filtrovania (v porovnaní s G80 chýba možnosť bezplatného trilineárneho filtrovania a efektívnejšieho anizotropného filtrovania z hľadiska rýchlosti)
  • Možnosť dynamického vetvenia v pixelových a vertexových shaderoch
  • 2 široké bloky ROP (8 pixelov) s podporou režimov vyhladzovania až 16 vzoriek na pixel, vrátane formátu framebufferu FP16 alebo FP32. Každý blok pozostáva z radu flexibilne konfigurovateľných ALU a je zodpovedný za generovanie a porovnávanie Z, MSAA, miešania. Špičkový výkon celého subsystému až 32 vzoriek MSAA (+ 32 Z) na takt, v režime iba Z - 64 vzoriek na takt
  • Zaznamenávajte výsledky s až 8 vyrovnávacími pamäťami snímok súčasne (MRT)
  • Všetky rozhrania (dva RAMDAC, dva Dual DVI, HDMI, HDTV) sú integrované na čipe (na rozdiel od externého čipu NVIO v GeForce 8800)

Referenčné špecifikácie GeForce 8500 GT

  • Frekvencia jadra 450 MHz
  • Frekvencia procesorov na všeobecné použitie 900 MHz
  • Efektívna pamäťová frekvencia 800 MHz (2 * 400 MHz)
  • Typ pamäte DDR2
  • Kapacita pamäte 256/512 megabajtov
  • Šírka pásma pamäte je 12,8 gigabajtov za sekundu.
  • Maximálna teoretická rýchlosť plnenia 3,6 gigapixelov za sekundu.
  • Teoretická rýchlosť vzorkovania textúry 3,6 gigaexelov za sekundu.
  • Spotreba energie do 40W
  • Dva konektory DVI-I Dual Link, podporuje výstup v rozlíšení až 2560 x 1600)
  • SLI konektor
  • PCI-Express zbernica 16x
  • TV-Out, HDTV-Out, voliteľná podpora HDCP
  • Odporúčaná cena 89-129 $

Architektúra G84 a G86

Špecifikácie ukazujú, že G84 je niečo medzi štvrtinou a tretinou vlajkovej lode radu G80. Z hľadiska počtu univerzálnych procesorov je to štvrtina a z hľadiska počtu ROP a pamäťového radiča tretina. S textúrovými jednotkami je to ťažšie, zdá sa, že to nie je štvrtina, ale ani polovica, o tom si povieme nižšie. G86 je zasa vo všeobecnosti niečím zaujímavým - z hľadiska výpočtového výkonu je to len 1/8 G80 a z hľadiska ROP je to stále rovnaká 1/3. Je zrejmé, že NVIDIA sa neponáhľa s uvedením čipov, ktoré sú rýchle z hľadiska výpočtového výkonu, do low-endu.

Hlavná otázka tu znie – bude práve táto štvrtina a 1/8 stačiť na to, aby konkurovala súčasným riešeniam a budúcim čipom AMD? Znížila NVIDIA príliš veľa blokov? Navyše, nehovoriac o tom, že oba čipy sú príliš malé na počet tranzistorov ... V G84 je takmer polovica tranzistorov G80, v G86 - takmer tretina. Zdá sa, že riešením je kompromis, ak by ponechali polovicu jednotiek G80, čip by bol príliš drahý na výrobu a úspešne by konkuroval vlastnej GeForce 8800 GTS.

V blízkej budúcnosti bude s najväčšou pravdepodobnosťou na báze 65 nm technológie možné vyrábať efektívnejšie čipy pre stredné a nižšie cenové kategórie, no teraz sa to tak ukázalo. Výkon nových čipov budeme zvažovať v syntetických a herných testoch, ale už teraz môžeme povedať, že G84 a G86 nemusia byť veľmi rýchle kvôli malému počtu ALU, pravdepodobne budú na rovnakej úrovni ako súčasné riešenia. podobnej ceny.

Nebudeme sa príliš rozpisovať o architektúre G84 a G86, zmien oproti G80 nie je veľa, všetko čo bolo povedané v recenzii GeForce 8800 ostáva v platnosti, upravené o kvantitatívne charakteristiky. Napriek tomu opíšeme hlavné body, ktoré stoja za našu pozornosť, a poskytneme niekoľko snímok venovaných architektonickým špecifikáciám nových čipov.

G80 pozostáva z ôsmich univerzálnych výpočtových jednotiek (shader procesorov), NVIDIA radšej hovorí o 128 procesoroch. Jednotkou vykonávania inštrukcie je zjavne celá procesorová jednotka, v ktorej sú zoskupené 4 jednotky TMU a 16 jednotiek ALU. Každý z blokov môže v jednom momente vykonávať časť vertexu, pixelu alebo geometrického shadera na bloku 32 pixelov, vertexov alebo iných primitív, a tiež môže robiť fyzikálne výpočty. Každý procesor má svoju vlastnú vyrovnávaciu pamäť prvej úrovne, v ktorej sú uložené textúry a ďalšie dáta. Okrem riadiacej jednotky a výpočtových shader procesorov existuje šesť ROP, ktoré vykonávajú detekciu viditeľnosti, zápis do vyrovnávacej pamäte rámcov a MSAA, zoskupených s pamäťovými radičmi, zapisovacími frontami a vyrovnávacou pamäťou druhej úrovne.

Táto architektúra je schopná škálovať v oboch smeroch, čo sa stalo v nových riešeniach. Toto krásne riešenie, ktoré implementuje hlavnú výhodu jednotnej architektúry – automatické vyváženie a vysokú efektivitu využívania dostupných zdrojov, sme už spomínali v článku o GeForce 8800. Predpokladalo sa tiež, že riešenie strednej úrovne bude pozostávať z polovice výpočtové jednotky a riešenie založené na dvoch shader procesoroch a jednom ROP budú rozpočtové. Bohužiaľ, ak mala GeForce 8800 osem procesorov obsahujúcich 32 TMU a 128 ALU, ich počet v nových čipoch sa znížil viac, ako sme pôvodne očakávali. Zdá sa, že obvod G84 vyzerá takto:

To znamená, že všetko zostalo nezmenené, okrem počtu blokov a pamäťových radičov. Existujú malé zmeny súvisiace s jednotkami textúr, ktoré sú viditeľné na tomto obrázku, ale o tom si povieme neskôr. Zaujíma vás, kam sa podelo toľko tranzistorov, ak v G84 zostalo iba 32 procesorov? G84 má takmer polovicu tranzistorov v porovnaní s G80, s výrazne zníženým počtom pamäťových kanálov, ROP a shader procesorov. A G86 má veľa tranzistorov s iba 16 procesormi ...

Je tiež zaujímavé, ako dobre bude v reálnych aplikáciách záťaž vyvážená medzi vykonávaním vertexových, pixelových a geometrických shaderov, pretože počet univerzálnych vykonávacích jednotiek sa teraz výrazne zmenšil. Navyše samotná jednotná architektúra predstavuje pre vývojárov nové výzvy, pri jej používaní budete musieť myslieť na to, ako efektívne využiť celkový výkon medzi vertexovými, pixelovými a geometrickými shadermi. Uveďme jednoduchý príklad – zamerajte sa na výpočty pixelov. V tomto prípade zvýšenie zaťaženia vertexových jednotiek v tradičnej architektúre nepovedie k poklesu výkonu, ale v unifikovanej architektúre spôsobí zmenu rovnováhy a zníženie množstva zdrojov na výpočty pixelov. Určite zvážime otázku výkonu a teraz budeme pokračovať v štúdiu zmien v architektúre G84 a G86.

Shader procesor a TMU / ALU

Schéma shader jednotiek a hodnotenie ich špičkového výpočtového výkonu G80 boli uvedené v zodpovedajúcom článku, pre G84 a G86 sa schéma nezmenila a ich výkon je ľahko prepočítateľný. ALU v čipoch tiež pracujú s dvojnásobnou frekvenciou a sú skalárne, čo umožňuje vysokú účinnosť. Rozdiely nie sú ani vo funkčnosti, presnosť všetkých ALU je FP32, podpora výpočtov v celočíselnom formáte a implementácia zodpovedá štandardu IEEE 754, ktorý je dôležitý pre vedecké, štatistické, ekonomické a iné výpočty.

Ale textúrové jednotky sa zmenili v porovnaní s jednotkami používanými v G80. NVIDIA uisťuje, že v nových čipoch boli vykonané architektonické zmeny, aby sa zvýšil výkon zjednotených procesorov. V G80 mohla každá textúrová jednotka vypočítať štyri adresy textúr a vykonať osem operácií filtrovania textúr za cyklus. Tvrdí sa, že v nových čipoch sa prvé číslo zdvojnásobilo a je schopné zdvojnásobiť počet vzoriek textúr. To znamená, že textúrové jednotky G84 a G86 majú nasledujúcu konfiguráciu (pre porovnanie je schéma bloku G80 znázornená vľavo):

Podľa NVIDIA má teraz každý z blokov osem modulov na adresovanie textúr (určenie podľa súradníc presnej adresy pre vzorkovanie) TA a presne rovnaký počet modulov bilineárneho filtrovania (TF). G80 mal štyri TA a osem TF modulov, čo umožnilo poskytnúť „bezplatné“ trilineárne filtrovanie pri zníženej spotrebe tranzistora alebo znížiť pokles rýchlosti na polovicu pomocou anizotropného filtrovania, čo je užitočné najmä pre špičkové urýchľovače, kde je anizotropné filtrovanie. používatelia takmer vždy používajú. Správnosť týchto informácií skontrolujeme v praktickej časti, určite si pozrite analýzu príslušných syntetických testov, pretože sú v rozpore s týmito údajmi.

Všetky ostatné funkcie textúrových jednotiek sú rovnaké, podporované sú formáty textúr FP16 / FP32 atď. za predpokladu, že vyššie uvedené zmeny skutočne existujú).

ROP bloky, zápis do vyrovnávacej pamäte snímok, anti-aliasing

Bloky ROP, ktorých bolo šesť v G80 a dva v nových čipoch, sa nezmenili:

Každý z blokov spracováva štyri pixely (16 subpixelov), čo predstavuje celkovo 8 pixelov na takt pre farbu a Z. V režime Z-only sa na taktovanie spracuje dvakrát toľko vzoriek. S MSAA 16x dokáže čip dodať dva pixely na takt, s 4x - 8 atď. Rovnako ako v G80 je tu plná podpora formátov framebufferov FP32 a FP16 spolu s antialiasingom.

Je podporovaná nová metóda antialiasingu známa z GeForce 8800 - Coverage Sampled Antialiasing (CSAA), ktorá bola podrobne popísaná v zodpovedajúcom materiáli:

Stručne povedané, podstatou metódy je, že farby vzoriek a hĺbka sú uložené oddelene od informácie o ich umiestnení, na jeden pixel môže byť 16 vzoriek a iba 8 vypočítaných hodnôt hĺbky, čo šetrí šírku pásma a taktovacie cykly. CSAA eliminuje potrebu prenášať a ukladať jednu farbu alebo hodnotu Z na subpixel, čím spresňuje priemernú hodnotu pixelu na obrazovke tým, že poskytuje viac informácií o tom, ako tento pixel prekrýva okraje trojuholníkov. Výsledkom je, že nová metóda umožňuje získať 16x režim vyhladzovania, ktorý je oveľa lepší ako MSAA 4x, s porovnateľnými výpočtovými nákladmi. A v zriedkavých prípadoch, v ktorých metóda CSAA nefunguje, sa získa obvyklý MSAA menšieho stupňa a nie úplná absencia antialiasingu.

PureVideo HD

Prejdime k najzaujímavejším zmenám. Ukázalo sa, že G84 a G86 majú inovácie, ktoré ich priaznivo odlišujú dokonca aj od G80! Týka sa to vstavaného video procesora, ktorý v nových čipoch dostal rozšírenú podporu pre PureVideo HD. Uvádza sa, že tieto čipy úplne vyťažia centrálny procesor systému pri dekódovaní všetkých typov bežných obrazových dát, vrátane „najťažšieho“ formátu H.264.

Modely G84 a G86 využívajú nový model programovateľného HD video procesora PureVideo, ktorý je výkonnejší ako ten používaný v G80 a obsahuje takzvaný BSP engine. Nový procesor podporuje dekódovanie formátov H.264, VC-1 a MPEG-2 s rozlíšením až 1920x1080 a bitovou rýchlosťou až 30-40 Mbps, všetku prácu pri dekódovaní dát CABAC a CAVLC vykonáva v hardvéri , ktorý umožňuje prehrávať všetky existujúce HD-DVD a Blu-ray disky aj na stredne výkonných jednojadrových PC.

Videoprocesor v G84 / G86 sa skladá z niekoľkých častí: samotná druhá generácia Video Processor (VP2), ktorá plní úlohy IDCT, kompenzácie pohybu a deblokovania pre formáty MPEG2, VC-1 a H.264, ktorá podporuje hardvérové ​​dekódovanie druhého prúdu; stream procesor (BSP), ktorý plní úlohy štatistického dekódovania CABAC a CAVLC pre formát H.264, pričom ide o jeden z časovo najnáročnejších výpočtov; Encrypted data decoding engine AES128, ktorého účel je jasný už z názvu – dešifruje video dáta používané pri ochrane proti kopírovaniu na Blu-ray a HD-DVD diskoch. Takto vyzerajú rozdiely v stupni hardvérovej podpory pre dekódovanie videa na rôznych video čipoch:

Úlohy vykonávané video čipom sú zvýraznené modrou farbou a centrálny procesor - zelenou farbou. Ako vidíte, ak predchádzajúca generácia pomáhala procesoru iba v niektorých úlohách, nový videoprocesor použitý v najnovších čipoch robí všetky úlohy sám. Efektívnosť riešení preveríme v budúcich materiáloch o štúdiu efektívnosti hardvérového dekódovania videa, pričom NVIDIA v materiáloch uvádza tieto čísla: pri použití moderného dvojjadrového procesora a softvérovom dekódovaní dát prehrávanie Blu-ray a HD-DVD disky zaberajú až 90 – 100 % času procesora, s hardvérovým dekódovaním na videočipe predchádzajúcej generácie na rovnakom systéme – až 60 – 70 % a s novým motorom, ktorý vyvinuli pre G84 a G86 - iba 20%. To samozrejme nevyzerá ako deklarované plne hardvérové ​​dekódovanie, ale stále veľmi, veľmi efektívne.

V čase oznámenia nové funkcie v PureVideo HD fungujú len v 32-bitovej verzii Windows Vista a podpora PureVideo HD vo Windows XP sa objaví až v lete. Čo sa týka kvality prehrávania videa, postprocessingu, deinterlacingu atď., NVIDIA to vylepšila aj v GeForce 8800 a nové čipy sa v tomto smere nijako zvlášť nelíšia.

CUDA, neherné a fyzikálne výpočty

V článku o GeForce 8800 sa spomínalo, že zvýšený špičkový výkon plávajúcej aritmetiky v nových urýchľovačoch a flexibilita zjednotenej architektúry shaderov sa stali dostatočnými na výpočty fyziky v herných aplikáciách a ešte závažnejšie problémy: matematické a fyzikálne modelovanie, ekonomické a štatistické modely a výpočty, rozpoznávanie vzorov, spracovanie obrazu, vedecká grafika a ďalšie. Na tento účel bolo vydané špeciálne API orientované na výpočty, ktoré je vhodné na prispôsobenie a vývoj programov, ktoré presúvajú výpočty na GPU - CUDA (Compute Unified Device Architecture).

Podrobnejšie o CUDA nájdete v článku o G80, my sa zameriame na ďalší trendový smer posledných rokov – podporu fyzikálnych výpočtov na GPU. NVIDIA túto technológiu nazýva Quantum Effects. Uvádza sa, že všetky video čipy novej generácie, vrátane G84 a G86, o ktorých sa dnes uvažuje, sú vhodné na výpočty tohto druhu, čo vám umožňuje preniesť časť záťaže z CPU na GPU. Ako konkrétne príklady uvádzame simulácie dymu, ohňa, výbuchov, dynamiky vlasov a odevov, vlny a tekutín a mnohé ďalšie. Ale zatiaľ by som rád napísal viac o niečom inom. Že sa nám zatiaľ ukazujú len obrázky z testovacích aplikácií s veľkým počtom fyzických objektov vypočítaných video čipmi a zatiaľ to hrám s takouto podporou ani nevonia.

Podpora externého rozhrania

Ako si pamätáme, v GeForce 8800 nás trochu prekvapila ďalšia nečakaná novinka – prídavný čip podporujúci externé rozhrania mimo toho hlavného. V prípade špičkových grafických kariet tieto úlohy rieši samostatný čip s názvom NVIO, v ktorom sú integrované: dva 400 MHz RAMDAC, dva Dual Link DVI (alebo LVDS), HDTV-Out. Už vtedy sme predpokladali, že v strednom a dolnom segmente sotva zostane samostatný externý čip a tak sa aj skutočne stalo. V G84 a G86 je podpora všetkých týchto rozhraní zabudovaná do samotného čipu.

GeForce 8600 GTS je vybavená dvomi Dual Link DVI-I výstupmi s podporou HDCP, ide o prvú grafickú kartu na trhu s takýmito schopnosťami (HDCP a Dual Link spolu). Pokiaľ ide o HDMI, podpora tohto konektora je plne implementovaná v hardvéri a výrobcovia ju môžu vykonávať na kartách špeciálneho dizajnu. GeForce 8600 GT a 8500 GT však podporujú HDCP a HDMI je voliteľné, ale môžu byť implementované jednotlivými výrobcami vo svojich produktoch.

Podrobnosti: G92, rodina GeForce 8800

Špecifikácie G92

  • Kódové označenie čipu G92
  • 65 nm technológia
  • 754 miliónov tranzistorov (viac ako G80)
  • Jednotná architektúra s radom zdieľaných procesorov na streamovanie vrcholov, pixelov a iných typov údajov
  • Takt jadra 600 MHz (GeForce 8800 GT)
  • ALU pracujú na viac ako dvojnásobnej frekvencii (1,5 GHz pre GeForce 8800 GT)
  • 112 (toto je pre GeForce 8800 GT a celkovo ich je pravdepodobne 128) skalárne ALU s pohyblivou rádovou čiarkou (formáty s plávajúcou desatinnou čiarkou, podpora FP 32-bitovej presnosti v rámci štandardu IEEE 754, MAD + MUL bez straty taktu )
  • 56 (64) jednotiek na adresovanie textúr s podporou komponentov FP16 a FP32 v textúrach (vysvetlenia nájdete nižšie)
  • 56 (64) bilineárnych filtračných jednotiek (ako v G84 a G86, neexistuje žiadne bezplatné trilineárne filtrovanie a efektívnejšie anizotropné filtrovanie)
  • Možnosť dynamického vetvenia v pixelových a vertexových shaderoch
  • Zaznamenávajte výsledky s až 8 vyrovnávacími pamäťami snímok súčasne (MRT)
  • Všetky rozhrania (dva RAMDAC, dva Dual DVI, HDMI, HDTV) sú integrované na čipe (na rozdiel od externého čipu NVIO v GeForce 8800)

Špecifikácie referenčnej karty GeForce 8800 GT 512MB

  • Frekvencia jadra 600 MHz
  • Efektívna pamäťová frekvencia 1,8 GHz (2 * 900 MHz)
  • Typ pamäte GDDR3
  • Kapacita pamäte 512 MB
  • Príkon až 110W
  • Dva konektory DVI-I Dual Link, podporujú výstup v rozlíšení až 2560 x 1600
  • SLI konektor
  • zbernica PCI Express 2.0
  • TV výstup, HDTV výstup, podpora HDCP
  • Odporúčaná cena: 249 dolárov

Špecifikácie referenčnej karty GeForce 8800 GT 256MB

  • Frekvencia jadra 600 MHz
  • Frekvencia univerzálnych procesorov 1500 MHz
  • Počet univerzálnych procesorov 112
  • Počet textúrových jednotiek - 56, miešacích jednotiek - 16
  • Efektívna frekvencia pamäte 1,4 GHz (2 * 700 MHz)
  • Typ pamäte GDDR3
  • Kapacita pamäte 256 megabajtov
  • Šírka pásma pamäte 44,8 gigabajtov za sekundu.
  • Maximálna teoretická rýchlosť plnenia 9,6 gigapixelov za sekundu.
  • Teoretická rýchlosť vzorkovania textúry až 33,6 gigatexelov za sekundu.
  • Príkon až 110W
  • Dva konektory DVI-I Dual Link, podporujú výstup v rozlíšení až 2560 x 1600
  • SLI konektor
  • zbernica PCI Express 2.0
  • TV výstup, HDTV výstup, podpora HDCP
  • Odporúčaná cena 199 dolárov

Špecifikácie referenčnej karty GeForce 8800 GTS 512MB

  • Frekvencia jadra 650 MHz
  • Počet univerzálnych procesorov 128
  • Efektívna pamäťová frekvencia 2,0 GHz (2 * 1000 MHz)
  • Typ pamäte GDDR3
  • Kapacita pamäte 512 MB
  • Šírka pásma pamäte 64,0 gigabajtov za sekundu.
  • Teoretická rýchlosť vzorkovania textúry až 41,6 gigatexelov za sekundu.
  • Dva konektory DVI-I Dual Link, podporujú výstup v rozlíšení až 2560 x 1600
  • SLI konektor
  • zbernica PCI Express 2.0
  • TV výstup, HDTV výstup, podpora HDCP
  • Odporúčaná cena 349-399 $

Architektúra čipu G92

Architektonicky sa G92 veľmi nelíši od G80. Z toho, čo vieme, môžeme povedať, že G92 je vlajkovou loďou radu (G80), prevedená na nový technický proces, s malými zmenami. NVIDIA vo svojich materiáloch uvádza, že čip má 7 veľkých shader jednotiek a teda 56 textúrnych jednotiek, ako aj štyri široké ROP, pričom počet tranzistorov v čipe vyvoláva podozrenie, že o niečom nehovoria. V pôvodne oznámených riešeniach nie sú zahrnuté všetky bloky, ktoré fyzicky existujú v čipe, ich počet v G92 je väčší ako v GeForce 8800 GT. Aj keď zvýšená zložitosť čipu sa vysvetľuje zahrnutím predtým samostatného čipu NVIO do jeho zloženia, ako aj video procesora novej generácie. Okrem toho sofistikovanejšie TMU ovplyvnili aj počet tranzistorov. Je tiež pravdepodobné, že cache boli zväčšené, aby sa zvýšila efektivita používania 256-bitovej pamäťovej zbernice.

Tentoraz, aby konkurovala zodpovedajúcim čipom AMD, sa NVIDIA rozhodla ponechať pomerne veľký počet blokov v čipe strednej triedy. Potvrdil sa náš predpoklad z recenzií G84 a G86, že 65 nm technológia bude použitá na výrobu oveľa efektívnejších čipov pre strednú cenovú kategóriu. V čipe G92 je málo architektonických zmien a nebudeme sa tým podrobne zaoberať. Všetko, čo bolo povedané vyššie o riešeniach zo série GeForce 8, zostáva v platnosti, zopakujeme len niektoré hlavné body venované architektonickým špecifikáciám nového čipu.

Pre nové riešenie poskytuje NVIDIA vo svojich dokumentoch nasledujúci diagram:

Teda zo všetkých zmien - len znížený počet blokov a niektoré zmeny v TMU, ktoré sú popísané nižšie. Ako je uvedené vyššie, existujú pochybnosti, či je to fyzicky tak, ale uvádzame popis na základe toho, čo píše NVIDIA. G92 pozostáva zo siedmich univerzálnych výpočtových jednotiek (shader procesorov), NVIDIA tradične hovorí o 112 procesoroch (aspoň v prvých riešeniach GeForce 8800 GT). Každý z blokov, v ktorých je zoskupených 8 TMU a 16 ALU, môže vykonávať časť vertexu, pixelu alebo geometrie shadera na bloku 32 pixelov, vertexov alebo iných primitív a môže robiť aj iné (negrafické) výpočty. . Každý procesor má svoju vlastnú vyrovnávaciu pamäť prvej úrovne, v ktorej sú uložené textúry a ďalšie dáta. Okrem riadiacej jednotky a výpočtových shader procesorov existujú štyri jednotky ROP, ktoré vykonávajú detekciu viditeľnosti, zápis do vyrovnávacej pamäte rámca a MSAA, zoskupené s pamäťovými radičmi, zapisovacími frontami a vyrovnávacou pamäťou druhej úrovne.

Univerzálne procesory a TMU

Schéma shaderových jednotiek a hodnotenie ich špičkového výpočtového výkonu G80 boli uvedené v zodpovedajúcom článku, pre G92 sa to nezmenilo, ich výkon sa dá ľahko prepočítať na základe zmien v taktovacej frekvencii. ALU v čipoch pracujú na viac ako dvojnásobnej frekvencii, sú skalárne, čo umožňuje dosiahnuť vysokú efektivitu. Zatiaľ nie je známe o funkčných rozdieloch, či je presnosť výpočtu FP64 v tomto čipe dostupná alebo nie. Práve tu je podpora výpočtov v celočíselnom formáte a pri realizácii všetkých výpočtov je dodržaný štandard IEEE 754, ktorý je dôležitý pre vedecké, štatistické, ekonomické a iné výpočty.

Textúrové jednotky v G92 nie sú rovnaké ako v G80, opakujú riešenie TMU v G84 a G86, v ktorých boli vykonané architektonické zmeny na zvýšenie výkonu. Pripomeňme, že v G80 mohla každá textúrová jednotka vypočítať štyri textúrové adresy a vykonať osem operácií filtrovania textúry za cyklus, zatiaľ čo v G84 / G86 TMU sú schopné dvojnásobného počtu vzoriek textúr. To znamená, že každý z blokov má osem modulov na adresovanie textúr (určenie podľa súradníc presnej adresy pre vzorkovanie) TA a presne rovnaký počet modulov bilineárneho filtrovania (TF):

Nemyslite si, že 56 blokov GeForce 8800 GT v reálnych aplikáciách bude silnejších ako 32 blokov v GeForce 8800 GTX. S aktivovaným trilineárnym a / alebo anizotropným filtrovaním bude to druhé rýchlejšie, pretože môže urobiť trochu viac práce s filtrovaním vzoriek textúr. Tieto informácie preveríme v praktickej časti analýzou výsledkov zodpovedajúcich syntetických testov. Všetky ostatné funkcionality textúrových jednotiek sa nezmenili, podporované sú formáty textúr FP16, FP32 a iné.

ROP bloky, zápis do vyrovnávacej pamäte snímok, anti-aliasing

Nezmenili sa ani samotné bloky ROP, zmenil sa však ich počet. G80 mal šesť ROP a nové riešenie má teraz štyri, aby sa znížili náklady na výrobu čipov a PCB pre grafické karty. Tento škrt môže byť spôsobený aj tým, že nevytvára príliš silnú konkurenciu pre existujúce riešenia najvyššej úrovne.

Každý z blokov spracováva štyri pixely alebo 16 subpixelov, celkovo 16 pixelov na takt pre farbu a Z. V režime Z-only sa na taktovanie spracuje dvakrát toľko vzoriek. S MSAA 16x dokáže čip dodať dva pixely na takt, s 4x - 8 atď. Rovnako ako v G80 sú formáty framebufferov FP32 a FP16 plne podporované spolu s antialiasingom.

Podporovaná je nová metóda antialiasingu známa z čipov predchádzajúcej série - Coverage Sampled Antialiasing (CSAA). Ďalšou inováciou je, že v GeForce 8800 GT bol aktualizovaný algoritmus antialiasingu transparentnosti. Používateľovi boli ponúknuté dve možnosti: multisampling (TRMS) a supersampling (TRSS), prvá mala veľmi dobrý výkon, no nefungovala efektívne vo všetkých hrách a druhá bola kvalitná, no pomalá. GeForce 8800 GT deklaruje novú metódu multisamplingu semitransparentných povrchov, ktorá zlepšuje jej kvalitu a výkon. Tento algoritmus poskytuje takmer rovnaké zlepšenie kvality ako supervzorkovanie, ale má vysoký výkon - len o niekoľko percent horší pre režim bez aktivovaného antialiasingu polopriehľadných povrchov.

PureVideo HD

Jednou z očakávaných zmien v G92 je integrovaný video procesor druhej generácie známy z G84 a G86, ktorý dostal rozšírenú podporu pre PureVideo HD. Je už známe, že táto verzia video procesora takmer úplne zaťažuje CPU pri dekódovaní všetkých typov video dát, vrátane „ťažkých“ formátov H.264 a VC-1.

Rovnako ako G84 / G86, aj G92 využíva nový model programovateľného HD video procesora PureVideo, ktorý obsahuje takzvaný BSP engine. Nový procesor podporuje dekódovanie formátov H.264, VC-1 a MPEG-2 s rozlíšením až 1920x1080 a bitovou rýchlosťou až 30-40 Mbps, pričom vykonáva prácu dekódovania dát CABAC a CAVLC v hardvéri, ktorý umožňuje prehrávať všetky existujúce HD-DVD a Blu-ray mechaniky aj na stredne výkonných jednojadrových PC. Dekódovanie VC-1 nie je také efektívne ako H.264, no stále ho podporuje nový procesor.

Viac o videoprocesore druhej generácie si môžete prečítať v časti venovanej čipom G84 a G86. Práca moderných video riešení bola čiastočne testovaná v najnovšom materiáli o štúdiu účinnosti hardvérového dekódovania video dát.

PCI Express 2.0

Jednou zo skutočných inovácií v G92 je podpora zbernice PCI Express 2.0. Druhá verzia PCI Express zdvojnásobuje štandardnú šírku pásma, z 2,5 Gb/s na 5 Gb/s, výsledkom čoho je, že konektor x16 dokáže prenášať dáta rýchlosťou až 8 GB/s v každom smere, na rozdiel od 4 GB / s pre verziu 1.x. Je veľmi dôležité, že PCI Express 2.0 je kompatibilný s PCI Express 1.1 a staré grafické karty budú fungovať na nových základných doskách a nové grafické karty s podporou druhej verzie zostanú funkčné na základných doskách bez jej podpory. Samozrejme za predpokladu dostatočného externého napájania a bez zvyšovania šírky pásma rozhrania.

Aby bola zaistená spätná kompatibilita s existujúcimi riešeniami PCI Express 1.0 a 1.1, špecifikácia 2.0 podporuje prenosové rýchlosti 2,5 Gbps aj 5 Gbps. Spätná kompatibilita PCI Express 2.0 vám umožňuje používať staršie riešenia 2,5 Gbps v slotoch 5,0 Gbps, ktoré budú fungovať pri nižšej rýchlosti, zatiaľ čo zariadenie navrhnuté podľa špecifikácií verzie 2.0 môže podporovať rýchlosti 2,5 Gbps aj 5 Gbps. ... Teoreticky je s kompatibilitou všetko v poriadku, v praxi však môžu nastať problémy s niektorými kombináciami základných dosiek a rozširujúcich kariet.

Podpora externého rozhrania

Ako sa očakávalo, dodatočný čip NVIO dostupný na doskách GeForce 8800, ktorý podporuje externé rozhrania mimo hlavného (dva 400 MHz RAMDAC, dva Dual Link DVI (alebo LVDS), HDTV-Out), v tomto prípade bol súčasťou čipu V samotnom G92 je podpora pre všetky tieto rozhrania zabudovaná.

Grafické karty GeForce 8800 GT majú zvyčajne dva výstupy Dual Link DVI-I s podporou HDCP. Pokiaľ ide o HDMI, podpora tohto konektora je plne implementovaná, výrobcovia ju môžu implementovať na špeciálne dizajnové karty, ktoré môžu byť vydané o niečo neskôr. Hoci je prítomnosť konektora HDMI na grafickej karte úplne voliteľná, úspešne ho nahradí adaptér DVI na HDMI, ktorý sa dodáva s väčšinou moderných grafických kariet.

Na rozdiel od grafických kariet RADEON HD 2000 od AMD, GeForce 8800 GT neobsahuje integrovaný audio čip, ktorý je potrebný na podporu prenosu zvuku cez DVI pomocou adaptéra na HDMI. Takáto možnosť prenosu obrazových a zvukových signálov cez jeden konektor je žiadaná predovšetkým na kartách strednej a nižšej úrovne, ktoré sú inštalované v malých prípadoch mediálnych centier, a GeForce 8800 GT je pre túto úlohu sotva vhodný. .

Podrobnosti: G94, rodina GeForce 9600

Špecifikácie G94

  • Kódové označenie čipu G94
  • 65 nm technológia
  • 505 miliónov tranzistorov
  • Jednotná architektúra s radom zdieľaných procesorov na streamovanie vrcholov, pixelov a iných typov údajov
  • Hardvérová podpora pre DirectX 10, vrátane shader modelu - Shader Model 4.0, generovanie geometrie a zaznamenávanie prechodných dát z shaderov (streamový výstup)
  • 256-bitová pamäťová zbernica, štyri nezávislé radiče, 64-bitová šírka
  • Frekvencia jadra 650 MHz (GeForce 9600 GT)
  • ALU pracujú na viac ako dvojnásobnej frekvencii (1,625 GHz pre GeForce 9600 GT)
  • 64 skalárnych ALU s pohyblivou rádovou čiarkou (formáty celého čísla a pohyblivej rádovej čiarky, podpora pre FP 32-bitovú presnosť v rámci štandardu IEEE 754, MAD + MUL bez straty taktu)
  • 32 jednotiek na adresovanie textúr s podporou komponentov FP16 a FP32 v textúrach
  • 32 blokov bilineárneho filtrovania (ako v G84 a G92, toto poskytuje zvýšený počet bilineárnych vzoriek, ale bez bezplatného trilineárneho filtrovania a efektívneho anizotropného filtrovania)
  • Možnosť dynamického vetvenia v pixelových a vertexových shaderoch
  • 4 široké bloky ROP (16 pixelov) s podporou režimov vyhladzovania až 16 vzoriek na pixel, vrátane formátu framebuffer FP16 alebo FP32. Každý blok pozostáva z radu flexibilne konfigurovateľných ALU a je zodpovedný za generovanie a porovnávanie Z, MSAA, miešania. Špičkový výkon celého subsystému až 64 vzoriek MSAA (+ 64 Z) na takt, v režime iba Z - 128 vzoriek na takt
  • Zaznamenávajte výsledky s až 8 vyrovnávacími pamäťami snímok súčasne (MRT)

Referenčné špecifikácie GeForce 9600 GT

  • Frekvencia jadra 650 MHz
  • Frekvencia procesorov na všeobecné použitie 1625 MHz
  • Počet univerzálnych procesorov 64
  • Počet textúrových jednotiek - 32, miešacích jednotiek - 16
  • Efektívna pamäťová frekvencia 1,8 GHz (2 * 900 MHz)
  • Typ pamäte GDDR3
  • Kapacita pamäte 512 MB
  • Šírka pásma pamäte 57,6 gigabajtov za sekundu.
  • Maximálna teoretická rýchlosť plnenia 10,4 gigapixelov za sekundu.
  • Teoretická rýchlosť vzorkovania textúry až 20,8 gigatexelov za sekundu.
  • Dva konektory DVI-I Dual Link, podporujú výstup v rozlíšení až 2560 x 1600
  • SLI konektor
  • zbernica PCI Express 2.0
  • Spotreba energie až 95W
  • Odporúčaná cena 169-189 $

Architektúra G94

Z architektonického hľadiska sa G94 líši od G92 iba kvantitatívnymi charakteristikami, má menší počet realizačných jednotiek: ALU a TMU. A od G8x tiež nie je toľko rozdielov. Ako bolo napísané v predchádzajúcich materiáloch, rad čipov G9x je mierne upravený rad G8x, prenesený do nového technického procesu s menšími architektonickými zmenami. Nový čip strednej triedy má 4 veľké shaderové jednotky (celkovo 64 ALU) a 32 textúrových jednotiek, ako aj štyri široké ROP.

Takže v čipe je málo architektonických zmien, takmer všetky boli napísané vyššie a všetko, čo bolo povedané skôr pre predchádzajúce riešenia, zostáva v platnosti. A tu uvádzame iba hlavný diagram čipu G94:

Textúrne jednotky v G94 sú úplne rovnaké ako v G84 / G86 a G92, dokážu vybrať dvakrát toľko vzoriek textúry s bilineárnym filtrom v porovnaní s G80. Ale 32 textúrových jednotiek GeForce 9600 GT v reálnych aplikáciách nebude fungovať rýchlejšie ako 32 jednotiek GeForce 8800 GTX len kvôli vyššej prevádzkovej frekvencii GPU. Toto možno pozorovať iba vtedy, keď je vypnuté trilineárne a anizotropné filtrovanie, čo je extrémne zriedkavé, iba v tých algoritmoch, kde sa používajú nefiltrované vzorky, napríklad pri mapovaní paralaxy.

Za ďalšiu výhodu najmä G9x a GeForce 9600 GT spoločnosť NVIDIA považuje určitú novú technológiu kompresie implementovanú v jednotkách ROP, ktorá podľa ich odhadov funguje o 15 % efektívnejšie ako tá, ktorá bola použitá v predchádzajúcich čipoch. Zdá sa, že ide o presne tie isté architektonické úpravy v G9x, ktoré sú navrhnuté tak, aby poskytovali efektívnejšiu prevádzku 256-bitovej pamäťovej zbernice v porovnaní s 320/384-bitovou zbernicou, o ktorej sme písali vyššie. Prirodzene, v reálnych aplikáciách až taký veľký rozdiel nebude, aj podľa samotnej NVIDIA je nárast z inovácií v ROP väčšinou len okolo 5 %.

Napriek všetkým zmenám v architektúre G9x, ktoré pridávajú čipu na zložitosti, o ktorých si povieme neskôr, je počet tranzistorov v čipe pomerne veľký. Pravdepodobne sa táto zložitosť GPU vysvetľuje pridaním predtým samostatného čipu NVIO, videoprocesora novej generácie, komplikáciou TMU a ROP, ako aj ďalšími skrytými úpravami: zmena veľkosti vyrovnávacej pamäte atď.

PureVideo HD

G94 obsahuje rovnaký video procesor druhej generácie známy z G84 / G86 a G92 s vylepšenou podporou pre PureVideo HD. Takmer úplne odbremeňuje CPU pri dekódovaní najbežnejších typov video dát, vrátane H.264, VC-1 a MPEG-2, v rozlíšení až 1920 x 1080 a bitovej rýchlosti až 30-40 Mbps, pričom dekódovanie vykonáva výlučne hardvérovo. Hoci dekódovanie NVIDIA VC-1 nie je také efektívne ako H.264, malá časť procesu využíva výkon CPU, ale stále vám umožňuje prehrávať všetky existujúce HD DVD a Blu-Ray disky, dokonca aj na stredne výkonných počítačov. Viac o videoprocesore druhej generácie si môžete prečítať v našich recenziách G84 / G86 a G92, odkazy na ktoré sú uvedené na začiatku článku.

Všimneme si softvérové ​​vylepšenia PureVideo HD, ktoré boli načasované tak, aby sa zhodovali s vydaním GeForce 9600 GT. Medzi najnovšie inovácie v PureVideo HD patrí dekódovanie duálneho prúdu, dynamický kontrast a sýtosť farieb. Tieto zmeny nie sú exkluzívne pre GeForce 9600 GT a v nových ovládačoch, počnúc ForceWare 174, sú zavedené pre všetky čipy, ktoré podporujú plnú hardvérovú akceleráciu pomocou PureVideo HD. Okrem grafickej karty, o ktorej dnes uvažujeme, tento zoznam obsahuje: GeForce 8600 GT / GTS, GeForce 8800 GT a GeForce 8800 GTS 512.

Dynamické vylepšenie kontrastu sa pomerne často používa v domácich spotrebičoch, televízoroch a video prehrávačoch, dokáže vylepšiť zábery s neoptimálnou expozíciou (kombinácia rýchlosti uzávierky a clony). Za týmto účelom sa po dekódovaní každej snímky analyzuje jej histogram a ak má snímka slabý kontrast, histogram sa prepočíta a použije na snímku. Tu je príklad (vľavo - úvodný obrázok, vpravo - spracovaný):

To isté platí pre vylepšenie dynamickej sýtosti predstavené v PureVideo HD. Domáce spotrebiče tiež už veľmi dlho používajú niektoré algoritmy na vylepšovanie obrazu, na rozdiel od počítačových monitorov, ktoré reprodukujú všetko tak, ako to je, čo môže v mnohých prípadoch spôsobiť príliš slabý a nezáživný obraz. Automatické vyváženie farebných zložiek vo video dátach, vypočítané aj pre každú novú snímku, zlepšuje ľudské vnímanie obrazu miernou úpravou sýtosti jeho farieb:

Dual-stream dekódovanie vám umožňuje urýchliť dekódovanie a následné spracovanie dvoch rôznych video streamov súčasne. To môže byť užitočné pre výstupné režimy, ako je obraz v obraze, ktoré sa používajú na niektorých diskoch Blu-Ray a HD DVD (napríklad druhý obrázok môže zobrazovať režiséra filmu, ktorý komentuje scény zobrazené v hlavnom okne) Takýmito funkciami sú vybavené edície WAR a Resident Evil: Extinction.

Ďalšou užitočnou novinkou najnovšej verzie PureVideo HD je možnosť súčasného spustenia Aero shellu v operačnom systéme Windows Vista pri prehrávaní hardvérovo akcelerovaného videa v režime okna, čo predtým nebolo možné. Nehovorím, že to používateľov skutočne znepokojuje, ale príležitosť je pekná.

Podpora externého rozhrania

Podpora externých rozhraní GeForce 9600 GT je podobná ako pri GeForce 8800 GT, snáď s výnimkou pridanej integrovanej podpory pre DisplayPort. V samotnom čipe bol zahrnutý aj dodatočný čip NVIO dostupný na doskách GeForce 8800, ktorý podporuje externé rozhrania mimo hlavného G94.

Referenčné grafické karty GeForce 9600 GT majú dva Dual Link DVI výstupy s podporou HDCP. HDMI a DisplayPort sú podporované hardvérom na čipe a tieto porty môžu poskytnúť partneri NVIDIA na kartách s vlastným dizajnom. Navyše, ako zaisťuje NVIDIA, na rozdiel od G92 je podpora DisplayPort teraz zabudovaná do čipu a nie sú potrebné žiadne externé vysielače. Vo všeobecnosti sú konektory HDMI a DisplayPort na grafickej karte voliteľné, možno ich nahradiť jednoduchými adaptérmi z DVI na HDMI alebo DisplayPort, s ktorými sa niekedy stretávajú moderné grafické karty.

Podrobnosti: rodiny G96, GeForce 9400 a 9500

Špecifikácie G96

  • Kódové označenie čipu G96
  • 65 nm technológia
  • 314 miliónov tranzistorov
  • Jednotná architektúra s radom zdieľaných procesorov na streamovanie vrcholov, pixelov a iných typov údajov
  • Hardvérová podpora pre DirectX 10, vrátane shader modelu - Shader Model 4.0, generovanie geometrie a zaznamenávanie prechodných dát z shaderov (streamový výstup)
  • 128-bitová pamäťová zbernica, dva nezávislé radiče, 64-bitová šírka
  • Frekvencia jadra 550 MHz
  • Jednotky ALU pracujú na viac ako dvojnásobnej frekvencii (1,4 GHz)
  • 32 skalárnych ALU s pohyblivou rádovou čiarkou (formáty celého čísla a pohyblivej rádovej čiarky, podpora pre FP 32-bitovú presnosť v rámci štandardu IEEE 754, MAD + MUL bez straty taktu)
  • 16 jednotiek na adresovanie textúr s podporou komponentov FP16 a FP32 v textúrach
  • 16 blokov bilineárneho filtrovania (ako pre G92, toto poskytuje zvýšený počet bilineárnych vzoriek, ale bez bezplatného trilineárneho filtrovania a efektívneho anizotropného filtrovania)
  • Možnosť dynamického vetvenia v pixelových a vertexových shaderoch
  • 2 široké bloky ROP (8 pixelov) s podporou režimov vyhladzovania až 16 vzoriek na pixel, vrátane formátu framebufferu FP16 alebo FP32. Každý blok pozostáva z radu flexibilne konfigurovateľných ALU a je zodpovedný za generovanie a porovnávanie Z, MSAA, miešania. Špičkový výkon celého subsystému až 32 vzoriek MSAA (+ 32 Z) na takt, v režime iba Z - 64 vzoriek na takt
  • Zaznamenávajte výsledky s až 8 vyrovnávacími pamäťami snímok súčasne (MRT)
  • Všetky rozhrania (dva RAMDAC, dva Dual DVI, HDMI, DisplayPort) sú integrované na čipe

Referenčné špecifikácie GeForce 9500 GT

  • Frekvencia jadra 550 MHz
  • Počet univerzálnych procesorov 32
  • Počet textúrových jednotiek - 16, miešacích jednotiek - 8
  • Efektívna pamäťová frekvencia 1,6 GHz (2 * 800 MHz)
  • Typ pamäte GDDR2 / GDDR3
  • Kapacita pamäte 256/512/1024 megabajtov
  • Teoretická rýchlosť vzorkovania textúry až 8,8 gigatexelov za sekundu.
  • Dva konektory DVI-I Dual Link, podporujú výstup v rozlíšení až 2560 x 1600
  • SLI konektor
  • zbernica PCI Express 2.0
  • TV-Out, HDTV-Out, podpora HDMI a DisplayPort s HDCP

Referenčné špecifikácie GeForce 9400 GT

  • Frekvencia jadra 550 MHz
  • Frekvencia univerzálnych procesorov 1400 MHz
  • Počet univerzálnych procesorov 16
  • Počet textúrových jednotiek - 8, miešacích jednotiek - 8
  • Efektívna pamäťová frekvencia 1,6 GHz (2 * 800 MHz)
  • Typ pamäte GDDR2
  • Kapacita pamäte 256/512 megabajtov
  • Šírka pásma pamäte 25,6 gigabajtov za sekundu.
  • Maximálna teoretická rýchlosť plnenia 4,4 gigapixelov za sekundu.
  • Teoretická rýchlosť vzorkovania textúry až 4,4 gigaexelov za sekundu.
  • Dva konektory DVI-I Dual Link, podporujú výstup v rozlíšení až 2560 x 1600
  • SLI konektor
  • zbernica PCI Express 2.0
  • TV-Out, HDTV-Out, podpora HDMI a DisplayPort s HDCP

Architektúra G96

Architektonicky je G96 presnou polovicou čipu G94, ktorý sa zasa líši od G92 iba v kvantitatívnych charakteristikách. G96 má polovičný počet všetkých vykonávacích jednotiek: ALU, TMU a ROP. Nový video čip je určený pre riešenia najnižšej cenovej kategórie a má dve veľké shader jednotky (celkovo 32 ALU) a 16 textúrových jednotiek, ako aj osem ROP. Má tiež skrátenú pamäťovú zbernicu z 256-bitovej na 128-bitovú v porovnaní s G94 a G92. Všetky hardvérové ​​funkcie zostávajú nezmenené, rozdiely sú len vo výkone.

Podrobnosti: G92b, rodina GeForce GTS 200

Špecifikácie referenčnej grafickej karty GeForce GTS 250

  • Frekvencia jadra 738 MHz
  • Frekvencia procesorov na všeobecné použitie 1836 MHz
  • Počet univerzálnych procesorov 128
  • Počet textúrových jednotiek - 64, miešacích jednotiek - 16
  • Frekvencia efektívnej pamäte 2200 (2 * 1100) MHz
  • Typ pamäte GDDR3
  • Veľkosť pamäte 512/1024/2048 megabajtov
  • Šírka pásma pamäte 70,4 GB/s
  • Maximálna teoretická rýchlosť plnenia 11,8 gigapixelov za sekundu.
  • Teoretická rýchlosť vzorkovania textúry až 47,2 gigatexelov za sekundu.
  • Dva konektory DVI-I Dual Link, podporujú výstup v rozlíšení až 2560 x 1600
  • Duálny SLI konektor
  • zbernica PCI Express 2.0
  • TV výstup, HDTV výstup, HDCP, HDMI, DisplayPort
  • Spotreba energie až 150 W (jeden 6-pinový konektor)
  • Dvojslotová verzia
  • MSRP 129 $ / 149 $ / 169 $

Vo všeobecnosti sa táto „nová“ grafická karta založená na 55 nm čipe G92 v ničom nelíši od GeForce 9800 GTX +. Vydanie nového modelu možno čiastočne odôvodniť inštaláciou nie 512 MB video pamäte, ako v 9800 GTX +, ale gigabajt, čo výrazne ovplyvňuje výkon v ťažkých režimoch s maximálnym nastavením kvality, vysokým rozlíšením s celou obrazovkou. aktivované anti-aliasing. A existujú aj dvojgigabajtové možnosti, ale to je skôr marketingová výhoda ako skutočná.

V takýchto podmienkach by mali byť staršie verzie GeForce GTS 250 naozaj citeľne rýchlejšie ako GeForce 9800 GTX + vďaka zvýšenej kapacite pamäte. A niektoré z modernejších hier využijú ešte nižšie rozlíšenia. Všetko by bolo v poriadku, ale napokon, niektorí výrobcovia kariet vydali GeForce 9800 GTX + s gigabajtom pamäte ešte skôr ...

Výroba video čipov G92b podľa 55 nm technologických štandardov a citeľné zjednodušenie návrhu PCB umožnilo spoločnosti NVIDIA vyrobiť riešenie podobné GeForce 9800 GTX charakteristikami, avšak s nižšou cenou a zníženou spotrebou energie a odvodom tepla. A teraz, aby bola GeForce GTS 250 napájaná, má doska iba jeden 6-pinový napájací konektor PCI-E. Toto sú všetky hlavné rozdiely oproti 9800 GTX +.

Grafická karta 9800 GT od NVIDIA je logickým pokračovaním základnej dosky 8800GT. Oba technologické produkty majú takmer totožné parametre. Hlavným rozdielom medzi 9800GT a predchádzajúcim modelom je podpora technológie HybridPower. Neexistujú žiadne ďalšie vylepšenia. Grafický procesor karty má označenie G92-270. Podobný model mal aj model 8800. Mikročip má ako predtým revíziu A2. Charakteristiky taktu grafickej karty 9800 GT zostali rovnaké: 601/1512 MHz.

Špecifikácie 9800 GT

Technicky neprešiel model 9800 GT od modelu 8800 žiadnymi zásadnými zmenami.

Parametre grafickej karty:

  • GPU: G92.
  • Video pamäť: 512 MB.
  • Pamäťová zbernica: 256bit.
  • Frekvencia GPU: 601/1512 MHz.
  • Textúrne bloky: 56.
  • ROP bloky: 16.
  • Efektívna frekvencia, pri ktorej pracuje pamäť grafickej karty: 1800 MHz.
  • Univerzálne procesory (jadrá): 112.
  • Podporované jedinečné technológie: Hybrid Power.
  • Systémová zbernica a ďalšie komunikačné rozhrania: PCI-E 2.0x16 / 2xDVI / S-Video. HDMI je podporované adaptérom.

Aké úlohy dokáže grafická karta 9800 GT vyriešiť?

Prezentovaná grafická karta sa dobre vyrovná s hrami predchádzajúcej generácie. Ak používateľ nenaháňa nové položky, potom je pre neho 9800 GT nepochybne vhodný. Charakteristiky karty vám umožňujú ľahko spustiť hry ako The Witcher 2, S.T.A.L.K.E.R, Crysis 2, Dead Space 3 a ďalšie. Fallout New Vegas, mimochodom, tiež prichádza s touto doskou bez problémov. Štvrtú verziu legendárneho projektu však nemožno spustiť.

Nefungujú ani moderné strieľačky a simulátory áut vydané po roku 2013. Existujú výnimky, ale veľmi zriedka. Používateľ sa cíti celkom pohodlne pri práci s grafikou a video informáciami, sledovaní filmov vo vysokom rozlíšení. Ak človek nie je profesionálnym fotografom alebo 3D dizajnérom, ktorý potrebuje maximálnu rýchlosť práce, potom je pre neho grafická karta 9800 GT celkom vhodná.

Výhody a nevýhody grafickej karty

Uvedená doska má množstvo výhod, vďaka ktorým je jej použitie stále aktuálne. Aj keď toto riešenie má aj nevýhody.

Aké sú výhody 9800 GT? Charakteristiky modelu naznačujú, že ich je veľa.

  • Grafická karta podporuje režim SLI. Môžete si kúpiť 4 dosky naraz a spojiť ich do skupiny, čím dosiahnete výrazné zvýšenie výkonu.
  • Doska poskytuje podporu pre technológiu PhysX. Slúži na reprodukciu dodatočných špeciálnych efektov v hrách. Je potrebné poznamenať, že celkový výkon grafickej karty výrazne klesá. Na zmiernenie tohto efektu výrobca odporúča použiť voliteľný dedikovaný urýchľovač PhysX na doplnenie základnej dosky.
  • Pomocou špeciálnych nástrojov môžete zlepšiť nominálny výkon Nvidia 9800 GT a zvýšiť ho o 5-15%. Konkrétny indikátor závisí od želania používateľa a možností chladiaceho systému karty. Počas pretaktovania musíte starostlivo sledovať prevádzkovú teplotu zariadenia, aby ste predišli nadmernému prehriatiu a v dôsledku toho poruche.

Nevýhody:

  • je zastarané riešenie;
  • má obmedzenú efektivitu vo výpočtovej technike na všeobecné účely;
  • plynulosť prehrávania Blu-Ray diskov a HD klipov zverejnených na internete bude výrazne ovplyvnená výkonom centrálneho CPU (okrem procesora grafickej karty);
  • slabý výkon 9800 GT, špecifikácie dosky neumožňujú spustiť hry vydané po roku 2013;
  • relatívne vysoká spotreba energie;
  • nedostatočný výkon grafickej karty pri práci s ďalšími efektmi PhysX.

NVIDIA GeForce 9800 GT

4 (80 %) 2 hlasy [y]

Grafická karta NVIDIA GeForce 9800 GT je založená na 65 nm procesnej technológii a je založená na grafickom procesore G92-270 (G92). Karta podporuje Directx 10. NVIDIA umiestnila 512 MB pamäte GDDR3, ktorá je pripojená pomocou 256-bitového pamäťového rozhrania.
GPU beží na 600 MHz Jadrá CUDA sú 112, s rýchlosťou 1800 Mbps a šírkou pásma 57,6 Gbps.

Spotreba energie grafickej karty je 105 W a odporúčaný zdroj napájania je 400 W.

NVIDIA GeForce 9800 GT podporuje Microsoft DirectX 10 a OpenGL 3.3.

Špecifikácie NVIDIA GeForce 9800 GT

Technológie a schopnosti:
CUDA:Áno
SLI:Áno
PhysX:Áno
3D videnie:Áno
3D hry:Áno
DirectX:10
OpenGL:3.3
Pneumatika:PCI-Express 2.0 x16
Podpora OS:Microsoft Windows 7-10, Linux, FreeBSDx86

Poznámka:: v tabuľke sú uvedené referenčné charakteristiky grafickej karty, môžu sa líšiť od výrobcu k výrobcovi.

Stiahnite si ovládače pre grafickú kartu NVIDIA GeForce 9800 GT:

Vyberte svoj operačný systém:

Pre Windows 10: Stiahnite si 32-bitovú verziu 342.01 WHQL Stiahnite si 64-bitovú verziu 342.01 WHQL
Pre Windows 7/8 / 8.1: Stiahnite si 32-bitovú verziu 342.01 WHQL Stiahnite si 64-bitovú verziu 342.01 WHQL

Informácie o vodičovi:

Verzia ovládača:340.52 WHQL
Pridané:29. júla 2014
Jazyk vodiča:ruský
Veľkosť:220 MB
CUDA Toolkit:6.5
Informácie o vodičovi:Poznámky k vydaniu (v340.52) (PDF)

GeForce Experience

Stiahnite si ovládač pre grafickú kartu NVIDIA GeForce 9800 GT z oficiálnej stránky!

Alebo použite program GeForce Experience - automaticky vyberie správny ovládač pre vašu grafickú kartu.

Sťahovanie ovládača pre grafickú kartu NVIDIA GeForce 9800 GT Vyrobené z oficiálnej stránky!

Video recenzie grafickej karty NVIDIA GeForce 9800 GT:

Správa stránky nesmie zdieľať názory autorov videorecenzií!

Často kladené otázky a odpovede o grafickej karte NVIDIA GeForce 9800 GT: otázka: Aká séria je táto grafická karta?odpoveď: Stolný počítač otázka: Aké DirectX podporuje?odpoveď: Grafická karta podporuje DirectX 10 otázka: Aká je spotreba energie grafickej karty?odpoveď: Maximálna spotreba energie je 105W otázka: Aký druh napájania potrebujete pre grafickú kartu?odpoveď: Odporúčaný zdroj 400W otázka: Existujú nejaké pomocné napájacie konektory?odpoveď: Dva 6-kolíkové otázka: Aká je maximálna povolená teplota?odpoveď: Nie viac ako 105 ℃ otázka: Kde si môžem stiahnuť ovládač?odpoveď:

Vo väčšine prípadov pri použití grafickej karty nie sú problémy s nájdením a inštaláciou potrebného softvéru. Buď sa dodáva so zariadením, alebo sa úplne automaticky nainštaluje pomocou "Správca zariadení".

Ťažkosti začínajú, keď sme nútení hľadať vodičov na vlastnú päsť. Nie všetci výrobcovia rozumejú ašpiráciám používateľov a často nás pletú nezrozumiteľnými pojmami a názvami parametrov. Tento článok vám pomôže zistiť, ako zistiť produktovú sériu grafických kariet Nvidia.

Na oficiálnej webovej stránke Nvidia v sekcii manuálneho vyhľadávania ovládačov vidíme rozbaľovací zoznam, v ktorom musíte vybrať sériu (generáciu) produktov.

Práve v tomto štádiu vznikajú pre začiatočníkov ťažkosti, pretože tieto informácie zjavne nikde nie sú. Pozrime sa bližšie na to, ako určiť, do ktorej generácie patrí grafická karta nainštalovaná v počítači.

Definícia modelu

Najprv musíte zistiť model grafického adaptéra, pre ktorý môžete použiť napríklad systémové nástroje Windows a programy tretích strán.

Keď zistíme, aký druh grafickej karty je v našom počítači, nebude ťažké zistiť jej generáciu. Poďme si prejsť sériové čísla, počnúc tými najmodernejšími.

20. epizóda

Dvadsiata séria grafických kariet je postavená na čipoch s architektúrou Turing... V čase aktualizácie tohto materiálu (pozri dátum) linka pozostáva z troch adaptérov. to RTX 2080 Ti, RTX 2080 a RTX 2070.

10. epizóda

Desiata séria produktov zahŕňa grafické adaptéry na architektúre Pascal... Toto zahŕňa GT 1030, GTX 1050 - 1080Ti... To tiež zahŕňa Nvidia Titan X (Pascal) a Nvidia Titan Xp.

séria 900

Deväťstotina séria zahŕňa rad zariadení predchádzajúcej generácie Maxwell... to GTX 950 - 980 Ti a GTX Titan X.

séria 700

To zahŕňa adaptéry na čipoch Kepler... Od tejto generácie (pri pohľade zhora nadol) začína rôznorodosť modelov. Toto sú kancelárske GT 705 - 740(5 modelov), hrať GTX 745 - 780 Ti(8 modelov) a tri GTX Titan, Titan Z, Titan Black.

séria 600

Tiež pomerne plodná „rodina“ s menom Kepler... to GeForce 605, GT 610 – 645, GTX 645 – 690.

séria 500

Toto sú grafické karty na architektúre Fermi... Zostava pozostáva z GeForce 510, GT 520 – 545 a GTX 550Ti – 590.

séria 400

GPU v štvorstovke sú tiež čipové Fermi a sú reprezentované takými grafickými kartami, ako sú GeForce 405, GT 420 - 440, GTS 450 a GTX 460 - 480.

séria 300

Architektúra tejto série je tzv Tesla, jej modely: GeForce 310 a 315, GT 320 - 340.

Séria 200

Tieto GPU majú tiež svoje meno Tesla... Karty zahrnuté v rade sú: GeForce 205 a 210, G210, GT 220 - 240, GTS 240 a 250, GTX 260 - 295.

100. epizóda

Grafické karty 100. série Nvidia sú stále postavené na mikroarchitektúre Tesla a obsahuje adaptéry G100, GT 120 - 140, GTS 150.

9. epizóda

Deviata generácia GPU GeForce je založená na čipoch G80 a G92... Zostava je rozdelená do piatich skupín: 9300, 9400, 9500, 9600, 9800 ... Rozdiely v názvoch spočívajú len v doplnení písmen charakterizujúcich účel a vnútornú náplň zariadenia. Napríklad, GeForce 9800 GTX+.

8. epizóda

Tento riadok používa rovnaké čipy G80, a sortiment kariet je vhodný: 8100, 8200, 8300, 8400, 8500, 8600, 8800 ... Po číslach nasledujú písmená: GeForce 8800 GTX.

7. epizóda

Siedma séria postavená na procesoroch G70 a G72, obsahuje grafickú kartu GeForce 7200, 7300, 7600, 7800, 7900 a 7950 s rôznymi písmenami.

6. epizóda

Zelené karty generácie 6 bežia na architektúre NV40 a obsahuje adaptéry GeForce 6200, 6500, 6600, 6800 a ich modifikácie.

5 FX

Pravítko 5 FX na báze mikročipov NV30 a NV35... Zloženie modelov je nasledovné: FX 5200, 5500, PCX 5300, GeForce FX 5600, 5700, 5800, 5900, 5950, vyrobené v rôznych možnostiach konfigurácie.

Modely grafických kariet s písmenom M

Všetky grafické karty s písmenom na konci názvu "M" sú modifikácie GPU pre mobilné zariadenia (notebooky). Toto zahŕňa: 900 miliónov, 800 miliónov, 700 miliónov, 600 miliónov, 500 miliónov, 400 miliónov, 300 miliónov, 200 miliónov, 100 miliónov, 9 miliónov, 8 miliónov... Napríklad mapa GeForce 780M patrí do siedmej série.

Týmto sa končí naša krátka prehliadka generácií a modelov grafických adaptérov Nvidia.

Video adaptér Nvidia GeForce 9800 GT s pamäťou 512 MB sa objavil na trhu v roku 2008 a nahradil predchádzajúci model. Neskoršie verzie boli vydané s 1 GB GDDR5 a vylepšenými hernými možnosťami. Všetky varianty kariet boli v cenovom rozpätí a boli určené na zostavenie lacných herných počítačov.

Parametre grafického adaptéra sú celkom v súlade s požiadavkami herných aplikácií v rokoch 2008-2009. Hlavné funkcie Nvidia GeForce 9800 GT sú nasledovné:

  • GPU G92-270;
  • Frekvencia GPU - od 550 do 600 MHz;
  • Frekvencia pamäte - 1400-1800 MHz;
  • Bitová hĺbka - 256 bitov;
  • Maximálna rýchlosť prenosu dát - 57,6 GB / s;
  • Podporované rozlíšenie obrazu - až 2560 x 1600.

Grafická karta podporuje technológiu Nvidia SLI pre zvýšený výkon, HybridPower pre automatické prepínanie na integrovanú grafiku a PhysX pre čo najrealistickejší herný zážitok. Funguje aj s balíkmi DirectX 10 a OpenGL 2.0 a poskytuje vysokokvalitnú 3D grafiku. Modernejšie sady funkcií API nie sú podporované.

Recenzia GeForce 9800 GT

Spotreba energie 9800 GT je pomerne vysoká, 105 W, takže na jej chod je potrebný výkonný zdroj. Výrobca odporúča použiť aspoň 450 wattov. Na spustenie moderných hier by ste si mali zvoliť produktívnejšiu napájaciu jednotku - 500 alebo 600 wattov.

Na udržanie normálnej teploty grafickej karty GeForce 9800 GT sú všetky úpravy vybavené aktívnymi chladiacimi systémami - spravidla s jedným chladičom.

V normálnom režime sa karta zahreje na maximálne 77 stupňov. Maximálna hodnota je 105 stupňov.

Na pripojenie periférnych zariadení má video adaptér nasledujúce konektory:

  • 2 DVI, ku ktorým možno cez adaptéry pripojiť bežné káble VGA a HDMI;
  • TV výstup pre výstup analógového signálu;
  • MIO, s ktorým môžete kombinovať dve karty.

Maximálna hodnota efektívnej frekvencie grafickej karty je 2000 MHz, čo umožňuje jej pretaktovanie o 11-30% v závislosti od modelu. Stojí za zváženie, že výrazné zvýšenie výkonu môže viesť k vážnemu prehriatiu.

Ako pretaktovať grafickú kartu Nvidia GeForce 9800 GT

Pretaktovaním Nvidia GeForce 9800 GT môžete zvýšiť jej frekvenciu. Výsledkom je zvýšenie výkonu karty a fps počas hrania. Aj keď nebudete môcť spustiť hry, nespĺňa to minimálne požiadavky.

Špeciálne nástroje ako MSI Afterburner alebo Nvidia Inspector pomôžu zabezpečiť pretaktovanie grafickej karty Nvidia GeForce 9800 GT.

Maximálna frekvencia pretaktovaného grafického adaptéra by nemala presiahnuť 2000 MHz. Pretaktovaná karta pracuje rýchlejšie, ale už spotrebuje až 120-125 wattov.

Po pretaktovaní je ťažba na 9800 GT možná, ale neodporúča sa. Dokonca aj s príchodom novej kryptomeny Bitcoin Gold, ktorú je možné ťažiť pomocou GPU, bude výkon stále príliš nízky na to, aby sa mu vrátila elektrina, najmä pri takom vysokom TDP.

Aké hry vytiahne Nvidia GeForce 9800 GT

Test vykonaný naraz v hrách GeForce 9800 GT ukázal možnosť použitia grafickej karty pre lacné herné počítače. Minimálne požiadavky na počítač zodpovedajúci karte sú základná doska so 16x PCI-Express slotmi, 512-1024 MB RAM a 500 W napájací zdroj. Odporúča sa tiež nainštalovať balík DX10.

Výsledky testu sú nasledovné:

  1. V hre Crysys (2009) s rozlíšením 1280 × 1024 pixelov. 512 MB model poskytuje 22 až 30 fps – približne na úrovni grafickej karty HD 4770.
  2. Keď spustíte hru Stalker (rozlíšenie 1680 x 1050 pixelov), frekvencia zmien obrázkov dosahuje 13-25 snímok za sekundu, ak použijete adaptér s 512 MB GDDR5, a až 30, ak si do počítača nainštalujete gigabajtovú verziu.
  3. Hra Skyrim s 512 MB kartou sa vôbec nespustí a gigabajtová úprava pri minimálnych nastaveniach ukáže až 65 fps.

Neodporúča sa spúšťať hry vydané po rokoch 2011-2012 s GeForce 9800 GT 512 MB. Väčšina z nich neukáže viac ako 20 fps, zvyšok nebude fungovať. Verzia s 1 GB pamäte bude fungovať, ale je tiež nepravdepodobné, že poskytne prijateľnú kvalitu hry.

Porovnanie výrobcov

Na samom začiatku predaja bola cena Nvidia GeForce 9800 GT asi 2700-3000 rubľov za verziu 512 MB a asi 3,5 tisíc rubľov. pre gigabajtové úpravy. Produkty slávnejších výrobcov ako MSI, Palit a Asus dostali frekvenciu pamätí 1800 MHz a vyššiu cenu. Teraz sa dá kúpiť na sekundárnom trhu len za 600 - 700 rubľov.

ZnačkaPamäť, MBFrekvencia procesora, MHzFrekvencia pamäte, MHzNáklady, trieť.
Gigabyte1024 600 1800 3600
Gigabyte512 600 1500 2900
Gigabyte512 550 1800 2800
ECS512 550 1800 2600
MSI512 550 1800 2900
Asus512 600 1800 3000
Inno3D1024 600 1800 3500
Klub 3D1024 550 1400 3300
Gainward1024 550 1800 3500
Zotac1024 550 1600 3400
Palit512 600 1800 2700
Palit1024 550 1800 3400

Lacnejšie, ale aj pomalšie boli lukratívnejšie značky Zotac, Club 3D a Gigabyte. Frekvencia takýchto grafických adaptérov bola v rozmedzí 1400-1600 MHz. Teraz je ich cena približne rovnaká ako v prípade modelov, ktoré kedysi stáli viac - nie viac ako 1 000 rubľov.

Ako preinštalovať ovládač videa pre GeForce 9800 GT

Pre normálnu prevádzku grafického adaptéra je potrebné mať správne fungujúce ovládacie programy. Existujú tri spôsoby, ako stiahnuť a nainštalovať nové ovládače do počítača s kartou 9800 GT:

  1. Sťahovanie z oficiálneho zdroja výrobcu. Jediná možnosť, ktorá zaručí správnu činnosť a bezpečnosť vášho PC.
  2. Sťahovanie zo zdrojov tretích strán. Metóda, pri ktorej si môžete nielen stiahnuť ovládač pre Nvidia GeForce 9800 GT, ale aj infikovať počítač vírusom.
  3. Používanie špeciálnych pomôcok ako DriverPack Solution, DriverHub alebo Driver Booster Free. V tomto prípade môže byť ovládač zastaraný.

Na oficiálnych stránkach spoločnosti Nvidia nájdete nové verzie ovládacích programov pre grafickú kartu, určené pre rôzne operačné systémy. Zoznam platforiem podporovaných kartou zahŕňa Windows 7 32 a 64 bit, Windows 10 a Linux. Na iných zdrojoch nájdete ovládače pre také zriedkavé operačné systémy, ako je Solaris.