Nvidia geforce 9800 gt hangi ürün serisi. Nvidia ekran kartlarının ürün serisini belirliyoruz. ROP blokları, çerçeve arabelleği yazma, kenar yumuşatma

  • 05.11.2019
teknoloji (nm)90 80 65/55 transistörler (M)681 289 210 754 505 314 evrensel işlemciler128 32 16 128 64 32 doku blokları32 16 8 64 32 16 karıştırma blokları24 8 16 8 bellek veriyolu384 (64x6)128 (64x2)256 (64x4)128 (64x2) bellek türleriDDR, GDDR2, GDDR3, GDDR4 çip sistem veriyoluPCI Ekspres 16xPCI-Express 2.0 16x RAMDAC2x400MHz arayüzlerTV çıkışı
TV Girişi (yakalama çipi gerektirir)
2 x DVI Çift Bağlantı
HDTV ÇıkışıTV çıkışı
TV Girişi (yakalama çipi gerektirir)
2 x DVI Çift Bağlantı
HDTV Çıkışı
HDMITV çıkışı
TV Girişi (yakalama çipi gerektirir)
2 x DVI Çift Bağlantı
HDTV Çıkışı
HDMI
ekran bağlantı noktası köşe gölgelendiricileri4.0 piksel gölgelendiriciler4.0 piksel hassasiyetiFP32 köşe hesaplama doğruluğuFP32 doku biçimleriFP32)
FP16
I8
DXTC, S3TC
3D işleme biçimleriFP32
FP16
I8
10
başka MRTvar kenar yumuşatmaTAA (AA şeffaf çokgenler)
CSAA 2x-16x
Z kuşağı2x renksiz modda desen arabelleğiiki taraflı gölge teknolojisidonanım gölge haritaları
geometrik gölge optimizasyonu

G8X ailesini temel alan referans kartları için teknik özellikler

haritayonga
yorulmak
ALU'lar/TMU'larçekirdek frekansı (MHz)bellek frekansı (MHz)bellek boyutu (MB)PSP (GB)teksel oranı (Mtex)doldurmak
oran (Mpix)
GeForce 8500 GTG86
PEG16x
16/8 450 400(800) 256 DDR212.8
(128)
3600
GeForce 8600 GTG84
PEG16x
32/16 540 700(1400) 256 GDDR322.4
(128)
8600 4300
GeForce 8600 GTSG84
PEG16x
32/16 675 1000(2000) 256 GDDR332.0
(128)
10800 5400
GeForce 8800 GTS 320MBG80
PEG16x
96/24 500 800(1600) 320GDDR364.0
(320)
12000 10000
GeForce 8800 GTS 640MBG80
PEG16x
96/24 500 800(1600) 640GDDR364.0
(320)
12000 10000
GeForce 8800 GTXG80
PEG16x
128/32> 575 900(1800) 768 GDDR386.4
(384)
18400 13800
GeForce 8800 UltraG80
PEG16x
128/32 612 1080(2160) 768 GDDR3104.0
(384)
19600 14700
GeForce 8800 GT 256MBG92
PEG16x
112/56 600 700(1400) 256 GDDR344.8
(256)
33600 9600
GeForce 8800 GT 512MBG92
PEG16x
112/56 600 900(1800) 512GDDR357.6
(256)
33600 9600
GeForce 8800 GTS 512MBG92
PEG16x
128/64 650 1000(2000) 512GDDR364.0
(256)
41600 10400
GeForce 8800GSG92
PEG16x
96/48 550 800(1600) 384 GDDR338.4
(192)
26400 6600
GeForce 9400 GTG96
PEG16x
16/8 550 800(1600) 256/512 GDDR225.6
(128)
4400 4400
GeForce 9500 GTG96
PEG16x
32/16 550 800(1600) 256/512 GDDR2/GDDR325.6
(128)
8800 4400
GeForce 9600 GSOG92
PEG16x
96/48 550 800(1600) 384 GDDR338.4
(192)
26400 6600
GeForce 9600 GTG94
PEG16x
64/32 650 900(1800) 512GDDR357.6
(256)
20800 10400
GeForce 9800 GTG92
PEG16x
112/56 600 900(1800) 512GDDR357.6
(256)
33600 9600
GeForce 9800 GTXG92
PEG16x
128/64 675 1100(2200) 512GDDR370.4
(256)
43200 10800
GeForce 9800GTX+G92
PEG16x
128/64 738 1100(2200) 512/1024 GDDR370.4
(256)
47200 11800
GeForce 9800 GX22xG92
PEG16x
2x(128/64)600 1000(2000) 2x512 GDDR32x64.0
(2x256)
76800 19200
GeForce GTS 250G92
PEG16x
128/64 738 1100(2200) 512/1024 GDDR370.4
(256)
47200 11800
haritayonga
yorulmak
ALU'lar/TMU'larçekirdek frekansı (MHz)bellek frekansı (MHz)bellek boyutu (MB)PSP (GB)teksel oranı (Mtex)doldurmak
oran (Mpix)

Ayrıntılar: G80, GeForce 8800 ailesi

Özellikler G80

  • GeForce 8800 yongasının resmi adı
  • kod adı G80
  • 90 nm teknolojisi
  • 681 milyon transistör
  • Köşe ve piksel akışı ve diğer olası veri türleri için bir dizi ortak işlemciye sahip birleşik mimari
  • Yeni bir gölgelendirici modeli - Shader Model 4.0, geometri oluşturma ve gölgelendiricilerden ara veri kaydetme (akış çıkışı) dahil olmak üzere en son DirectX 10 yenilikleri için donanım desteği
  • 384 bit bellek veriyolu, 64 bit genişliğinde 6 bağımsız denetleyici, GDDR4 desteği
  • Çekirdek saat hızı 575 GHz (GeForce 8800 GTX)
  • 128 skaler kayan nokta ALU'ları (tam sayı ve kayan nokta biçimleri, IEEE 754 32-bit hassasiyet için FP desteği, saat kaybı olmadan MAD+MUL)
  • ALU'lar frekansın iki katından fazla çalışır (8800 GTX için 1,35 GHz)
  • 32 doku birimi, dokularda FP16 ve FP32 bileşenleri için destek
  • 64 bilinear filtreleme ünitesi (yani, iki kat daha hızlı olan anizotropik filtrelemenin yanı sıra ücretsiz adil trilinear filtreleme mümkündür)
  • - planlama bloğu boyutu - 8x4 (32) piksel.
  • FP16 veya FP32 çerçeve arabellek formatı dahil olmak üzere piksel başına 16 örneğe kadar kenar yumuşatma modlarını destekleyen 6 geniş ROP (24 piksel) (yani HDR + AA mümkündür). Her blok, esnek bir şekilde yapılandırılabilen bir dizi ALU'dan oluşur ve Z, MSAA, harmanlamanın oluşturulmasından ve karşılaştırılmasından sorumludur. Renksiz modda (yalnızca Z) saat başına 96 adede kadar MSAA örneğine (+ 96 Z) kadar tüm alt sistemin en yüksek performansı - saat başına 192 örnek.
  • Tüm arayüzler harici bir ek NVIO çipine yerleştirilmiştir (2 RAMDAC, 2 Çift DVI, HDMI, HDTV)
  • Çok iyi mimari ölçeklenebilirliği, bellek denetleyicilerini ve ROP'ları tek tek engelleyebilir veya kaldırabilirsiniz (toplamda 6 adet), gölgelendirici birimleri (toplamda 8 TMU + ALU)

GeForce 8800 GTX referans kartı özellikleri

  • Çekirdek saat 575 MHz
  • Evrensel işlemcilerin frekansı 1350 MHz
  • Doku birimi sayısı - 32, karıştırma birimi - 24
  • Bellek kapasitesi 768 megabayt
  • Bellek bant genişliği saniyede 86,4 gigabayt.
  • Teorik maksimum doldurma hızı saniyede 13,8 gigapikseldir.
  • Teorik doku getirme hızı saniyede 18.4 gigatexel'dir.
  • SLI konektörü
  • Veriyolu PCI-Express 16x
  • MSRP 599$

GeForce 8800 GTS referans kartı özellikleri

  • Çekirdek frekansı 500 MHz
  • Evrensel işlemcilerin frekansı 1200 MHz
  • Evrensel işlemci sayısı 96
  • Doku blok sayısı - 24, karıştırma blokları - 20
  • Bellek tipi GDDR3, 1.1 ns (standart frekans 2*900 MHz)
  • Bellek kapasitesi 640 megabayt
  • Teorik maksimum doldurma hızı saniyede 10.0 gigapikseldir.
  • Teorik doku getirme hızı saniyede 12.0 gigatexel'dir.
  • İki DVI-I konektörü (Çift Bağlantı, 2560x1600'e kadar çıkış desteklenir)
  • SLI konektörü
  • Veriyolu PCI-Express 16x
  • TV Çıkışı, HDTV Çıkışı, HDCP desteği
  • MSRP 449 $

Mimari

Uzun zamandır birleşik grafik mimarilerine geçişi bekliyorduk. Şimdi bir gerçeği söyleyebiliriz - GeForce 8800'ün ortaya çıkmasıyla bu geçiş gerçekleşti ve kritik zirve çoktan geçildi. Bunu, bu tür mimarilerin kademeli olarak orta ve bütçe segmentlerine inmesi ve uzun vadede çok çekirdekli işlemci mimarileriyle birleşmeye kadar daha da geliştirilmesi izleyecektir. Öyleyse, NVIDIA'nın ilk birleşik mimarisini tanıyalım:

Önümüzde çipin tüm diyagramı var. Çip, 8 evrensel bilgi işlem biriminden (gölgelendirici işlemciler) oluşur ve NVIDIA, her ALU'nun böyle olduğunu belirten 128 işlemciden bahsetmesine rağmen, bu biraz yanlıştır - talimat yürütme birimi, 4 TMU'nun ve 16 ALU'nun gruplandığı bir işlemci birimidir. . Bu nedenle, toplamda 128 ALU ve 32 TMU'ya sahibiz, ancak yürütme ayrıntı düzeyi 8 bloktur, bunların her biri bir anda kendi işini yapabilir, örneğin, bir tepe noktasının veya pikselin veya bir geometri gölgelendiricisinin bir bölümünü yürütebilir. 32 piksellik bir blok (veya karşılık gelen sayıda köşe ve diğer ilkellerden oluşan bir blok). Tüm dallar, geçişler, koşullar vb. tamamen bir bloğa uygulanır ve bu nedenle çok geniş de olsa gölgelendirici işlemci olarak adlandırmak en mantıklısıdır.

Bu tür her işlemcinin kendi birinci düzey önbelleği vardır ve bu önbellek artık yalnızca dokuları değil, aynı zamanda gölgelendirici işlemci tarafından talep edilebilecek diğer verileri de depolar. Ana veri akışının, örneğin işlenmekte olan, gri kardinalin (İş parçacığı İşlemci şemasında işaretlenen blok) kontrolü altında bir daire içinde hareket eden pikseller veya köşeler gibi önbelleğe alınmadığını, aktığını anlamak önemlidir. , günümüzün grafik mimarilerinin ana cazibesi - işlenmiş ilkeller düzeyinde tamamen rastgele erişimin olmaması.

Kontrol bloğu ve 8 hesaplama gölgelendirici işlemcisine ek olarak, bellek denetleyicileri, yazma kuyrukları ve ikinci düzey önbellek ile gruplandırılmış görünürlük algılama, çerçeve arabelleği yazma ve MSAA (mavi, L2 önbellek bloklarının yanında) gerçekleştiren 6 ROP vardır.

Böylece, her iki yönde de sorunsuz bir şekilde ölçeklenebilen çok geniş (her biri 32 piksellik kısımları işleyen 8 blok) bir mimariye sahibiz. Bellek denetleyicileri ve gölgelendirici işlemcileri eklemek veya çıkarmak, tüm sistemin verimini, dengeyi bozmadan veya darboğazlar yaratmadan uygun şekilde ölçeklendirir. Bu, birleşik bir mimarinin ana avantajını uygulayan mantıklı ve güzel bir çözümdür - otomatik denge ve mevcut kaynakların kullanımının yüksek verimliliği.

Gölgelendirici bloklarına ve ROP'a ek olarak, bir dizi kontrol ve yönetim bloğu vardır:

  • Çeşitli formatlarda (Vertex, Geometry ve Pixel Thread Issue) veri yürüten bloklar, veri formatına, mevcut shader ve durumuna, dallanma koşullarına vb.
  • Kurulum/Raster/ZCull - köşeleri piksellere dönüştüren bir blok - kurulum burada gerçekleştirilir, 32 piksellik bloklara üçgen rasterleştirme, ön blok HSR.
  • Input Assembler - sistem belleğinden veya yerel bellekten geometrik ve diğer kaynak verileri seçen bir blok, dışarıdan "atlıkarınca" girişimize gidecek akışlardan kaynak veri yapılarını toplar. Ve çıktıda, tepe noktası, geometri, piksel gölgelendirici ve karıştırma ayarlarının kontrolü altındaki birçok çemberden sonra, ROP bloklarından pikselleri hazır hale getireceğiz (ve gerekirse düzleştireceğiz).

Bu arada, küçük bir arasöz: Gelecekte bu blokların daha genel hale geleceği ve belirli gölgelendirici türlerine bağlı olmayacağı açıktır. Şunlar. basitçe, hesaplama ve format dönüştürme için verileri başlatan evrensel bloklara dönüşecektir - örneğin, bir gölgelendiriciden diğerine, tepe noktasından piksele vb. Bu, mimaride herhangi bir temel değişiklik yapmayacak, daha az sayıda özel “gri” blok dışında diyagram neredeyse aynı görünecek ve çalışacaktır. Zaten, üç Thread Issue bloğunun tümü büyük olasılıkla (gerçekten) ortak işlevselliğe ve bağlamsal eklemelere sahip bir bloktur:

Shader işlemcisi ve TMU/ALU'su

Böylece, 8 gölgelendirici biriminin her birinde 16 skaler ALU vardır. Bu da bize, gölgelendirici kodundan bağımsız olarak, yüklerinin verimliliğini %100'e kadar artırma potansiyelini veriyor. ALU'lar iki katı frekansta çalışır ve bu nedenle aynı çekirdek temel saatinde 8 eski tarz dörtlü vektör ALU'yu (G70) eşleştirir veya onlardan daha iyi performans gösterir (gölgelendiricideki işlemlere bağlı olarak). NVIDIA bu en yüksek performans hesaplamasını verir:

Ancak, iki çarpma gerçekleştiğinde, diğerleri için en olumsuz durum için geçerlidir. Gerçek hayatta, bu avantajı bir buçuk katına bölmeye değer. Ancak, her durumda, bu skaler ALU'lar, daha yüksek saat frekansı ve sayıları nedeniyle, önceden var olan tüm yongaları geçecektir. Yeni mimari için en faydalı olmayan gölgelendiriciler durumunda, belki de SLI konfigürasyonu G71 dışında.

İlginç bir şekilde, tüm ALU'lar FP32 doğrudur ve yeni mimari göz önüne alındığında, hassasiyeti azaltılmış FP16 gölgelendiriciler için herhangi bir avantaj öngörmüyoruz. Bir diğer ilginç nokta ise tamsayı formatındaki hesaplamaların desteklenmesidir. Bu öğe, SM4'ü uygulamak için gereklidir. Aritmetiği uygularken, IEEE 754 standardı gözlenir ve bu da onu oyun dışı ciddi hesaplamalar için uygun hale getirir - bilimsel, istatistiksel, ekonomik vb.

Şimdi tek bir gölgelendirici birimi içindeki doku birimlerinin ve ALU'ların etkileşimi hakkında:

Doku örnekleme ve filtreleme işlemi ALU kaynakları gerektirmez ve artık matematiksel hesaplamalarla tamamen paralel olarak gerçekleştirilebilir. Doku koordinatlarının oluşturulması (şemada - ANCAK) hala biraz ALU zamanını alıyor. Çipin transistörlerini %100'de kullanmak istiyorsak bu mantıklıdır, çünkü doku koordinatlarının oluşturulması standart kayan işlemler gerektirir ve bunun için ayrı ALU'lar başlatmak akıllıca olmaz.

Doku modüllerinin kendileri aşağıdaki konfigürasyona sahiptir:

Doku adresleme TA için 4 modül vardır (örnekleme için tam adresin koordinatlarıyla belirlenir) ve iki doğrusal filtreleme TF için iki kat daha fazla modül vardır. Nedenmiş? Bu, ücretsiz dürüst trilinear filtreleme sağlamak veya anizotropik filtreleme ile hız düşüşünü yarıya indirmek için transistörlerin orta düzeyde tüketimine izin verir. Normal çözünürlüklerde, normal filtrelemede ve AA'sız hız uzun zamandır anlamsızdı - ve önceki nesil hızlandırıcılar bu tür koşullarda iyi başa çıkıyor. Yeni çip ayrıca FP16/FP32 doku formatlarının yanı sıra girişte (TMU) ve çıkışta (ROP) SRGB gama düzeltmesini de destekler.

İşte SM4 gereksinimlerini karşılayan yeni işlemcilerin shader modelinin özellikleri:

Önemli niceliksel ve niteliksel değişiklikler var - gölgelendiriciler için giderek daha az kısıtlama, CPU ile giderek daha fazla ortak. Şimdiye kadar, çok fazla rastgele erişim olmadan (böyle bir işlem SM4'te ortaya çıktı - şemadaki Load Op öğesi, ancak genel amaçlar için etkinliği, özellikle ilk uygulamalarda hala şüphelidir), ancak bu yönün yakında olacağından şüphe yoktur. FP formatları için destek, bu 5 yılda - NV30'daki ilk örneklerden şimdi tüm modlarda toplam, uçtan uca FP32 boru hattına - G80'de geliştirildiği için geliştirilmelidir.

Hatırladığımız gibi 8 shader bloğuna ek olarak 6 adet ROP bloğu mevcut:

Diyagram, Z ve C için iki ayrı yol gösterir, ancak gerçekte, pikselleri renkli işlerken iki gruba ayrılan veya Yalnızca Z modunda işlendiğinde bir grup olarak hareket eden, böylece verimi ikiye katlayan yalnızca bir ALU kümesidir. . Günümüzde, tek tek pikselleri saymanın bir anlamı yok - zaten yeterince var, saat başına kaç MSAA örneğinin işlenebileceğini hesaplamak daha önemlidir. Buna göre, MSAA 16x'te çip, 8x - 12, vb.'de saat başına 6 tam teşekküllü piksel üretebilir. İlginç bir şekilde, çerçeve arabelleği ile çalışmanın ölçeklenebilirliği en iyisidir - hatırladığımız gibi, her ROP birimi kendi bellek denetleyicisi ile çalışır ve komşularına müdahale etmez.

Ve son olarak, kenar yumuşatma ile birlikte FP32 ve FP16 çerçeve arabellek biçimleri için tam destek vardır, artık geliştiricilerin hayal gücü üzerinde herhangi bir kısıtlama yoktur ve tüm boru hattı boyunca HDR, AA modunda bile genel çerçeve yapım sırasını değiştirmeyi gerektirmez .

CSAA

Ayrıca yeni bir yumuşatma yöntemi var - CSAA. Bununla ilgili detaylı bir çalışma yakında sitede olacak, ancak şimdilik, bu yöntemin birçok yönden ATI yaklaşımına benzediğini ve aynı zamanda sözde stokastik desenler ve örneklerin komşu geometrik bölgelere dağılımı (piksel bulaşması) ile ilgilendiğini not ediyoruz. oluşursa, piksellerin keskin bir sınırı yoktur, ancak olduğu gibi, belirli bir bölgeyi kaplayan tz AA ile birbirinin içine geçer). Ayrıca, örneklerin renkleri ve derinlikleri konumlarıyla ilgili bilgilerden ayrı olarak saklanır ve bu nedenle piksel başına 16 örnek olabilir, ancak örneğin yalnızca 8 hesaplanmış derinlik değeri olabilir - bu da ayrıca bant genişliği ve döngü tasarrufu sağlar.

4x'ten daha büyük modlarda klasik MSAA'nın bellek açısından çok talepkar hale geldiği ve kalitenin giderek daha az büyüdüğü bilinmektedir. Yeni yöntem, 4x MSAA ile karşılaştırılabilir bir hesaplama maliyeti ile MSAA 16x'ten belirgin şekilde daha iyi olan 16x kenar yumuşatma moduna izin vererek bunu düzeltir.

görüntü

G80'deki bir diğer yenilik ise ana hızlandırıcı çipin dışına yerleştirilen arayüzlerdir. Artık bunlardan NVIO adlı ayrı bir çip sorumludur:

Bu çipte şunlar bulunur:

  • 2*400MHz RAMDAK
  • 2 * Çift Bağlantılı DVI (veya LVDS)
  • HDTV Çıkışı

Çıktı alt sistemi şöyle görünür:

Kesinlik her zaman bileşen başına 10 bittir. Tabii ki, orta segmentte ve hatta daha çok bütçe çözümlerinde, ayrı bir harici çip korunmayabilir, ancak böyle bir çözümde pahalı kartlar için eksilerden daha fazla artı vardır. Arayüzler çipin önemli bir alanını kaplar, büyük ölçüde girişime bağlıdır ve özel güç gerektirir. Tüm bu sorunları harici bir çiple ortadan kaldırarak, çıkış sinyallerinin kalitesinde ve konfigürasyon esnekliğinde kazanabilir ve ayrıca yerleşik RAMDAC için en uygun modları dikkate alarak zaten karmaşık bir çipin geliştirilmesini karmaşıklaştırmayabilirsiniz.

Ayrıntılar: G84/G86, GeForce 8600 ve 8500 aileleri

Özellikler G84

  • GeForce 8600 yongasının resmi adı
  • kod adı G84
  • 80 nm teknolojisi
  • 289 milyon transistör
  • 675 MHz'e kadar çekirdek hızı (GeForce 8600 GTS)
  • ALU'lar frekansın iki katından fazla çalışır (GeForce 8600 GTS için 1.45 GHz)
  • 16 doku birimi, dokularda FP16 ve FP32 bileşenleri için destek
  • 16 çift doğrusal filtreleme ünitesi (G80 ile karşılaştırıldığında, ücretsiz trilinear filtreleme ve daha hızlı anizotropik filtreleme imkanı yoktur)
  • Piksel ve tepe gölgelendiricilerinde dinamik dallanma imkanı
  • Sonuçları aynı anda 8 çerçeve arabelleğine yazın (MRT)

GeForce 8600 GTS referans kartı özellikleri

  • Çekirdek saat 675 MHz
  • Evrensel işlemcilerin frekansı 1450 MHz
  • Bellek türü GDDR3
  • Bellek kapasitesi 256 megabayt
  • Bellek bant genişliği saniyede 32,0 gigabayt.
  • Teorik maksimum doldurma hızı saniyede 5,4 gigapikseldir.
  • Teorik doku örnekleme hızı saniyede 10.8 gigatexel'dir.
  • 71 W'a kadar güç tüketimi
  • SLI konektörü
  • Veriyolu PCI-Express 16x
  • TV Çıkışı, HDTV Çıkışı, HDCP desteği
  • Tavsiye edilen fiyat 199-229$

GeForce 8600 GT referans kartı özellikleri

  • Çekirdek saat hızı 540 MHz
  • Evrensel işlemcilerin frekansı 1180 MHz
  • Evrensel işlemci sayısı 32
  • Doku birimlerinin sayısı 16 (sentetiklere bakın), karıştırma birimleri 8
  • Bellek türü GDDR3
  • Bellek kapasitesi 256 megabayt
  • Bellek bant genişliği saniyede 22,4 gigabayt.
  • Teorik maksimum doldurma hızı saniyede 4,3 gigapikseldir.
  • Teorik doku getirme hızı saniyede 8,6 gigatexel'dir.
  • 43 W'a kadar güç tüketimi
  • SLI konektörü
  • Veriyolu PCI-Express 16x
  • Tavsiye edilen fiyat 149-159$

G86 özellikleri

  • GeForce 8500 yongasının resmi adı
  • kod adı G86
  • 80 nm teknolojisi
  • 210 milyon transistör
  • Köşe ve piksel akışı ve diğer veri türleri için bir dizi ortak işlemciye sahip birleşik mimari
  • Yeni gölgelendirici modeli Shader Model 4.0 dahil olmak üzere DirectX 10 için donanım desteği, gölgelendiricilerden geometri oluşturma ve ara verileri kaydetme (akış çıkışı)
  • 128 bit bellek veri yolu, iki bağımsız 64 bit geniş denetleyici
  • 450 MHz'e kadar çekirdek hızı (GeForce 8500 GT)
  • ALU'lar çift frekansta çalışır (GeForce 8500 GT için 900 MHz)
  • 16 skaler kayan nokta ALU'su (tam sayı ve kayan nokta biçimleri, IEEE 754 32-bit hassasiyet için FP desteği, saat kaybı olmadan MAD+MUL)
  • 8 doku birimi, dokularda FP16 ve FP32 bileşenleri için destek
  • 8 çift doğrusal filtreleme birimi (G80 ile karşılaştırıldığında, ücretsiz trilineer filtreleme yok ve daha verimli anizotropik filtreleme)
  • Piksel ve tepe gölgelendiricilerinde dinamik dallanma imkanı
  • FP16 veya FP32 çerçeve arabelleği formatı dahil olmak üzere piksel başına 16 örneğe kadar kenar yumuşatma modlarını destekleyen 2 geniş ROP (8 piksel). Her blok, esnek bir şekilde yapılandırılabilen bir dizi ALU'dan oluşur ve Z, MSAA, harmanlamanın oluşturulmasından ve karşılaştırılmasından sorumludur. Renksiz modda (yalnızca Z) saat başına 32 MSAA örneğine (+ 32 Z) kadar tüm alt sistemin en yüksek performansı Saat başına 64 örnek
  • Sonuçları aynı anda 8 çerçeve arabelleğine yazın (MRT)
  • Tüm arayüzler (iki RAMDAC, iki Çift DVI, HDMI, HDTV) çipe entegre edilmiştir (ek bir harici çip üzerine yerleştirilen GeForce 8800 NVIO'nun aksine)

GeForce 8500 GT Referans Kartı Özellikleri

  • Çekirdek saat hızı 450 MHz
  • Evrensel işlemcilerin frekansı 900 MHz
  • Etkin bellek frekansı 800 MHz (2*400 MHz)
  • Bellek türü DDR2
  • Bellek kapasitesi 256/512 megabayt
  • Bellek bant genişliği saniyede 12,8 gigabayt.
  • Teorik maksimum doldurma hızı saniyede 3,6 gigapikseldir.
  • Teorik doku örnekleme hızı saniyede 3,6 gigatexel'dir.
  • 40 W'a kadar güç tüketimi
  • İki DVI-I Dual Link konektörü, 2560x1600'e kadar çözünürlüklerde çıkış desteklenir)
  • SLI konektörü
  • Veriyolu PCI-Express 16x
  • TV Çıkışı, HDTV Çıkışı, isteğe bağlı HDCP desteği
  • Tavsiye edilen fiyat 89-129$

G84 ve G86 mimarisi

Zaten teknik özelliklerden, G84'ün G80 serisinin amiral gemisinin dörtte biri ile üçte biri arasında bir şey olduğu açıktır. Evrensel işlemci sayısı açısından bu çeyrek, ROP sayısı ve bellek denetleyicisi açısından üçte biri. Dokularla daha zor, çeyrek değil, yarım da değil, bunun hakkında aşağıda konuşacağız. Buna karşılık G86, genel olarak bilgi işlem gücü açısından ilginç bir şeydir, G80'in sadece 1/8'idir, ancak ROP açısından hala aynı 1/3'tür. Açıkçası NVIDIA, bilgi işlem hızındaki çipleri alt uçta piyasaya sürmek için acele etmiyor.

Buradaki ana soru, bu çeyrek ve 1/8, mevcut çözümler ve gelecekteki AMD yongaları ile rekabet etmek için yeterli olacak mı? NVIDIA blok sayısını çok azaltmadı mı? Üstelik her iki çipin de transistör sayısı açısından çok küçük olduğunu söylemeye gerek yok... G84'te, G80'de transistörlerin neredeyse yarısı, G86'da neredeyse üçte biri. Karar bir uzlaşma gibi görünüyor, eğer G80 bloklarının yarısını bırakırlarsa, o zaman çipin üretimi çok pahalı olacak ve kendi GeForce 8800 GTS'sine başarılı bir rakip olacaktı.

Yakın bir gelecekte büyük ihtimalle 65 nm teknolojisine dayalı olarak orta ve alt fiyat aralıkları için daha verimli çipler yapmak mümkün olacak ama şimdilik durum böyle çıktı. Sentetik ve oyun testlerinde yeni çiplerin performansı konusunu ele alacağız, ancak şimdiden G84 ve G86'nın az sayıda ALU nedeniyle çok hızlı olmayabileceğini söyleyebiliriz, büyük olasılıkla mevcut çözümlerle yaklaşık olarak eşit olacaklardır. benzer bir fiyata.

G84 ve G86 mimarileri üzerinde çok fazla durmayacağız, G80'e kıyasla çok az değişiklik var, GeForce 8800 incelemesinde söylenen her şey geçerliliğini koruyor, niceliksel özelliklere göre ayarlanmış. Ama yine de, dikkatimizi çeken ana noktaları açıklayalım ve yeni çiplerin mimari özelliklerine ayrılmış birkaç slayt sunalım.

G80, sekiz evrensel bilgi işlem biriminden (gölgelendirici işlemciler) oluşur, NVIDIA 128 işlemciden bahsetmeyi tercih eder. Komut yürütme birimi, görünüşe göre, 4 TMU'nun ve 16 ALU'nun gruplandığı böyle bir bütün işlemci birimidir. Blokların her biri bir anda bir tepe noktası, piksel veya geometri gölgelendiricisinin bir bölümünü 32 piksel, tepe noktası veya diğer temel öğelerden oluşan bir blok üzerinde yürütebilir ve ayrıca fiziksel hesaplamalar yapabilir. Her işlemcinin, dokuları ve diğer verileri depolayan kendi birinci seviye önbelleği vardır. Kontrol birimi ve hesaplama gölgelendirici işlemcilerine ek olarak, görünürlük algılama, çerçeve arabelleği yazma ve MSAA gerçekleştiren, bellek denetleyicileri, yazma kuyrukları ve ikinci düzey bir önbellek ile gruplandırılmış altı ROP vardır.

Bu mimari, yeni çözümlerde yapılan her iki yönde de ölçekleme yeteneğine sahiptir. Birleştirilmiş mimarinin ana avantajını uygulayan bu güzel çözümden daha önce bahsetmiştik otomatik dengeleme ve mevcut kaynakları kullanmanın yüksek verimliliği GeForce 8800 ile ilgili makalede. bilgi işlem birimleri ve iki gölgelendirici işlemciye ve bir ROP'a dayalı çözüm, bütçeye uygun hale gelecektir. Ne yazık ki, GeForce 8800'ün 32 TMU ve 128 ALU'yu oluşturan sekiz işlemcisi varsa, yeni çiplerde sayıları başlangıçta düşündüğümüzden daha fazla azaldı. Görünüşe göre, G84 devresi şöyle görünüyor:

Yani, blok sayısı ve bellek denetleyicileri dışında her şey değişmeden kaldı. Bu resimde görünen bazı küçük doku bloğu değişiklikleri var, ancak bunu daha sonra konuşacağız. Merak ediyorum, G84'te sadece 32 işlemci kaldıysa, bu kadar çok transistör nereye gitti? G84, G80'e kıyasla transistörlerin neredeyse yarısına sahiptir ve önemli ölçüde azaltılmış sayıda bellek kanalı, ROP'ler ve gölgelendirici işlemcileri vardır. Ve G86'da sadece 16 işlemcili çok sayıda transistör var...

Gerçek uygulamalarda yükün tepe noktası, piksel ve geometri gölgelendiricilerinin yürütülmesi arasında ne kadar iyi dengeleneceği de ilginçtir, çünkü evrensel yürütme birimlerinin sayısı artık çok daha küçük hale gelmiştir. Ayrıca, birleşik mimarinin kendisi geliştiriciler için yeni zorluklar ortaya çıkarır, onu kullanırken köşe, piksel ve geometri gölgelendiricileri arasındaki toplam gücü nasıl etkili bir şekilde kullanacağınızı düşünmeniz gerekir. Piksel hesaplamalarına basit bir örnek vurgu yapalım. Bu durumda, geleneksel mimaride köşe blokları üzerindeki yükün artması performansta bir düşüşe yol açmayacak, ancak birleşik olanda dengeyi değiştirecek ve piksel hesaplamaları için kaynak miktarını azaltacaktır. Performans konusunu kesinlikle ele alacağız ve şimdi G84 ve G86'nın mimarisindeki değişiklikleri incelemeye devam edeceğiz.

Gölgelendirici işlemci ve TMU/ALU

Gölgelendirici birimlerinin şeması ve G80'in en yüksek hesaplama performansının değerlendirilmesi ilgili makalede verilmiştir, G84 ve G86 için şema değişmemiştir ve performanslarının yeniden hesaplanması kolaydır. Çiplerdeki ALU'lar ayrıca iki katı frekansta çalışır ve skalerdir, bu da yüksek verimliliğe izin verir. İşlevsellikte de hiçbir fark yoktur, tüm ALU'ların doğruluğu FP32'dir, tamsayı formatında hesaplamalar için destek vardır ve uygulama, bilimsel, istatistiksel, ekonomik ve diğer hesaplamalar için önemli olan IEEE 754 standardına uygundur.

Ancak doku modülleri G80'de kullanılanlara kıyasla değişti, NVIDIA, birleşik işlemcilerin performansını artırmak için yeni yongalarda mimari değişiklikler yapıldığını garanti ediyor. G80'de, her doku birimi dört doku adresi hesaplayabilir ve saat başına sekiz doku filtreleme işlemi gerçekleştirebilir. Yeni çiplerde ilk sayının iki katına çıkarıldığı ve doku getirme sayısının iki katına çıkabildiği iddia ediliyor. Yani, G84 ve G86 doku modülleri aşağıdaki konfigürasyona sahiptir (karşılaştırma için, G80 bloğunun şeması solda gösterilmektedir):

NVIDIA'ya göre, artık blokların her biri sekiz doku adresleme modülüne (örnekleme için tam adresin koordinatlarıyla belirlenir) TA ve tam olarak aynı sayıda çift doğrusal filtreleme modülüne (TF) sahiptir. G80'de dört TA ve sekiz TF modülü vardı, bu da azaltılmış transistör tüketimi ile "serbest" trilinear filtreleme sağlamayı veya anizotropik filtrelemenin neredeyse her zaman olduğu üst düzey hızlandırıcılar için yararlı olan anizotropik filtreleme ile hız düşüşünü yarıya indirmeyi mümkün kıldı. kullanıcılar tarafından kullanılır. Bu bilgilerin doğruluğunu pratik kısımda kontrol edeceğiz, bu verilerle çeliştiği için ilgili sentetik testlerin analizine mutlaka bakın.

Doku birimlerinin diğer tüm işlevleri aynıdır, FP16/FP32 doku biçimleri desteklenir, vb. Yalnızca G80'de FP16 doku filtreleme de iki kat artan filtre birimi nedeniyle tam hızdaysa, bu artık çözümlerde geçerli değildir. orta ve alt seviyelerin (yine, yukarıdaki değişikliklerin gerçekten var olması şartıyla).

ROP blokları, çerçeve arabelleği yazma, kenar yumuşatma

G80'de altı ve yeni yongalarda iki olan ROP blokları değişmedi:

Blokların her biri, renk ve Z için saat başına toplam 8 piksel olmak üzere dört piksel (16 alt piksel) işler. Yalnızca Z modunda, saat başına iki kat daha fazla örnek işlenir. MSAA 16x'te çip, 4x 8'de, vb.'de saat başına iki piksel üretebilir. G80'de olduğu gibi, kenar yumuşatma ile birlikte FP32 ve FP16 çerçeve arabellek biçimleri için tam destek vardır.

İlgili makalede ayrıntılı olarak açıklanan GeForce 8800 Kapsama Örnekli Kenar Yumuşatma (CSAA)'dan bilinen yeni kenar yumuşatma yöntemi desteklenir:

Kısacası, yöntemin özü, örneklerin renklerinin ve derinliğinin, konumlarıyla ilgili bilgilerden ayrı olarak saklanması, piksel başına 16 örnek olabilmesi ve yalnızca 8 hesaplanmış derinlik değeri olması, bant genişliği ve döngü tasarrufu sağlamasıdır. CSAA, alt piksel başına tek bir renk veya Z değeri geçirip depolamaktan kurtulur ve ortalama ekran piksel değerini, bu pikselin üçgenlerin kenarlarıyla nasıl örtüştüğü hakkında daha fazla ayrıntıyla hassaslaştırır. Sonuç olarak, yeni yöntem, MSAA 4x'ten belirgin şekilde daha iyi olan 16x kenar yumuşatma modu elde etmeyi mümkün kılıyor ve buna benzer hesaplama maliyetleri var. Ve CSAA yönteminin çalışmadığı nadir durumlarda, tam bir kenar yumuşatma yokluğu değil, normal MSAA'yı daha düşük derecede alırsınız.

Saf Video HD

Gelelim en ilginç değişikliklere. G84 ve G86'nın onları G80'den bile ayıran yeniliklere sahip olduğu ortaya çıktı! Bu, yeni çiplerde PureVideo HD için genişletilmiş destek alan yerleşik video işlemcisiyle ilgilidir. Bu yongaların, en "ağır" H.264 formatı da dahil olmak üzere her türlü yaygın video verisinin kodunu çözerken sistemin merkezi işlemcisini tamamen boşalttığı belirtiliyor.

G84 ve G86, G80'de kullanılandan daha güçlü ve sözde BSP motorunu içeren yeni bir programlanabilir PureVideo HD video işlemcisi kullanır. Yeni işlemci, 1920x1080'e kadar çözünürlükler ve 30-40 Mbps'ye kadar bit hızları ile H.264, VC-1 ve MPEG-2 formatlarını deşifre etmeyi destekler, donanımdaki CABAC ve CAVLC verilerinin kodunu çözmenin tüm işini yapar, bu da size izin verir. orta sınıf tek çekirdekli bilgisayarlarda bile mevcut tüm HD-DVD ve Blu-ray diskleri oynatın.

G84/G86'daki video işlemcisi birkaç bölümden oluşur: MPEG2, VC-1 ve H.264 formatları için IDCT, hareket telafisi ve engelleme artefaktı kaldırma görevlerini yerine getiren ikinci nesil Video İşlemcisinin (VP2) kendisi, donanımı destekler ikinci akımın kodunun çözülmesi; H.264 formatı için CABAC ve CAVLC istatistiksel kod çözme görevlerini yerine getiren bir akış işlemcisi (BSP) ve bu, en çok zaman alan hesaplamalardan biridir; Amacı adından belli olan AES128 korumalı veri kod çözme motoru, Blu-ray ve HD-DVD disklerde kopya korumasında kullanılan video verilerinin şifresini çözer. Farklı video çiplerinde video kod çözme için donanım desteği derecesindeki farklılıklar şunlardır:

Video çipi tarafından gerçekleştirilen görevler mavi renkle ve merkezi işlemci tarafından gerçekleştirilen görevler yeşil renkle vurgulanır. Gördüğünüz gibi, önceki nesil işlemciye yalnızca görevlerin bir kısmında yardımcı olduysa, en son yongalarda kullanılan yeni video işlemcisi tüm görevleri kendisi yapıyor. Donanım video kod çözme etkinliğinin incelenmesi üzerine gelecekteki malzemelerdeki çözümlerin etkinliğini kontrol edeceğiz, NVIDIA ayrıca malzemelerde aşağıdaki rakamlardan da bahseder: modern bir çift çekirdekli işlemci ve yazılım veri kod çözme, Blu-ray oynatma ve HD-DVD diskler, G84 ve G86 için geliştirdikleri yeni motor ile aynı sistemdeki önceki nesil bir video çipinde %60-70'e varan donanım kod çözme ile işlemci süresinin %90-100'ünü tüketiyor. sadece %20. Bu, elbette, bildirilen tam donanım kod çözme gibi görünmüyor, ancak yine de çok, çok etkili.

Duyuru sırasında PureVideo HD'de sunulan yeni özellikler yalnızca 32-bit Windows Vista'da çalışırken, Windows XP'de PureVideo HD desteği yalnızca yaz aylarında sunulacak. Video oynatma, işlem sonrası, deinterlacing vb. kalitesi ile ilgili olarak, NVIDIA'nın performansı GeForce 8800'de bile arttı ve yeni yongalar bu açıdan farklı değil.

CUDA, oyun dışı ve fizik hesaplamaları

GeForce 8800 ile ilgili bir makale, yeni hızlandırıcılarda artan yüzer aritmetik performansının ve birleşik gölgelendirici mimarisinin esnekliğinin, oyun uygulamalarında ve hatta daha ciddi görevlerde fiziği hesaplamak için yeterli hale geldiğinden bahsetti: matematiksel ve fiziksel modelleme, ekonomik ve istatistiksel modeller ve hesaplamalar, örüntü tanıma, görüntüleme, bilimsel grafikler ve daha fazlası. Bunun için, hesaplamaları GPU CUDA'ya (Compute Unified Device Architecture) kaydıran programları uyarlamak ve geliştirmek için uygun olan özel bir hesaplama odaklı API yayınlandı.

CUDA hakkında daha fazla bilgi G80 hakkındaki makalede yazılmıştır, son zamanlarda GPU'daki fiziksel hesaplamaları destekleyen bir modaya daha odaklanacağız. NVIDIA, teknolojisine Kuantum Efektleri adını veriyor. Bugün düşünülen G84 ve G86 da dahil olmak üzere yeni neslin tüm video çiplerinin bu tür hesaplamalar için çok uygun olduğu ve yükün bir kısmını CPU'dan GPU'ya aktarmanıza izin verdiği açıklandı. Duman, yangın, patlamalar, saç ve giysi dinamikleri, yün ve sıvılar ve çok daha fazlasının simülasyonları özel örnekler olarak verilmiştir. Ama şimdilik, başka bir şey hakkında daha fazla yazmak istiyorum. Şimdiye kadar sadece video çipleri tarafından hesaplanan çok sayıda fiziksel nesneye sahip test uygulamalarından resimlerin gösterilmesi ve bu tür desteğe sahip oyunların henüz kokmaması bile.

Harici arayüzler için destek

Hatırladığımız gibi, GeForce 8800'de beklenmedik bir yenilik daha bizi şaşırtmıştı - ana arayüzün dışına yerleştirilmiş harici arayüzleri destekleyen ek bir çip. Üst düzey video kartları söz konusu olduğunda, bu görevler NVIO adı verilen ve iki adet 400 MHz RAMDAC, iki adet Dual Link DVI (veya LVDS), HDTV-Out'u entegre eden ayrı bir çip tarafından gerçekleştirilir. O zaman bile, ayrı bir harici çipin orta ve alt segmentlerde zor kalacağını varsaydık ve bu gerçekten oldu. G84 ve G86'da, tüm bu arayüzler için destek yonganın kendisinde yerleşiktir.

GeForce 8600 GTS, HDCP destekli iki adet Dual Link DVI-I çıkışına sahiptir, bu özelliklere sahip (HDCP ve Dual Link birlikte) piyasadaki ilk video kartıdır. HDMI'ya gelince, bu konektör desteği tamamen donanımda uygulanmaktadır ve üreticiler tarafından özel tasarımlı kartlarda uygulanabilir. Ancak GeForce 8600 GT ve 8500 GT için HDCP ve HDMI desteği isteğe bağlıdır, ancak bireysel üreticiler tarafından ürünlerinde uygulanabilirler.

Ayrıntılar: G92, GeForce 8800 ailesi

Özellikler G92

  • Çip kod adı G92
  • 65 nm teknolojisi
  • 754 milyon transistör (G80'den fazla)
  • Köşe ve piksel akışı ve diğer veri türleri için bir dizi ortak işlemciye sahip birleşik mimari
  • Çekirdek saat hızı 600 MHz (GeForce 8800 GT)
  • ALU'lar frekansın iki katından fazla çalışır (GeForce 8800 GT için 1,5 GHz)
  • 112 (GeForce 8800 GT için, muhtemelen toplamda 128) kayan noktalı skaler ALU'lar (tamsayı ve kayan nokta biçimleri, 32-bit IEEE 754 hassasiyeti için FP desteği, saat kaybı olmadan MAD+MUL)
  • Dokularda FP16 ve FP32 bileşenlerini destekleyen 56 (64) doku adres birimi (aşağıdaki açıklamalara bakın)
  • 56 (64) çift doğrusal filtreleme bloğu (G84 ve G86'da olduğu gibi, serbest trilineer filtreleme yok ve daha verimli anizotropik filtreleme)
  • Piksel ve tepe gölgelendiricilerinde dinamik dallanma imkanı
  • Sonuçları aynı anda 8 çerçeve arabelleğine yazın (MRT)
  • Tüm arayüzler (iki RAMDAC, iki Çift DVI, HDMI, HDTV) çipe entegre edilmiştir (ek bir harici çip üzerine yerleştirilen GeForce 8800 NVIO'nun aksine)

GeForce 8800 GT 512MB referans kartı özellikleri

  • Çekirdek frekansı 600 MHz
  • Etkin bellek frekansı 1.8 GHz (2*900 MHz)
  • Bellek türü GDDR3
  • Bellek kapasitesi 512 megabayt
  • 110 W'a kadar güç tüketimi
  • İki DVI-I Dual Link konektörü, 2560x1600'e kadar çözünürlüklerde çıkışı destekler
  • SLI konektörü
  • PCI Express 2.0 veri yolu
  • TV Çıkışı, HDTV Çıkışı, HDCP desteği
  • MSRP 249$

GeForce 8800 GT 256MB referans kartı özellikleri

  • Çekirdek frekansı 600 MHz
  • Evrensel işlemcilerin frekansı 1500 MHz
  • Evrensel işlemci sayısı 112
  • Doku birimi sayısı 56, harmanlama birimi 16
  • Etkin bellek frekansı 1.4 GHz (2*700 MHz)
  • Bellek türü GDDR3
  • Bellek kapasitesi 256 megabayt
  • Bellek bant genişliği saniyede 44,8 gigabayt.
  • Teorik maksimum doldurma hızı saniyede 9,6 gigapikseldir.
  • Saniyede 33,6 gigatexele kadar teorik doku örnekleme hızı.
  • 110 W'a kadar güç tüketimi
  • İki DVI-I Dual Link konektörü, 2560x1600'e kadar çözünürlüklerde çıkışı destekler
  • SLI konektörü
  • PCI Express 2.0 veri yolu
  • TV Çıkışı, HDTV Çıkışı, HDCP desteği
  • Tavsiye edilen fiyat 199$

GeForce 8800 GTS 512MB referans kartı özellikleri

  • Çekirdek saat 650 MHz
  • Evrensel işlemci sayısı 128
  • Etkili bellek frekansı 2.0 GHz (2*1000 MHz)
  • Bellek türü GDDR3
  • Bellek kapasitesi 512 megabayt
  • Bellek bant genişliği saniyede 64,0 gigabayt.
  • Saniyede 41.6 gigatexele kadar teorik doku örnekleme hızı.
  • İki DVI-I Dual Link konektörü, 2560x1600'e kadar çözünürlüklerde çıkışı destekler
  • SLI konektörü
  • PCI Express 2.0 veri yolu
  • TV Çıkışı, HDTV Çıkışı, HDCP desteği
  • Tavsiye edilen fiyat 349-399$

G92 çip mimarisi

G92, mimari olarak G80'den pek farklı değil. Bildiğimiz kadarıyla, G92'nin küçük değişikliklerle yeni bir proses teknolojisine aktarılan hattın (G80) amiral gemisi olduğunu söyleyebiliriz. NVIDIA, malzemelerinde çipin 7 büyük gölgelendirici birimine ve buna bağlı olarak 56 doku birimine ve dört geniş ROP'ye sahip olduğunu belirtir, çipteki transistörlerin sayısı bir şey söylemediklerine dair şüpheler uyandırır. Başlangıçta duyurulan çözümler çipte fiziksel olarak bulunan tüm blokları içermiyor, G92'deki sayıları GeForce 8800 GT'deki aktif blokların sayısından daha fazla. Çipin artan karmaşıklığı, daha önce ayrı bir NVIO yongasının yanı sıra yeni nesil bir video işlemcisinin dahil edilmesinden kaynaklanıyor. Ek olarak, transistör sayısı da karmaşık TMU'lardan etkilenmiştir. Ayrıca, 256 bit bellek veri yolunun kullanım verimliliğini artırmak için önbelleklerin artırılmış olması da muhtemeldir.

Bu sefer, karşılık gelen AMD yongalarıyla rekabet edebilmek için NVIDIA, orta uç yongasında oldukça fazla sayıda blok bırakmaya karar verdi. G84 ve G86 incelemesinden elde ettiğimiz varsayım, 65 nm teknolojisine dayalı olarak orta fiyat aralığı için çok daha verimli çipler piyasaya sürecekleri yönünde doğrulandı. G92 yongasında çok az mimari değişiklik var ve bunun üzerinde ayrıntılı olarak durmayacağız. GeForce 8 serisinin çözümleri hakkında yukarıda söylenen her şey geçerliliğini koruyor, biz sadece yeni çipin mimari özellikleriyle ilgili bazı ana noktaları tekrarlayacağız.

Yeni çözüm için NVIDIA, belgelerinde aşağıdaki şemayı sunmaktadır:

Yani, tüm değişikliklerden yalnızca azaltılmış sayıda blok ve aşağıda açıklanan TMU'daki bazı değişiklikler. Yukarıda bahsedildiği gibi fiziksel olarak bunun böyle olduğuna dair şüpheler var ama biz NVIDIA'nın yazdıklarına göre bir açıklama yapıyoruz. G92 yedi evrensel bilgi işlem biriminden (gölgelendirici işlemciler) oluşur, NVIDIA geleneksel olarak 112 işlemciden bahseder (en azından ilk GeForce 8800 GT çözümlerinde). 8 TMU ve 16 ALU'nun gruplandığı blokların her biri, bir tepe noktası, piksel veya geometri gölgelendiricisinin bir bölümünü 32 piksel, tepe noktası veya diğer ilkellerden oluşan bir blok üzerinde yürütebilir ve ayrıca diğer (grafiksel olmayan) hesaplamaları da yapabilir. Her işlemcinin, dokuları ve diğer verileri depolayan kendi birinci seviye önbelleği vardır. Kontrol ünitesi ve bilgi işlem gölgelendirici işlemcilerine ek olarak, görünürlük algılama, çerçeve arabelleği yazma ve MSAA gerçekleştiren, bellek denetleyicileri, yazma kuyrukları ve ikinci düzey bir önbellek ile gruplandırılmış dört ROP vardır.

Genel Amaçlı İşlemciler ve TMU'lar

Gölgelendirici birimlerinin şeması ve G80'in en yüksek hesaplama performansının değerlendirilmesi ilgili makalede verilmiştir, G92 için değişmemiştir, saat frekansındaki değişikliklere dayalı olarak performanslarını yeniden hesaplamak zor değildir. Çiplerdeki ALU'lar frekansın iki katından fazlasında çalışırlar, skalerdir, bu da yüksek verimliliğe izin verir. İşlevsel farklılıklar hakkında, bu çipte FP64 hesaplamalarının doğruluğunun olup olmadığı hala bilinmiyor. Tamsayı formatında hesaplamalar için kesinlikle destek vardır ve tüm hesaplamaların uygulanması bilimsel, istatistiksel, ekonomik ve diğer hesaplamalar için önemli olan IEEE 754 standardına uygundur.

G92'deki doku birimleri G80'dekiyle aynı değil, performansı artırmak için mimari değişikliklerin yapıldığı G84 ve G86'da TMU çözümünü tekrarlıyor. G80'de her doku biriminin dört doku adresi hesaplayabildiğini ve saat başına sekiz doku filtreleme işlemi gerçekleştirebildiğini, G84/G86'da ise TMU'ların iki kat daha fazla doku getirme yeteneğine sahip olduğunu hatırlayın. Yani, blokların her biri sekiz doku adresleme modülüne (örnekleme için tam adresin koordinatları ile belirlenir) TA ve tam olarak aynı sayıda çift doğrusal filtreleme modülüne (TF) sahiptir:

Gerçek uygulamalarda 56 blok GeForce 8800 GT'nin GeForce 8800 GTX'de 32 bloktan daha güçlü olacağını düşünmemelisiniz. Trilinear ve/veya anizotropik filtreleme etkinleştirildiğinde, doku örneklerini filtrelemek için biraz daha fazla iş yapabildikleri için ikincisi daha hızlı olacaktır. İlgili sentetik testlerin sonuçlarını analiz ederek bu bilgiyi pratik kısımda doğrulayacağız. Doku birimlerinin diğer tüm işlevleri değişmedi, doku biçimleri FP16, FP32 ve diğerleri destekleniyor.

ROP blokları, çerçeve arabelleği yazma, kenar yumuşatma

ROP bloklarının kendileri de değişmedi, ancak sayıları değişti. G80'de altı ROP vardı ve yeni çözümde çiplerin ve PCB video kartlarının üretim maliyetini azaltmak için bunlardan dördü var. Ayrıca bu kesinti, mevcut üst düzey çözümlerle çok fazla rekabet yaratmamasından kaynaklanıyor olabilir.

Blokların her biri, renk ve Z için saat başına toplam 16 piksel olmak üzere dört piksel veya 16 alt pikseli işler. Yalnızca Z modunda, saat başına iki kat daha fazla örnek işlenir. MSAA 16x'te çip, 4x 8'de, vb.'de saat başına iki piksel üretebilir. G80'de olduğu gibi, FP32 ve FP16 çerçeve arabellek biçimleri, kenar yumuşatma ile birlikte tam olarak desteklenir.

Serideki önceki yongalardan bilinen yeni bir kenar yumuşatma yöntemi olan Kapsama Örnekli Kenar Yumuşatma (CSAA) desteklenir. Diğer bir yenilik ise GeForce 8800 GT'nin şeffaflık yumuşatma algoritmasını güncellemesidir. Kullanıcıya seçebileceği iki seçenek sunuldu: çoklu örnekleme (TRMS) ve süper örnekleme (TRSS), ilki çok iyi bir performansa sahipti, ancak tüm oyunlarda etkili bir şekilde çalışmadı ve ikincisi yüksek kalitede, ancak yavaştı. GeForce 8800 GT, yarı saydam yüzeylerin kalitesini ve performansını artıran yeni bir çoklu örnekleme yöntemini ilan ediyor. Bu algoritma, süper örnekleme ile hemen hemen aynı kalite iyileştirmesini sağlar, ancak yarı saydam yüzey kenar yumuşatma etkinleştirilmeden mod için yalnızca yüzde birkaç daha kötü olan yüksek bir performansa sahiptir.

Saf Video HD

G92'de beklenen değişikliklerden biri, G84 ve G86'dan bilinen ve PureVideo HD için gelişmiş destek alan ikinci nesil entegre video işlemcisiydi. Video işlemcisinin bu sürümünün, "ağır" H.264 ve VC-1 biçimleri de dahil olmak üzere her tür video verisinin kodunu çözerken CPU'yu neredeyse tamamen boşalttığı zaten biliniyor.

G84/G86 gibi, G92 de BSP motorunu içeren yeni bir programlanabilir PureVideo HD video işlemcisi kullanır. Yeni işlemci, 1920x1080'e kadar çözünürlük ve 30-40 Mbps'ye kadar bit hızları ile H.264, VC-1 ve MPEG-2 formatlarının kodunun çözülmesini destekler, donanımda CABAC ve CAVLC verilerinin kodunu çözme işini yapar, bu da oynamanıza izin verir. ortalama tek çekirdekli PC'lerde bile mevcut tüm HD-DVD ve Blu-ray sürücüleri. VC-1 kod çözme H.264 kadar verimli değildir, ancak yine de yeni işlemci tarafından desteklenmektedir.

İkinci nesil video işlemcisi hakkında daha fazla bilgiyi G84 ve G86 yongalarına ayrılmış bölümde okuyabilirsiniz. Modern video çözümlerinin çalışması, donanım video kod çözme etkinliğinin incelenmesiyle ilgili en son materyalde kısmen test edildi.

PCI Ekspres 2.0

G92'deki gerçek yeniliklerden biri, PCI Express 2.0 veri yolu desteğidir. PCI Express'in ikinci sürümü, standart bant genişliğini 2,5 Gb/sn'den 5 Gb/sn'ye ikiye katlayarak, sürüm 1 için 4 Gb/sn'nin aksine, her yönde 8 Gb/sn'ye kadar veri aktarabilen x16 yuvaları ile sonuçlanır. .x. Aynı zamanda, PCI Express 2.0'ın PCI Express 1.1 ile uyumlu olması ve eski video kartlarının yeni anakartlarda çalışması ve ikinci sürümü destekleyen yeni video kartlarının desteksiz kartlarda çalışmaya devam etmesi çok önemlidir. Harici güç kaynağının yeterli olması ve elbette arayüz bant genişliğini artırmaması şartıyla.

Mevcut PCI Express 1.0 ve 1.1 çözümleriyle geriye dönük uyumluluk sağlamak için 2.0 özelliği, hem 2.5 Gb/s hem de 5 Gb/s aktarım hızlarını destekler. PCI Express 2.0 geriye dönük uyumluluk, 5,0 Gb/sn yuvalardaki eski 2,5 Gb/sn çözümlerin daha düşük hızlarda çalışmasına olanak tanırken, 2.0 özelliklerine göre tasarlanmış bir aygıt hem 2,5 Gb/sn hem de 5 Gb/sn hızları destekleyebilir. Teoride uyumluluk iyidir, ancak pratikte bazı anakart ve genişletme kartları kombinasyonları sorunlara neden olabilir.

Harici arayüzler için destek

Beklendiği gibi, GeForce 8800 kartlarında bulunan ve ana kartın dışına yerleştirilen harici arayüzleri destekleyen ek NVIO yongası (iki adet 400 MHz RAMDAC, iki adet Dual Link DVI (veya LVDS), HDTV-Çıkış), bu durumda bu karta dahil edildi. çipin kendisi , tüm bu arayüzler için destek G92'nin kendisinde yerleşiktir.

GeForce 8800 GT video kartlarında genellikle HDCP destekli iki Dual Link DVI-I çıkışı bulunur. HDMI'ya gelince, bu konektör desteği tamamen uygulanır, üreticiler tarafından biraz sonra piyasaya sürülebilecek özel tasarımlı kartlara uygulanabilir. Bir video kartında bir HDMI konektörünün bulunması tamamen isteğe bağlı olsa da, çoğu modern video kartında bulunan DVI'dan HDMI'ya bir adaptör ile başarılı bir şekilde değiştirilecektir.

AMD'nin RADEON HD 2000 serisi video kartlarından farklı olarak GeForce 8800 GT, bir HDMI adaptörü kullanarak DVI üzerinden ses iletimini desteklemek için gereken yerleşik bir ses yongası içermez. Video ve ses sinyallerini tek bir konektör üzerinden iletme olasılığı, her şeyden önce, küçük medya merkezlerine takılan orta sınıf ve alt uç kartlarda talep edilmektedir ve GeForce 8800 GT bu rol için pek uygun değildir. .

Ayrıntılar: G94, GeForce 9600 ailesi

G94 özellikleri

  • Çip kod adı G94
  • 65 nm teknolojisi
  • 505 milyon transistör
  • Köşe ve piksel akışı ve diğer veri türleri için bir dizi ortak işlemciye sahip birleşik mimari
  • Gölgelendirici modeli Shader Model 4.0, geometri oluşturma ve gölgelendiricilerden ara veri kaydetme (akış çıkışı) dahil DirectX 10 için donanım desteği
  • 256 bit bellek veri yolu, dört bağımsız 64 bit geniş denetleyici
  • Çekirdek saat hızı 650 MHz (GeForce 9600 GT)
  • ALU'lar frekansın iki katından fazla çalışır (GeForce 9600 GT için 1.625 GHz)
  • 64 skaler kayan nokta ALU'ları (tam sayı ve kayan nokta biçimleri, 32 bit IEEE 754 hassasiyeti için FP desteği, saat kaybı olmadan MAD+MUL)
  • Dokularda FP16 ve FP32 bileşenlerini destekleyen 32 doku adres birimi
  • 32 çift doğrusal filtreleme bloğu (G84 ve G92'de olduğu gibi, bu artan sayıda çift doğrusal örnek verir, ancak serbest trilineer filtreleme ve etkili anizotropik filtreleme olmadan)
  • Piksel ve tepe gölgelendiricilerinde dinamik dallanma imkanı
  • FP16 veya FP32 çerçeve arabelleği formatı dahil olmak üzere piksel başına 16 örneğe kadar kenar yumuşatma modlarını destekleyen 4 geniş ROP (16 piksel). Her blok, esnek bir şekilde yapılandırılabilen bir dizi ALU'dan oluşur ve Z, MSAA, harmanlamanın oluşturulmasından ve karşılaştırılmasından sorumludur. Tüm alt sistemin en yüksek performansı, renksiz modda (yalnızca Z) saat başına 64 MSAA örneğine (+ 64 Z) kadar saat başına 128 örnek
  • Sonuçları aynı anda 8 çerçeve arabelleğine yazın (MRT)

GeForce 9600 GT Referans Kartı Özellikleri

  • Çekirdek saat 650 MHz
  • Evrensel işlemcilerin frekansı 1625 MHz
  • Evrensel işlemci sayısı 64
  • Doku birimi sayısı 32, harmanlama birimi 16
  • Etkin bellek frekansı 1.8 GHz (2*900 MHz)
  • Bellek türü GDDR3
  • Bellek kapasitesi 512 megabayt
  • Bellek bant genişliği saniyede 57,6 gigabayt.
  • Teorik maksimum doldurma hızı saniyede 10.4 gigapikseldir.
  • Saniyede 20,8 gigatexele kadar teorik doku örnekleme hızı.
  • İki DVI-I Dual Link konektörü, 2560x1600'e kadar çözünürlüklerde çıkışı destekler
  • SLI konektörü
  • PCI Express 2.0 veri yolu
  • 95 W'a kadar güç tüketimi
  • Tavsiye edilen fiyat $169-189

G94 mimarisi

Mimari açıdan G94, G92'den yalnızca niceliksel özelliklerde farklıdır, daha az sayıda yürütme birimine sahiptir: ALU ve TMU. Ve G8x'ten çok fazla fark yok. Daha önceki materyallerde yazıldığı gibi, G9x çip serisi, küçük mimari değişikliklerle yeni bir proses teknolojisine aktarılmış, biraz değiştirilmiş bir G8x hattıdır. Yeni orta uç çipte 4 büyük gölgelendirici birimi (toplamda 64 ALU) ve 32 doku biriminin yanı sıra dört geniş ROP bulunur.

Bu nedenle, çipte çok az mimari değişiklik var, hemen hemen hepsi yukarıda açıklanmıştır ve önceki çözümler için daha önce söylenen her şey geçerliliğini korumaktadır. Ve burada sadece G94 çipinin ana şemasını veriyoruz:

G94'teki doku blokları, G84/G86 ve G92'deki ile tamamen aynıdır, G80'e kıyasla iki kat daha fazla çift doğrusal filtrelenmiş doku örneği seçebilirler. Ancak gerçek uygulamalarda GeForce 9600 GT'nin 32 doku birimi, yalnızca daha yüksek GPU frekansı nedeniyle GeForce 8800 GTX'in 32 biriminden daha hızlı çalışmayacaktır. Bu, yalnızca, örneğin paralaks haritalamada, yalnızca filtrelenmemiş örneklerin kullanıldığı algoritmalarda, son derece nadir olan trilinear ve anizotropik filtreleme kapatıldığında gözlemlenebilir.

Özellikle G9x ve GeForce 9600 GT'nin bir diğer avantajı, NVIDIA, ROP bloklarında uygulanan bazı yeni sıkıştırma teknolojilerini değerlendiriyor ve bunlara göre önceki yongalarda kullanılandan %15 daha verimli çalışıyor. Görünüşe göre bunlar, daha önce yazdığımız 320/384-bit'e kıyasla 256-bit bellek veriyolunun daha yüksek verimliliğini sağlamak için tasarlanmış G9x'teki mimari modifikasyonların aynısıdır. Doğal olarak, gerçek uygulamalarda bu kadar büyük bir fark olmayacaktır, NVIDIA'nın kendisine göre bile, ROP'taki yeniliklerden kaynaklanan artış çoğu zaman sadece %5 civarındadır.

Aşağıda tartışacağımız çipe karmaşıklık katan G9x mimarisindeki tüm değişikliklere rağmen çipteki transistör sayısı oldukça fazla. Muhtemelen, GPU'nun bu karmaşıklığı, ayrı bir NVIO yongasının, yeni nesil bir video işlemcisinin, TMU ve ROP birimlerinin karmaşıklığının yanı sıra diğer gizli değişikliklerin dahil edilmesiyle açıklanmaktadır: önbellek boyutlarının değiştirilmesi vb.

Saf Video HD

G84/G86 ve G92'den bilinen aynı ikinci nesil video işlemcisi, G94'te yerleşiktir ve PureVideo HD için geliştirilmiş destek sunar. 1920x1080'e kadar çözünürlüklerde ve 30-40 Mbps'ye kadar bit hızlarında H.264, VC-1 ve MPEG-2 dahil olmak üzere en yaygın video verilerinin kodunu çözerken CPU'yu neredeyse tamamen boşaltır, kod çözme işini tamamen donanımda yapar . NVIDIA'nın VC-1 kod çözme özelliği H.264 kadar verimli olmasa da, sürecin küçük bir kısmı CPU gücünü kullanır, ancak yine de ortalama bilgisayarlarda bile mevcut tüm HD DVD ve Blu-Ray disklerini oynatmanıza izin verir. İkinci nesil video işlemcisi hakkında daha fazla bilgiyi makalenin başında verilen G84/G86 ve G92 incelemelerimizde okuyabilirsiniz.

GeForce 9600 GT'nin piyasaya sürülmesiyle aynı zamana denk gelen PureVideo HD yazılım geliştirmelerini not etmek isteriz. PureVideo HD'nin en son yenilikleri arasında çift akışlı kod çözme, kontrastta dinamik değişiklik ve renk doygunluğu bulunur. Bu değişiklikler GeForce 9600 GT'ye özel değildir ve ForceWare 174'ten başlayarak yeni sürücü sürümlerinde PureVideo HD ile tam donanım hızlandırmayı destekleyen tüm yongalar için sunulur. Bugün ele alınan video kartına ek olarak, bu liste şunları içerir: GeForce 8600 GT/GTS, GeForce 8800 GT ve GeForce 8800 GTS 512.

Dinamik Kontrast Geliştirme, ev aletlerinde, TV'lerde ve video oynatıcılarda oldukça yaygın olarak kullanılır ve optimal olmayan pozlama (enstantane hızı ve diyafram kombinasyonu) ile görüntüleri iyileştirebilir. Bunu yapmak için, her karenin kodunu çözdükten sonra histogramı analiz edilir ve karenin kontrastı zayıfsa histogram yeniden hesaplanır ve görüntüye uygulanır. İşte bir örnek (solda ilk görüntü, sağda işlenmiş görüntü):

Kabaca aynısı, PureVideo HD'de görülen renk doygunluğunun dinamik olarak iyileştirilmesi için de geçerlidir. Ev aletleri de, bilgisayar monitörlerinin aksine, her şeyi olduğu gibi yeniden üreten ve çoğu durumda resmin çok donuk ve cansız olmasına neden olabilen bazı görüntü iyileştirme algoritmalarını çok uzun süredir kullanıyor. Her yeni kare için de hesaplanan video verilerindeki renk bileşenlerinin otomatik dengesi, renklerin doygunluğunu biraz ayarlayarak görüntünün insan algısını iyileştirir:

Çift akışlı kod çözme, aynı anda iki farklı video akışının kodunun çözülmesini ve sonradan işlenmesini hızlandırır. Bu, bazı Blu-Ray ve HD DVD disklerinde kullanılan resim içinde resim gibi modlarda çıktı alırken faydalı olabilir (örneğin, ikinci resimde filmin yönetmeni, aşağıdaki sahneler hakkında yorumlarını yaparken gösterilebilir). ana pencere). ), WAR ve Resident Evil: Extinction filmlerinin sürümleri bu tür özelliklerle donatılmıştır.

PureVideo HD'nin en son sürümünün bir başka yararlı yeniliği, daha önce mümkün olmayan, donanım hızlandırmalı videoyu pencereli modda oynatırken Windows Vista işletim sisteminde Aero kabuğunu aynı anda çalıştırabilme yeteneğidir. Bunun kullanıcıları çok endişelendirdiği söylenemez, ancak fırsat hoş.

Harici arayüzler için destek

GeForce 9600 GT'deki harici arayüz desteği, belki de entegre DisplayPort desteği dışında GeForce 8800 GT'ye benzer. GeForce 8800 anakartlarında bulunan ve G94'te ana kartın dışına yerleştirilen harici arabirimleri destekleyen ek NVIO yongası da yonganın içinde yer alıyordu.

Referans ekran kartları GeForce 9600 GT, HDCP destekli iki Dual Link DVI çıkışına sahiptir. HDMI ve DisplayPort desteği, çip üzerindeki donanımda uygulanır ve bu bağlantı noktaları NVIDIA ortakları tarafından özel olarak tasarlanmış kartlarda uygulanabilir. Ayrıca, NVIDIA'nın garanti ettiği gibi, G92'den farklı olarak, DisplayPort desteği artık çipin içine yerleştirilmiştir ve harici vericilere gerek yoktur. Genel olarak, bir video kartındaki HDMI ve DisplayPort konektörleri isteğe bağlıdır; bazen modern video kartlarında bulunan DVI'dan HDMI'ya veya DisplayPort'a kadar basit adaptörlerle değiştirilebilirler.

Ayrıntılar: G96, GeForce 9400 ve 9500 aileleri

G96 özellikleri

  • Çip kod adı G96
  • 65 nm teknolojisi
  • 314 milyon transistör
  • Köşe ve piksel akışı ve diğer veri türleri için bir dizi ortak işlemciye sahip birleşik mimari
  • Gölgelendirici modeli Shader Model 4.0, geometri oluşturma ve gölgelendiricilerden ara veri kaydetme (akış çıkışı) dahil DirectX 10 için donanım desteği
  • 128 bit bellek veri yolu, iki bağımsız 64 bit geniş denetleyici
  • Çekirdek saat 550 MHz
  • ALU'lar frekansın (1.4 GHz) iki katından fazla çalışır
  • 32 kayan noktalı skaler ALU (tam sayı ve kayan nokta biçimleri, 32 bit IEEE 754 hassasiyeti için FP desteği, saat kaybı olmadan MAD+MUL)
  • Dokularda FP16 ve FP32 bileşenlerini destekleyen 16 doku adres birimi
  • 16 çift doğrusal filtreleme bloğu (G92'de olduğu gibi, bu artan sayıda çift doğrusal örnek verir, ancak serbest trilineer filtreleme ve etkili anizotropik filtreleme olmadan)
  • Piksel ve tepe gölgelendiricilerinde dinamik dallanma imkanı
  • FP16 veya FP32 çerçeve arabelleği formatı dahil olmak üzere piksel başına 16 örneğe kadar kenar yumuşatma modlarını destekleyen 2 geniş ROP (8 piksel). Her blok, esnek bir şekilde yapılandırılabilen bir dizi ALU'dan oluşur ve Z, MSAA, harmanlamanın oluşturulmasından ve karşılaştırılmasından sorumludur. Renksiz modda (yalnızca Z) saat başına 32 MSAA örneğine (+ 32 Z) kadar tüm alt sistemin en yüksek performansı Saat başına 64 örnek
  • Sonuçları aynı anda 8 çerçeve arabelleğine yazın (MRT)
  • Tüm arayüzler (iki RAMDAC, iki Çift DVI, HDMI, DisplayPort) çipe entegre edilmiştir

GeForce 9500 GT Referans Kartı Özellikleri

  • Çekirdek saat 550 MHz
  • Evrensel işlemci sayısı 32
  • Doku birimi sayısı 16, karıştırma birimi 8
  • Etkili bellek frekansı 1,6 GHz (2*800 MHz)
  • Bellek türü GDDR2/GDDR3
  • Bellek kapasitesi 256/512/1024 megabayt
  • Saniyede 8,8 gigatexele kadar teorik doku örnekleme hızı.
  • İki DVI-I Dual Link konektörü, 2560x1600'e kadar çözünürlüklerde çıkışı destekler
  • SLI konektörü
  • PCI Express 2.0 veri yolu
  • HDCP ile TV Çıkışı, HDTV Çıkışı, HDMI ve DisplayPort desteği

GeForce 9400 GT Referans Kartı Özellikleri

  • Çekirdek saat 550 MHz
  • Evrensel işlemcilerin frekansı 1400 MHz
  • Evrensel işlemci sayısı 16
  • Doku birimi sayısı 8, karıştırma birimi 8
  • Etkili bellek frekansı 1,6 GHz (2*800 MHz)
  • Bellek türü GDDR2
  • Bellek kapasitesi 256/512 megabayt
  • Bellek bant genişliği saniyede 25,6 gigabayt.
  • Teorik maksimum doldurma hızı saniyede 4,4 gigapikseldir.
  • Saniyede 4,4 gigatexele kadar teorik doku örnekleme hızı.
  • İki DVI-I Dual Link konektörü, 2560x1600'e kadar çözünürlüklerde çıkışı destekler
  • SLI konektörü
  • PCI Express 2.0 veri yolu
  • HDCP ile TV Çıkışı, HDTV Çıkışı, HDMI ve DisplayPort desteği

G96 mimarisi

Mimari olarak, G96, G94 yongasının tam olarak yarısıdır ve bu da G92'den yalnızca nicel özelliklerde farklılık gösterir. G96, tüm yürütme birimlerinin yarısına sahiptir: ALU, TMU ve ROP. Yeni video çipi, en düşük fiyat aralığındaki çözümler için tasarlandı ve iki büyük gölgelendirici birimi (toplamda 32 ALU) ve 16 doku biriminin yanı sıra sekiz ROP'a sahip. Ayrıca G94 ve G92 ile karşılaştırıldığında 256-bit'ten 128-bit'e azaltılmış bir bellek veriyoluna sahiptir. Tüm donanım özellikleri değişmeden kalır, tek fark performanstır.

Ayrıntılar: G92b, GeForce GTS 200 ailesi

GeForce GTS 250 Referans Grafik Özellikleri

  • Çekirdek saat 738 MHz
  • Evrensel işlemcilerin frekansı 1836 MHz
  • Evrensel işlemci sayısı 128
  • Doku birimi sayısı 64, harmanlama birimi 16
  • Etkin bellek frekansı 2200 (2*1100) MHz
  • Bellek türü GDDR3
  • Bellek boyutu 512/1024/2048 megabayt
  • Bellek bant genişliği 70,4 GB/sn
  • Teorik maksimum doldurma hızı saniyede 11,8 gigapikseldir.
  • Saniyede 47.2 gigatexele kadar teorik doku örnekleme hızı.
  • İki DVI-I Dual Link konektörü, 2560x1600'e kadar çözünürlüklerde çıkışı destekler
  • Çift SLI konektörü
  • PCI Express 2.0 veri yolu
  • TV Çıkışı, HDTV Çıkışı, HDCP desteği, HDMI, DisplayPort
  • 150 W'a kadar güç tüketimi (bir 6 pinli konektör)
  • Çift yuvalı tasarım
  • MSRP 129$/149$/169$

Genel olarak, 55 nm G92 yongasını temel alan bu "yeni" ekran kartı, GeForce 9800 GTX+'dan hiçbir şekilde farklı değil. Yeni modelin piyasaya sürülmesi, üzerine 9800 GTX + gibi 512 MB video belleği değil, maksimum kalite ayarlarıyla ağır modlarda performansı büyük ölçüde etkileyen GB, tam ekran anti ile yüksek çözünürlükler takılarak kısmen haklı çıkarılabilir. -aliasing etkinleştirildi. Ayrıca iki gigabaytlık seçenekler de var, ancak bu zaten gerçek olmaktan çok bir pazarlama avantajı.

Bu koşullar altında, GeForce GTS 250'nin eski sürümleri, artırılmış bellek nedeniyle GeForce 9800 GTX + 'dan gerçekten fark edilir derecede daha hızlı olmalıdır. Ve daha yeni oyunlardan bazıları daha düşük çözünürlüklerde bile fayda sağlayacak. Her şey yoluna girecekti, ancak bazı kart üreticileri bir gigabayt belleğe sahip GeForce 9800 GTX+'ı daha da erken piyasaya sürdü...

G92b video çiplerinin 55 nm teknolojik standartlarına göre üretimi ve PCB tasarımının gözle görülür bir şekilde basitleştirilmesi, NVIDIA'nın, özellikler açısından GeForce 9800 GTX'e benzer bir çözüm üretmesini sağladı, ancak daha düşük fiyat ve düşük güç tüketimi ve ısı dağılımı ile. Ve şimdi GeForce GTS 250'ye güç sağlamak için karta yalnızca bir adet 6-pin PCI-E güç konektörü takılmıştır. 9800 GTX+'dan tüm temel farklar bu.

NVIDIA'nın 9800 GT ekran kartı, 8800GT anakartının mantıklı bir devamıdır. İki teknolojik ürün neredeyse aynı parametrelere sahiptir. 9800GT ile önceki model arasındaki temel fark, HybridPower teknolojisini desteklemesidir. Başka iyileştirme yok. Kartın grafik işlemcisi G92-270 olarak etiketlenmiş. 8800 modelinde de benzer bir model vardı, mikroçipin daha önce olduğu gibi revizyon A2'si var. 9800 GT video kartı aynı saat frekansı özelliklerine sahiptir: 601/1512 MHz.

Özellikler 9800 GT

Teknik olarak 9800 GT, 8800'den bu yana pek değişmedi.

Grafik kartı seçenekleri:

  • GPU: G92.
  • Video belleği: 512 MB.
  • Bellek veriyolu: 256bit.
  • GPU frekansı: 601/1512 MHz.
  • Doku blokları: 56.
  • ROP blokları: 16.
  • Video kartı belleğinin çalıştığı etkin frekans: 1800 MHz.
  • Genel amaçlı işlemciler (çekirdekler): 112.
  • Desteklenen benzersiz teknolojiler: Hybrid Power.
  • Sistem veri yolu ve diğer iletişim arayüzleri: PCI-E 2.0x16/2xDVI/S-Video. HDMI bir adaptörle desteklenir.

9800 GT ekran kartı ile hangi görevler çözülebilir?

Sunulan ekran kartı, önceki neslin oyunlarıyla iyi başa çıkıyor. Kullanıcı yeni ürünlerin peşinde değilse, 9800 GT şüphesiz ona yakışacaktır. Kartın özellikleri The Witcher 2, S.T.A.L.K.E.R, Crysis 2, Dead Space 3 ve diğerleri gibi oyunları kolayca çalıştırmanıza olanak tanır. Fallout New Vegas, bu arada, bu tahta ile de sorunsuz gidiyor. Ancak efsanevi projenin dördüncü versiyonu artık piyasaya sürülmeyecek.

2013'ten sonra piyasaya sürülen modern atıcılar ve araba simülatörleri, ekran kartı da çekmeyecek. İstisnalar vardır, ancak çok nadiren. Kullanıcı, grafik ve video bilgileriyle çalışırken, yüksek çözünürlükte film izlerken kendini oldukça rahat hissediyor. Bir kişi maksimum hıza ihtiyaç duyan profesyonel bir fotoğrafçı veya 3D tasarımcı değilse, 9800 GT grafik kartı ona uyacaktır.

Bir video kartının artıları ve eksileri

Söz konusu pano, kullanımını hala geçerli kılan bir takım avantajlara sahiptir. Bu çözümün dezavantajları olmasına rağmen.

9800 GT'nin avantajları nelerdir? Modelin özellikleri, birçoğunun olduğunu gösteriyor.

  • Video kartı SLI modunu destekler. Aynı anda 4 adet kart satın alıp bunları bir grup halinde birleştirebilir, böylece performansta önemli bir artış elde edebilirsiniz.
  • Kart, PhysX teknolojisi için destek sağlar. Oyunlarda ek özel efektlerin yeniden üretilmesine hizmet eder. Bunun video kartının genel performansını önemli ölçüde azalttığını belirtmekte fayda var. Bu etkiyi dengelemek için üretici, ana kartı tamamlayacak ek bir özel PhysX hızlandırıcı kullanılmasını önerir.
  • Özel yardımcı programların yardımıyla Nvidia 9800 GT'nin stok performansını %5-15 oranında artırabilirsiniz. Spesifik gösterge, kullanıcının isteklerine ve kartın soğutma sisteminin özelliklerine bağlıdır. Hız aşırtma yaparken, aşırı ısınmayı ve bunun sonucunda hasarı önlemek için cihazın çalışma sıcaklığını dikkatlice izlemeniz gerekir.

Kusurlar:

  • kullanımdan kaldırılmış bir çözümdür;
  • genel amaçlı bilgi işlemde sınırlı verimliliğe sahiptir;
  • İnternette yayınlanan Blu-Ray disklerin ve HD kalitesinde videoların oynatılmasının düzgünlüğü, merkezi CPU'nun gücünden (video kartının işlemcisine ek olarak) önemli ölçüde etkilenecektir;
  • zayıf performans 9800 GT, kart özellikleri çalışmaya izin vermiyor 2013'ten sonra yayınlanan oyunlar;
  • nispeten yüksek güç tüketimi;
  • ek PhysX efektleriyle çalışırken video kartının yetersiz performansı.

NVIDIA GeForce 9800 GT

4 (%80) 2 oy[s]

NVIDIA GeForce 9800 GT ekran kartı, 65 nm işlem teknolojisine ve G92-270 (G92) grafik işlemcisine dayanmaktadır. Kart Directx 10'u destekler. NVIDIA, 256 bit bellek arabirimi kullanılarak bağlanan 512 megabayt GDDR3 bellek yerleştirmiştir.
Grafik işlemci 600 MHz'de çalışıyor CUDA çekirdek sayısı 112, 1800 Mbps hız ve 57.6 Gbps bant genişliği.

Video kartının güç tüketimi 105W, önerilen güç kaynağı ise 400W.

NVIDIA GeForce 9800 GT, Microsoft DirectX 10 ve OpenGL 3.3'ü destekler.

NVIDIA GeForce 9800 GT Teknik Özellikleri

Teknolojiler ve yetenekler:
CUDA:Evet
SLI :Evet
Fizik X:Evet
3D Vizyon:Evet
3D oyunlar:Evet
DirectX :10
opengl :3.3
Yorulmak:PCI-Express 2.0 x16
işletim sistemi desteği:Microsoft Windows 7-10, Linux, FreeBSDx86

Not:: Tablo, video kartının referans özelliklerini göstermektedir, bunlar üreticiden üreticiye farklılık gösterebilir.

NVIDIA GeForce 9800 GT ekran kartı için sürücüleri indirin:

İşletim sistemini seçin:

Windows 10 için: 32-bit 342.01'i indirin WHQL 64-bit 342.01'i indirin WHQL
Windows 7/8/8.1 için: 32-bit 342.01'i indirin WHQL 64-bit 342.01'i indirin WHQL

Sürücü bilgileri:

Sürücü sürümü:340.52 WHQL
Yayınlanan:29 Temmuz 2014
Sürücü dili:Rusça
Boyut:220 MB
CUDA Araç Seti:6.5
Sürücü bilgileri:Sürüm Notları (v340.52) (PDF)

GeForce Deneyimi

Resmi web sitesinden NVIDIA GeForce 9800 GT ekran kartı sürücüsünü indirin!

Veya GeForce Experience programını kullanın - video kartınız için gerekli sürücüyü otomatik olarak seçecektir.

Resmi siteden üretilen NVIDIA GeForce 9800 GT ekran kartı sürücüsünü indirin!

NVIDIA GeForce 9800 GT ekran kartının video incelemeleri:

Site yönetimi, video inceleme yazarlarının görüşlerini paylaşamaz!

NVIDIA GeForce 9800 GT Sık Sorulan Sorular ve Cevaplar: Soru: Bu ekran kartı hangi seri?Cevap: masaüstü Soru: Hangi DirectX'i destekliyor?Cevap: Ekran kartı DirectX 10'u destekler Soru: Ekran kartının güç tüketimi nedir?Cevap: Maksimum güç tüketimi 105 W Soru: Ekran kartı için hangi güç kaynağına ihtiyaç var?Cevap:Önerilen PSU 400W Soru: Ek elektrik prizleri var mı?Cevap:İki adet 6 pinli Soru:İzin verilen maksimum sıcaklık nedir?Cevap: 105 ℃'den fazla değil Soru: Sürücü nereden indirilir?Cevap:

Çoğu durumda, bir video kartı kullanırken, gerekli yazılımı bulma ve yükleme konusunda herhangi bir sorun yaşanmaz. Cihazla birlikte gelir veya kullanılarak otomatik olarak yüklenir. "Aygıt Yöneticisi".

Sürücüleri kendi başımıza aramaya zorlandığımızda zorluklar başlar. Tüm üreticiler, kullanıcıların isteklerini anlamıyor ve genellikle anlaşılmaz terimler ve parametre adlarıyla bizi şaşırtıyor. Bu makale, bir Nvidia ekran kartının ürün serisini nasıl tanıyacağınızı anlamanıza yardımcı olacaktır.

Resmi Nvidia web sitesinde, manuel sürücü arama bölümünde, bir dizi (nesil) ürün seçmeniz gereken bir açılır liste görüyoruz.

Bu aşamada, yeni başlayanlar zorluk çekiyor, çünkü bu bilgi hiçbir yerde açıkça mevcut değil. Bilgisayarınızda kurulu olan ekran kartının hangi nesle ait olduğunu nasıl belirleyeceğinizi detaylı olarak inceleyelim.

Model Tanımı

Öncelikle, örneğin hem Windows sistem araçlarını hem de üçüncü taraf programlarını kullanabileceğiniz video bağdaştırıcısının modelini bulmanız gerekir.

Bilgisayarımızda ne tür bir ekran kartı olduğunu belirledikten sonra neslini bulmak zor olmayacaktır. En yenisinden başlayarak seri numaralarını gözden geçirelim.

20. Bölüm

Yirminci video kartı serisi, mimariye sahip çipler üzerine inşa edilmiştir. Turing. Bu materyalin güncellenmesi sırasında (tarihe bakın), hat üç adaptörden oluşur. BT RTX 2080 Ti, RTX 2080 ve RTX 2070.

10. Bölüm

Onuncu ürün serisi, mimaride grafik bağdaştırıcıları içerir paskal. Bu içerir GT 1030, GTX 1050 - 1080Ti. Ayrıca buraya dahil Nvidia Titan X (Pascal) ve Nvidia Titan Xp.

900 serisi

Dokuz yüzüncü seri, önceki neslin bir dizi cihazını içerir. Maxwell. BT GTX950-980Ti, birlikte GTX Titan X.

700 serisi

Bu, çiplerdeki adaptörleri içeriyordu Kepler. Bu nesilden (yukarıdan aşağıya bakarsanız) model çeşitliliği başlar. bunlar ofis GT 705 - 740(5 model), oyun GTX745-780Ti(8 model) ve üç GTX Titan, Titan Z, Titan Siyah.

600 serisi

Ayrıca adı ile oldukça üretken "aile" Kepler. BT GeForce 605, GT 610 - 645, GTX 645 - 690.

500 serisi

Bunlar mimarideki video kartları fermi. Sıralama şunlardan oluşur: GeForce 510, GT 520 - 545 ve GTX 550Ti - 590.

400 serisi

400. hat GPU'ları da çiplere dayanıyor fermi ve aşağıdaki gibi video kartlarıyla temsil edilir: GeForce 405, GT 420 - 440, GTS 450 ve GTX460-480.

300 serisi

Bu serinin mimarisi denir tesla, modelleri şunlardır: GeForce 310 ve 315, GT 320 - 340.

200 serisi

Bu GPU'ların aynı zamanda adı da var. tesla. Seride yer alan kartlar şunlardır: GeForce 205 ve 210, G210, GT 220 - 240, GTS 240 ve 250, GTX 260 - 295.

100 serisi

Nvidia'nın 100. serisi grafik kartları hala mikro mimariye dayanıyor tesla ve adaptörler içerir G100, GT 120 – 140, GTS 150.

9. Bölüm

Dokuzuncu nesil GeForce GPU'lar çiplere dayanıyor G80 ve G92. Kadro beş gruba ayrılmıştır: 9300, 9400, 9500, 9600, 9800 . İsimlerdeki fark, yalnızca cihazın amacını ve iç dolumunu karakterize eden harflerin eklenmesindedir. Örneğin, GeForce 9800GTX+.

8. Bölüm

Bu hat aynı çipleri kullanır G80, ve aşağıdakilere karşılık gelen kart aralığı: 8100, 8200, 8300, 8400, 8500, 8600, 8800 . Rakamları harfler takip eder: GeForce 8800 GTX.

7. Bölüm

İşlemciler üzerine kurulu yedinci seri G70 ve G72, video kartları içerir GeForce 7200, 7300, 7600, 7800, 7900 ve 7950 farklı harflerle.

6. Bölüm

6. nesil yeşil kartlar mimaride çalışıyor NV40 ve adaptörler içerir GeForce 6200, 6500, 6600, 6800 ve bunların modifikasyonları.

5FX

Cetvel 5FX mikroçiplere dayalı NV30 ve NV35. Modellerin bileşimi aşağıdaki gibidir: FX 5200, 5500, PCX 5300, GeForce FX 5600, 5700, 5800, 5900, 5950 farklı konfigürasyonlarda yapılmıştır.

M harfi ile ekran kartı modelleri

Adının sonunda harf bulunan tüm video kartları "M", mobil cihazlar (dizüstü bilgisayarlar) için GPU modifikasyonlarıdır. Bu içerir: 900M, 800M, 700M, 600M, 500M, 400M, 300M, 200M, 100M, 9M, 8M. Örneğin, harita GeForce 780M yedinci seriyi ifade eder.

Bu, Nvidia grafik bağdaştırıcılarının nesilleri ve modelleri hakkındaki kısa turumuzu sonlandırıyor.

512 MB belleğe sahip Nvidia GeForce 9800 GT video adaptörü, önceki modelin yerini alarak 2008 yılında piyasaya çıktı. Daha sonraki sürümler 1 GB GDDR5 ve geliştirilmiş oyun deneyimi ile piyasaya sürüldü. Kartların tüm çeşitlerinin bütçe fiyat kategorisinde olduğu ve ucuz oyun bilgisayarlarının montajı için tasarlandığı ortaya çıktı.

Grafik bağdaştırıcı parametreleri, 2008-2009'daki oyun uygulamalarının gereksinimleriyle oldukça tutarlıdır. Nvidia GeForce 9800 GT'nin ana özellikleri aşağıdaki gibidir:

  • GPU G92-270;
  • GPU frekansı - 550 ila 600 MHz;
  • Bellek frekansı - 1400-1800 MHz;
  • Bit derinliği - 256 bit;
  • Maksimum veri aktarım hızı - 57,6 GB / s;
  • Desteklenen görüntü çözünürlüğü 2560x1600'e kadardır.

Grafik kartı, gelişmiş performans için Nvidia SLI teknolojisini, entegre grafiklere otomatik geçiş için HybridPower'ı ve en gerçekçi oyun deneyimi için PhysX'i destekler. Ayrıca DirectX 10 ve OpenGL 2.0 paketleriyle birlikte çalışarak yüksek kaliteli 3D grafikler sağlar. Daha modern API işlevleri için destek sağlanmaz.

GeForce 9800 GT'yi inceleyin

9800 GT'nin güç tüketimi oldukça yüksek - 105 W seviyesinde, bu nedenle çalışması için güçlü bir güç kaynağı gerekiyor. Üretici en az 450 watt kullanılmasını önerir. Modern oyunları çalıştırmak için daha verimli bir PSU seçmelisiniz - 500 veya 600 watt.

GeForce 9800 GT ekran kartının normal sıcaklığını korumak için, tüm modifikasyonlar aktif soğutma sistemleriyle donatılmıştır - kural olarak, bir soğutucu ile.

Normal modda, kart 77 dereceden fazla ısınmaz. Maksimum değer 105 derecedir.

Video bağdaştırıcısına çevresel aygıtları bağlamak için aşağıdaki bağlaçlar vardır:

  • Adaptörler aracılığıyla geleneksel VGA ve HDMI kablolarının bağlanabileceği 2 DVI;
  • Analog sinyal çıkışı için TV Çıkışı;
  • İki kartı birleştirebileceğiniz MIO.

Video kartının etkin frekansının maksimum değeri 2000 MHz'dir ve bu, modele bağlı olarak %11-30 oranında hız aşırtmanıza olanak tanır. Performansta gözle görülür bir artışın ciddi aşırı ısınmaya yol açabileceğini düşünmeye değer.

Nvidia GeForce 9800 GT grafik kartı nasıl overclock edilir

Nvidia GeForce 9800 GT'yi overclock ederek frekansını artırabilirsiniz. Sonuç, oyun sırasında kart performansında ve fps'de bir artıştır. Yine de minimum gereksinimleri karşılamayan oyunları çalıştırmak için çalışmayacaktır.

MSI Afterburner veya Nvidia Inspector gibi özel yardımcı programlar, Nvidia GeForce 9800 GT ekran kartını overclock etmenize yardımcı olacaktır.

Hız aşırtmalı video adaptörünün maksimum frekansı 2000 MHz'i geçmemelidir. Hız aşırtmalı bir kart daha hızlı çalışır, ancak zaten 120-125 watt'a kadar tüketir.

Hız aşırtmadan sonra 9800 GT'de madencilik yapmak mümkündür, ancak önerilmez. GPU'lar kullanılarak çıkarılabilen yeni kripto para birimi Bitcoin Gold'un ortaya çıkmasıyla bile, performans, özellikle bu kadar yüksek bir TDP'de, elektrik için bile ödeme yapmak için hala çok düşük olacaktır.

Nvidia GeForce 9800 GT hangi oyunları çekecek?

O sırada GeForce 9800 GT oyunlarında gerçekleştirilen test, düşük bütçeli oyun bilgisayarları için bir ekran kartı kullanma olasılığını gösterdi. Kartla eşleşen bir bilgisayar için minimum gereksinim, PCI-Express 16x yuvaları, 512-1024 MB RAM ve 500W güç kaynağına sahip bir anakarttır. Ayrıca DX10 paketini kurmanız önerilir.

Test sonuçları aşağıdaki gibidir:

  1. Crysys (2009) oyununda çözünürlük 1280x1024 piksel olarak ayarlandığında. 512 MB model 22 ila 30 fps sağlar - yaklaşık HD 4770 grafik kartı ile aynı.
  2. Stalker oyununu başlattığınızda (çözünürlük 1680x1050 pix.), 512 MB GDDR5'li bir adaptör kullanırsanız resim değişim hızı saniyede 13-25 kareye, bilgisayarınıza bir gigabayt sürümü yüklerseniz 30'a kadar çıkıyor.
  3. 512 MB kartlı Skyrim oyunu hiç başlamaz ve minimum ayarlarda gigabayt değişikliği 65 fps'ye kadar gösterir.

2011-2012'den sonra çıkan oyunların GeForce 9800 GT 512 MB ile çalıştırılması önerilmez. Çoğu 20 fps'den fazla göstermeyecek, gerisi çalışmayacak. 1 GB belleğe sahip bir sürüm uygundur, ancak kabul edilebilir bir oyun kalitesi sağlaması da olası değildir.

Üretici karşılaştırması

Satışların en başında, Nvidia GeForce 9800 GT'nin fiyatı 512 MB ve yaklaşık 3.5 bin ruble olan sürümler için yaklaşık 2700-3000 ruble idi. gigabayt değişiklikleri için. MSI, Palit ve Asus gibi daha tanınmış üreticilerin ürünleri 1800 MHz bellek frekansı ve daha yüksek bir maliyet aldı. Şimdi sadece 600-700 ruble için ikincil piyasadan satın alınabilir.

markaBellek, MBİşlemci frekansı, MHzBellek frekansı, MHzMaliyet, ovmak.
gigabayt1024 600 1800 3600
gigabayt512 600 1500 2900
gigabayt512 550 1800 2800
ECS512 550 1800 2600
MSI512 550 1800 2900
asus512 600 1800 3000
Inno3D1024 600 1800 3500
Kulüp 3D1024 550 1400 3300
kazançlı1024 550 1800 3500
Zotac1024 550 1600 3400
palit512 600 1800 2700
palit1024 550 1800 3400

Zotac, Club 3D ve Gigabyte markalarının daha karlı çeşitleri müşteriler için daha ucuzdu, ancak aynı zamanda daha yavaş çalıştılar. Bu tür grafik adaptörlerinin frekansı 1400-1600 MHz aralığındaydı. Şimdi fiyatları, bir zamanlar daha pahalı olan modellerle aynı - en fazla 1000 ruble.

GeForce 9800 GT için video sürücüsü nasıl yeniden yüklenir

Video bağdaştırıcısının normal çalışması için, düzgün çalışan kontrol programlarının varlığı gereklidir. 9800 GT kartlı bir bilgisayara yeni sürücüleri indirip kurmanın üç yolu vardır:

  1. Üreticinin resmi kaynağından indirin. PC'nin doğru çalışmasını ve güvenliğini garanti eden tek seçenek.
  2. Üçüncü taraf kaynaklardan indirme. Yalnızca Nvidia GeForce 9800 GT için sürücüyü indirebileceğiniz değil, aynı zamanda bilgisayarınıza virüs bulaştırabileceğiniz bir yöntem.
  3. ‎DriverPack Solution, ‎DriverHub veya Driver Booster Free gibi özel yardımcı programları kullanma. Bu durumda, sürücü güncel olmayabilir.

Nvidia'nın resmi web sitesinde, çeşitli işletim sistemleri için tasarlanmış video kartı için kontrol programlarının yeni sürümlerini bulabilirsiniz. Kartın desteklediği platformların listesi Windows 7 32 ve 64 bit, Windows 10 ve Linux'u içeriyor. Diğer kaynaklarda Solaris gibi nadir işletim sistemleri için sürücüler bulabilirsiniz.