Entegre GPU'lar - Her şey takıp çıkarmakla ilgili. Windows Görev Yöneticisi GPU 0'da GPU kullanımı nasıl izlenir?

  • 15.03.2020

Modern cihazlar, GPU olarak da adlandırılan bir grafik işlemcisi kullanır. Nedir ve çalışma prensibi nedir? GPU (Grafik, ana görevi grafikleri ve kayan nokta hesaplamalarını işlemek olan bir işlemcidir. GPU, 3D grafikli ağır oyunlar ve uygulamalar söz konusu olduğunda ana işlemcinin işini kolaylaştırır.

Nedir?

GPU grafikler, dokular, renkler oluşturur. Birden çok çekirdeğe sahip bir işlemci yüksek hızlarda çalışabilir. Grafik kartı, öncelikle düşük hızlarda çalışan birçok çekirdeğe sahiptir. Piksel ve köşe hesaplamaları yaparlar. İkincisinin işlenmesi esas olarak koordinat sisteminde gerçekleşir. Grafik işlemcisi, ekranda üç boyutlu bir alan yaratarak çeşitli görevleri yerine getirir, yani içindeki nesneler hareket eder.

Çalışma prensibi

GPU ne işe yarar? 2D ve 3D grafik işleme ile ilgilenir. GPU sayesinde bilgisayar önemli görevleri daha hızlı ve daha kolay tamamlayabilir. GPU'nun özelliği, hesaplama hızını maksimum düzeyde arttırmasıdır. Mimarisi, görsel bilgilerin bir bilgisayarın merkezi CPU'sundan daha verimli işlenmesine izin verecek şekilde tasarlanmıştır.

3B modellerin çerçeveye yerleştirilmesinden sorumludur. Ayrıca işlemcilerin her biri içinde bulunan üçgenleri filtreler. Hangilerinin görünürde olduğunu belirler, diğer nesnelerin arkasına gizlenmiş olanları kaldırır. Işık kaynaklarını çizer, bu ışık kaynaklarının rengi nasıl etkilediğini belirler. Grafik işlemcisi (ne olduğu - makalede açıklanmıştır) bir görüntü oluşturur, bunu ekranda kullanıcıya gösterir.

Yeterlik

GPU'nun verimli çalışmasını sağlayan nedir? Sıcaklık. PC ve dizüstü bilgisayarlarla ilgili sorunlardan biri aşırı ısınmadır. Bu, cihazın ve elemanlarının hızlı bir şekilde arızalanmasının ana nedeni haline gelir. İşlemci sıcaklığı 65 °C'yi aştığında GPU sorunları başlar. Bu durumda kullanıcılar, işlemcinin daha zayıf çalışmaya başladığını fark eder, artan sıcaklığı kendi kendine düşürmek için saat döngülerini atlar.

Sıcaklık aralığı 65-80 ° С - kritik. Bu durumda sistem yeniden başlatmaya başlar (acil durum), bilgisayar kendi kendine kapanır. Kullanıcının GPU sıcaklığının 50 °C'yi geçmediğini izlemesi önemlidir. T 30-35 ° C boşta iken normal kabul edilir, 40-45 ° C saatlerce yük ile. Sıcaklık ne kadar düşük olursa, bilgisayarın performansı o kadar iyi olur. Anakart, ekran kartı, kasa ve sabit disklerin kendi sıcaklık rejimleri vardır.

Ancak birçok kullanıcı, verimliliğini artırmak için işlemcinin sıcaklığını nasıl azaltacağı konusunda da endişeleniyor. İlk önce aşırı ısınmanın nedenini bulmanız gerekir. Bu tıkanmış bir soğutma sistemi, kurumuş termal macun, kötü amaçlı yazılım, işlemci hız aşırtma, ham BIOS bellenimi olabilir. Bir kullanıcının yapabileceği en basit şey, işlemcinin kendisinde bulunan termal gresi değiştirmektir. Ayrıca, soğutma sisteminin temizlenmesi gerekir. Uzmanlar ayrıca, sistem birimindeki hava sirkülasyonunu iyileştiren ve soğutucunun grafik adaptöründeki dönüş hızını artıran güçlü bir soğutucu takmayı da tavsiye ediyor. Tüm bilgisayarlar ve GPU'lar aynı sıcaklık azaltma şemasına sahiptir. Cihazı zamanında izlemek ve temizlemek önemlidir.

özgüllük

GPU video kartında bulunur, asıl görevi 2D ve 3D grafikleri kullanmaktır. Bilgisayara bir GPU takılıysa, cihazın işlemcisi gereksiz iş yapmaz, bu nedenle daha hızlı çalışır. Grafiğin temel özelliği, asıl amacının nesneleri ve dokuları yani grafik bilgilerini hesaplama hızını artırmak olmasıdır. İşlemci mimarisi, görsel bilgileri işlemek için çok daha verimli çalışmalarını sağlar. Sıradan bir işlemci bunu yapamaz.

Görüntüleme

GPU nedir? Bu, video kartında bulunan bir bileşendir. Birkaç tür çip vardır: yerleşik ve ayrık. Uzmanlar, ikincisinin göreviyle daha iyi başa çıktığını söylüyor. Gücünde farklılık gösterdiğinden ayrı modüllere kurulur, ancak mükemmel soğutmaya ihtiyaç duyar. Hemen hemen tüm bilgisayarlarda entegre bir grafik işlemci bulunur. Güç tüketimini birkaç kat azaltmak için CPU'ya kurulur. Ayrık güç ile karşılaştırılamaz, ancak aynı zamanda iyi özelliklere sahiptir ve iyi sonuçlar gösterir.

Bilgisayar grafikleri

Bu nedir? Görüntü oluşturmak ve görsel bilgileri işlemek için bilgisayar teknolojisinin kullanıldığı faaliyet alanının adıdır. Bilimsel de dahil olmak üzere modern bilgisayar grafikleri, sonuçları grafiksel olarak işlemenize, diyagramlar, grafikler, çizimler oluşturmanıza ve ayrıca çeşitli sanal deneyler gerçekleştirmenize olanak tanır.

Teknik ürünler, yapıcı grafikler kullanılarak oluşturulur. Bilgisayar grafiklerinin başka türleri de vardır:

  • animasyon;
  • multimedya;
  • sanatsal;
  • reklam;
  • açıklayıcı.

Teknik açıdan bilgisayar grafikleri 2D ve 3D görüntülerdir.

CPU ve GPU: fark

İkisi arasındaki fark nedir? Birçok kullanıcı, GPU'nun (yukarıda açıklanan) ve video kartının farklı görevler gerçekleştirdiğinin farkındadır. Ayrıca, iç yapılarında farklılık gösterirler. Hem CPU hem de GPU - birçok benzerliği vardır, ancak bunlar farklı amaçlar için yapılmıştır.

CPU, kısa bir süre içinde belirli bir talimat zincirini yürütür. Aynı anda birkaç zincir oluşturacak şekilde yapılır, talimat akışını birçok parçaya böler, yürütür ve sonra belirli bir sırayla tekrar bir bütün halinde birleştirir. İş parçacığındaki talimat, onu takip edenlere bağlıdır, bu nedenle CPU az sayıda yürütme birimi içerir, burada ana öncelik, kesinti süresini azaltmak için yürütme hızına verilir. Bütün bunlar bir boru hattı ve önbellek ile gerçekleştirilir.

GPU'nun başka bir önemli işlevi daha vardır - görsel efektlerin ve 3D grafiklerin oluşturulması. Daha kolay çalışır: girişte çokgenleri alır, gerekli mantıksal ve matematiksel işlemleri gerçekleştirir ve çıkışta piksel koordinatlarını verir. GPU'nun işi, çok sayıda farklı görev akışını yönetmektir. Özelliği, CPU'ya kıyasla büyük ama yavaş performansa sahip olmasıdır. Ayrıca modern GPU'lar 2000'den fazla yürütme birimine sahiptir. Belleğe erişim yöntemlerinde birbirlerinden farklıdırlar. Örneğin, grafikler büyük önbelleğe alınmış belleğe ihtiyaç duymaz. GPU daha fazla bant genişliğine sahiptir. Basit bir ifadeyle, CPU, programın görevlerine göre kararlar verir ve GPU, aynı hesaplamaların çoğunu gerçekleştirir.

Grafik işlem birimi (GPU) performans verilerini izleme yeteneğine sahip. Kullanıcılar bu bilgileri analiz ederek bilgi işlemde kullanımı giderek artan grafik kartı kaynaklarının nasıl kullanıldığını anlayabilirler.

Bu, PC'de kurulu tüm GPU'ların Performans sekmesinde gösterileceği anlamına gelir. Ayrıca İşlemler sekmesinde hangi işlemlerin GPU'ya eriştiğini görebilir ve Ayrıntılar sekmesinde GPU bellek kullanım verilerinin yer aldığını görebilirsiniz.

GPU Performance Viewer'ın desteklenip desteklenmediği nasıl kontrol edilir

Görev Yöneticisi'nin CPU, bellek, disk veya ağ bağdaştırıcılarını izlemek için özel gereksinimleri olmasa da GPU'larda durum biraz farklıdır.

Windows 10'da GPU bilgileri, yalnızca Windows Ekran Sürücüsü Modeli (WDDM) mimarisini kullanırken Görev Yöneticisi'nde bulunur. WDDM, masaüstünün ve uygulamaların ekrana işlenmesini sağlayan bir video kartı için bir grafik sürücüsü mimarisidir.

WDDM, bir zamanlayıcı (VidSch) ve bir video bellek yöneticisi (VidMm) içeren bir grafik çekirdeği sağlar. GPU kaynaklarını kullanırken karar vermekten sorumlu olan bu modüllerdir.

Görev yöneticisi, GPU kaynak kullanımıyla ilgili bilgileri doğrudan grafik çekirdeğinin zamanlayıcı ve video belleği yöneticisinden alır. Üstelik bu, hem entegre hem de özel grafik işlemciler için geçerlidir. İşlevin doğru çalışması için WDDM sürüm 2.0 veya üzeri gereklidir.

Cihazlarınızın Görev Yöneticisi'nde GPU verilerini görüntülemeyi destekleyip desteklemediğini kontrol etmek için şu adımları izleyin:

  1. Çalıştır komutunu açmak için Windows Tuşu + R klavye kısayolunu kullanın.
  2. komutu girin dxdiag.exe DirectX Diagnostic Tool'u açmak için Enter'a basın.
  3. “Ekran” sekmesine tıklayın.
  4. Sağdaki “Sürücüler” bölümünde, sürücü modelinin anlamına bakın.

WDDM 2.0 veya üstünü kullanıyorsanız, Görev Yöneticisi Performans sekmesinde GPU kullanımını gösterecektir.

Görev Yöneticisi kullanılarak GPU performansı nasıl izlenir

GPU performans verilerini Görev Yöneticisi'ni kullanarak izlemek için görev çubuğuna sağ tıklayın ve Görev Yöneticisi'ni seçin. Kompakt görünüm etkinse, Ayrıntılar düğmesini ve ardından Performans sekmesini tıklayın.

Tavsiye: Görev Yöneticisini hızlı bir şekilde başlatmak için Ctrl + Shift + Esc klavye kısayolunu kullanabilirsiniz.

Performans sekmesi

Bilgisayarınız WDDM 2.0 veya sonraki bir sürümünü destekliyorsa, sekmelerin sol bölmesinde Verim GPU'nuz görüntülenecektir. Sistemde birden fazla GPU kurulu olması durumunda, her biri fiziksel konumuna karşılık gelen bir sayı kullanılarak gösterilecektir, örneğin GPU 0, GPU 1, GPU 2 vb.

Windows 10, Nvidia SLI ve AMD Crossfire modlarını kullanan çoklu GPU paketlerini destekler. Sistemde bu konfigürasyonlardan biri bulunduğunda, Performans sekmesi bir numara kullanarak her bir linki gösterecektir (örn. Link 0, Link 1, vb.). Kullanıcı, paket içindeki her GPU'yu görebilecek ve kontrol edebilecek.

Belirli bir GPU sayfasında, genellikle iki bölüme ayrılan performans verilerinin bir özetini bulacaksınız.

Bu bölüm, bireysel çekirdekleri hakkında değil, GPU'nun motorları hakkında güncel bilgiler içerir.

Görev Yöneticisi varsayılan olarak 3D, kopyalama, video kod çözme ve video işlemeyi içeren varsayılan olarak en çok istenen dört GPU motorunu görüntüler, ancak bu görünümleri başlığa tıklayarak ve farklı bir motor seçerek değiştirebilirsiniz.

Kullanıcı, bölümün herhangi bir yerine sağ tıklayıp "Grafik Değiştir> Tek Çekirdek" seçeneğini seçerek grafiğin görünümünü tek bir kaydırıcıya bile değiştirebilir.

Motorların grafiklerinin altında, video belleği tüketimine ilişkin bir veri bloğu bulunur.

Görev Yöneticisi iki tür video belleği gösterir: paylaşılan ve ayrılmış.

Ayrılmış bellek, yalnızca grafik kartı tarafından kullanılacak bellektir. Bu genellikle ayrı kartlardaki VRAM miktarı veya bilgisayarın açık bir şekilde ayırmak üzere yapılandırıldığı işlemci için kullanılabilir bellek miktarıdır.

Sağ alt köşede, Donanım Ayrılmış Bellek seçeneği görüntülenir - bu bellek miktarı video sürücüsü için ayrılmıştır.

Bu bölümde ayrılan bellek, süreçler tarafından aktif olarak kullanılan bellek miktarını temsil eder ve bu bölümdeki paylaşılan bellek, grafik amacıyla tüketilen sistem belleği miktarını temsil eder.

Ek olarak, sol bölmede GPU'lar adı altında, mevcut GPU kullanım yüzdesini göreceksiniz. Görev Yöneticisi'nin genel kullanımı temsil etmek için en çok yüklenen motorun yüzdesini kullandığını unutmamak önemlidir.

Zaman içindeki performans verilerini görmek için video oyunu gibi GPU yoğun bir uygulama çalıştırın.

İşlemler sekmesi

GPU performansını sekmeden de izleyebilirsiniz. süreçler... Bu bölümde, belirli bir süreç için üst düzey bir özet bulacaksınız.

GPU sütunu, belirli bir işlem tarafından toplam GPU kaynak kullanımını temsil etmek için en aktif motorun kullanımını gösterir.

Bununla birlikte, birden fazla motor yüzde 100 kullanım rapor ederse kafa karışıklığı ortaya çıkabilir. Ek bir "GPU çekirdeği" sütunu, bu işlem tarafından yüklenen motor hakkında ayrıntılı bilgi sağlar.

İşlemler sekmesindeki sütun başlığı, sistemde bulunan tüm GPU'ların toplam kaynak tüketimini gösterir.

Bu sütunları görmüyorsanız, herhangi bir sütunun başlığına sağ tıklayın ve uygun kutuları işaretleyin.

Ayrıntılar sekmesi

Varsayılan olarak, sekme GPU bilgilerini görüntülemez, ancak her zaman bir sütun başlığına sağ tıklayıp Sütunları Seç seçeneğini belirleyebilir ve aşağıdaki seçenekleri etkinleştirebilirsiniz:

  • GPU çekirdeği
  • Özel GPU belleği
  • Toplam GPU Belleği

Bellek sekmeleri, belirli bir işlem tarafından kullanılan sırasıyla toplam ve ayrılmış bellek miktarlarını görüntüler. GPU ve GPU Çekirdeği sütunları, İşlemler sekmesindekiyle aynı bilgileri gösterir.

Ayrıntılar sekmesini kullanırken, toplam bellek birkaç kez sayılacağından, her işlem tarafından kullanılan belleğin eklenmesinin toplam kullanılabilir bellekten daha büyük olabileceğinin farkında olmanız gerekir. Bu bilgi, bir işlemdeki bellek kullanımını anlamak için yararlıdır, ancak grafik kullanımı hakkında daha doğru bilgiler görmek için Performans sekmesini kullanmalısınız.

Çıktı

Microsoft, üçüncü taraf uygulamalara kıyasla grafik alt sisteminin performansını değerlendirmek için kullanıcılara daha doğru bir araç sağlamayı taahhüt eder. Bu işlevsellik üzerindeki çalışmaların devam ettiğini ve yakın gelecekte iyileştirmelerin yapılabileceğini unutmayın.

Herkese iyi günler, sevgili dostlarım ve blogumun misafirleri. Bugün biraz bilgisayarlarımızın donanımından bahsetmek istiyorum. Lütfen söyle bana, GPU diye bir şey duydun mu? Pek çok kişinin böyle bir kısaltmayı ilk kez duyduğu ortaya çıktı.

Kulağa ne kadar basmakalıp gelse de, bugün bilgisayar teknolojisi çağında yaşıyoruz ve bazen bilgisayarın nasıl çalıştığı hakkında hiçbir fikri olmayan birini bulmak zor. Yani örneğin birinin bir bilgisayarın bir merkezi işlem birimi (CPU) sayesinde çalıştığını anlaması yeterlidir.

Birisi daha ileri gidecek ve belirli bir GPU'nun da olduğunu öğrenecek. Böyle karmaşık bir kısaltma, ancak öncekine benzer. Öyleyse bir bilgisayarda GPU'nun ne olduğunu, ne olduklarını ve CPU ile ne gibi farklılıkları olduğunu bulalım.

büyük bir fark değil

Basit bir ifadeyle, GPU, kısmen bir hata olan ve bazen video kartı olarak adlandırılan bir grafik işleme birimidir. Video kartı, tanımladığımız işlemciyi içeren hazır bir bileşen cihazıdır. 3D grafikler oluşturmak için komutları işleyebilir. Bunun için önemli bir unsur olduğunu, video sisteminin bir bütün olarak hızı ve çeşitli yeteneklerinin gücüne bağlı olduğunu belirtmekte fayda var.

GPU, kuzeni CPU'ya kıyasla kendine özgü özelliklere sahiptir. Temel fark, üzerine inşa edildiği mimaride yatmaktadır. GPU mimarisi, büyük miktarda veriyi daha verimli bir şekilde işleyebilecek şekilde oluşturulmuştur. CPU sırayla verileri ve görevleri işler. Doğal olarak bu özelliği eksi olarak almamalısınız.

GPU Türleri

Çok fazla grafik işlemci türü yoktur, bunlardan biri ayrık olarak adlandırılır ve ayrı modüllerde kullanılır. Böyle bir çip yeterince güçlüdür, bu nedenle radyatörlerden, soğutuculardan oluşan bir soğutma sistemi gerektirir; özellikle yüklü sistemlerde sıvı soğutma kullanılabilir.

Bugün, grafik bileşenlerinin geliştirilmesinde önemli bir adım gözlemleyebiliriz, bunun nedeni çok sayıda GPU türünün ortaya çıkmasıdır. Önceden herhangi bir bilgisayarın oyunlara veya diğer grafik uygulamalarına erişebilmesi için ayrı grafiklerle donatılması gerekirken, şimdi bu görev tümleşik bir grafik işlemcisi olan IGP tarafından gerçekleştirilebilir.

Hemen hemen her bilgisayar (sunucular hariç) artık dizüstü veya masaüstü bilgisayar olsun, entegre grafiklerle donatılmıştır. Video işlemcinin kendisi, güç tüketimini ve cihazın fiyatını önemli ölçüde azaltabilen CPU'nun içine yerleştirilmiştir. Ek olarak, bu tür grafikler diğer alt türlerde olabilir, örneğin: ayrık veya karma ayrık.

İlk seçenek, anakartta lehimleme veya ayrı bir mobil modül olan en pahalı çözümü ifade eder. İkinci seçeneğe bir nedenden dolayı hibrit denir, aslında, tahtaya lehimlenmiş küçük video belleği kullanır, ancak aynı zamanda RAM pahasına genişletebilir.

Doğal olarak, bu tür grafik çözümleri tam teşekküllü ayrı video kartlarına yetişemez, ancak şimdiden oldukça iyi sonuçlar veriyorlar. Her durumda, geliştiricilerin çaba gösterecekleri çok şey var, belki de böyle bir karar gelecek.

Bu konuda, belki de her şeye sahibim. Umarım makaleyi beğenmişsinizdir! Seni tekrar blogumda görmek için sabırsızlanıyorum. Sana iyi şanslar. Güle güle!

2016'da GPU'larda, daha önce, kanıtlanmış 28 nm işlem teknolojisinden önemli ölçüde daha yüksek transistör yoğunluğu ve saat hızlarına sahip yongaları serbest bırakmak için gerekli üretim yeteneklerinin eksikliği nedeniyle engellenen, tam teşekküllü bir nesil değişikliği umutları, izin verildi. İki yıl önce umduğumuz 20nm teknolojisi, ayrı GPU'lar kadar büyük yongalar için ticari olarak uygun değildi. AMD ve NVIDIA için yüklenici olarak hareket edebilecek TSMC ve Samsung, 20 nm'de FinFET kullanmadığından, 28 nm'ye kıyasla watt başına performanstaki potansiyel artış, her iki şirketin de 14 / 16'nın toplu olarak benimsenmesini beklemeyi tercih etmesiydi. - nm normları, zaten FinFET kullanıyor.

Ancak, sancılı bekleyişlerin üzerinden yıllar geçti ve artık GPU üreticilerinin güncellenmiş teknik sürecin özelliklerini nasıl kullandığını değerlendirebiliriz. Uygulamanın bir kez daha gösterdiği gibi, “nanometreler” kendi başlarına çipin yüksek enerji verimliliğini garanti etmez, bu nedenle NVIDIA ve AMD'nin yeni mimarileri bu parametrede çok farklı çıktı. Şirketlerin önceki yıllarda olduğu gibi artık tek bir fabrikanın (TSMC) hizmetlerini kullanmaması da ek bir entrika yarattı. AMD, 14nm FinFET tabanlı Polaris GPU'ları için GlobalFoundries'i seçti. NVIDIA ise, küçük GP107 (Samsung tarafından üretilen) hariç tüm Pascal yongalarında 16nm FinFET işlemine sahip TSMC ile ortaklık kurmaya devam ediyor. GlobalFoundries tarafından bir kerede lisanslanan Samsung 14nm FinFET hattıydı, bu nedenle GP107 ve rakibi Polaris 11, AMD ve NVIDIA'nın mühendislik başarılarını benzer bir üretim temelinde karşılaştırmamız için bize uygun bir fırsat sunuyor.

Ancak, teknik ayrıntılara erken dalmayalım. Genel olarak her iki firmanın da yeni nesil GPU'ya dayalı önerileri şu şekildedir. NVIDIA, üç tüketici GPU'suna (GP107, GP106 ve GP104) dayalı eksiksiz bir Pascal hızlandırıcı serisi yarattı. Ancak büyük ihtimalle GeForce GTX 1080 Ti olarak adlandırılacak olan amiral gemisi adaptörün yeri artık boş. Bu pozisyon için aday, şimdiye kadar sadece "sümer yanlısı" NVIDIA TITAN X hızlandırıcısında kullanılan GP102 işlemcili bir karttır.Ve son olarak, NVIDIA'nın ana gururu, görünüşe göre şirketin, görünüşe göre, GP100 yongasıdır. oyun ürünlerinde bile uygulanmayacak ve Tesla bilgi işlem hızlandırıcılarına gitti.

AMD'nin şimdiye kadarki başarısı daha mütevazı. Polaris ailesinin iki işlemcisi piyasaya sürüldü, ürünleri oyun grafik kartlarının alt ve orta kategorilerine ait. Üst kademeler, kapsamlı bir şekilde yeniden tasarlanmış bir GCN mimarisine sahip olması beklenen yaklaşan Vega GPU'ları tarafından işgal edilecek (Polaris, bu konuda 28nm Fiji ve Tonga yongalarından önemli ölçüde farklı değil).

NVIDIA Tesla P100 ve yeni TITAN X

NVIDIA'nın daimi CEO'su Jensen Huang'ın çabaları sayesinde şirket, kendisini bir oyun GPU'su üreticisinden daha az olmayan genel amaçlı bilgi işlem işlemcileri üreticisi olarak konumlandırıyor. NVIDIA'nın süper bilgi işlem işini her zamankinden daha fazla ciddiye aldığının bir işareti, Pascal GPU serisinin bir yanda oyun pozisyonları ve diğer yanda bilgi işlem olarak bölünmesidir.

16nm FinFET süreci TSMC'ye ulaşır ulaşmaz NVIDIA, tüketici Pascal ürün serisinden daha önce piyasaya sürülen GP100 süper bilgisayar çipinin öncülüğünü yaptı.

GP100'ün ayırt edici özellikleri, benzeri görülmemiş sayıda transistör (15,3 milyar) ve gölgelendirici ALU'lar (3840 CUDA çekirdeği). Ek olarak, bu, bir silikon alt tabaka üzerinde bir GPU ile birleştirilmiş HBM2 bellek (16 GB) ile donatılan ilk hızlandırıcıdır. GP100, Tesla P100 hızlandırıcılarında kullanılır, başlangıçta NVLINK veri yolu ile özel form faktörü nedeniyle süper bilgisayar alanıyla sınırlıdır, ancak daha sonra NVIDIA Tesla P100'ü standart PCI Express genişletme kartı formatında piyasaya sürdü.

Uzmanlar başlangıçta P100'ün oyun grafik kartlarında görünebileceğini düşünüyorlardı. Görünüşe göre NVIDIA bu olasılığı reddetmedi, çünkü çip 3D grafikler oluşturmak için tam teşekküllü bir boru hattına sahip. Ancak artık bilgisayar nişinin ötesine geçmenin pek mümkün olmadığı açık. Grafikler için NVIDIA'nın ilgili bir ürünü vardır - GP100 ile aynı gölgelendirici ALU'ları, doku eşleme birimleri ve ROP'lere sahip olan, ancak çok sayıda 64-bit CUDA çekirdeği biçiminde balasttan yoksun olan GP102. diğer mimari değişikliklerden (daha az zamanlayıcı, sadeleştirilmiş L2 önbellek, vb.) bahsedin. Sonuç, GDDR5X lehine HBM2 belleğinin terk edilmesiyle birleştiğinde, NVIDIA'nın GP102'yi daha geniş bir pazara genişletmesine izin veren daha kompakt (12 milyar transistör) bir çekirdektir.

Şimdi GP102, düşük hassasiyetli hesaplamalar için bir kart olarak konumlandırılan (Maxwell mimarisinin GM200 yongasına dayanan GeForce GTX TITAN X ile karıştırılmamalıdır) profesyonel TITAN X hızlandırıcısı için ayrılmıştır (aralık aralığında). 8 ila 32 bit, aralarında 8 ve 16'sı NVIDIA'nın en sevdiği derin eğitimdir) oyunlardan bile daha fazladır, ancak varlıklı oyuncular 1.200 dolara bir ekran kartı satın alabilirler.Gerçekten de, oyun testlerimizde TITAN X, maliyetini bir GeForce GTX 1080'e göre %15-20 avantaj, ancak hız aşırtma kurtarmaya geliyor. Hız aşırtmalı GTX 1080 ve TITAN X karşılaştırıldığında, ikincisi zaten %34 daha hızlı. Bununla birlikte, yeni GP102 tabanlı oyun amiral gemisinin daha az aktif hesaplama birimine sahip olması veya herhangi bir hesaplama işlevi için (veya her ikisi birlikte) desteğini kaybetmesi muhtemeldir.

Genel olarak, GP100 ve GP102 gibi devasa GPU'ları 16nm FinFET sürecinin başlarında piyasaya sürmek, özellikle şirketin 40nm ve 28nm döneminde karşılaştığı zorluklar düşünüldüğünde, NVIDIA için büyük bir başarı.

NVIDIA GeForce GTX 1070 ve 1080

NVIDIA, GeForce 10 serisi oyun hızlandırıcıları serisini, en güçlü modellerden daha bütçeli modellere kadar her zamanki sırasına göre piyasaya sürdü. GeForce GTX 1080 ve sonraki Pascal oyun kartları, NVIDIA'nın çipleri daha yoğun ve enerji açısından verimli hale getirmek için 14/16 nm FinFET sürecini tamamen benimsediğini en çarpıcı şekilde göstermiştir.

Ayrıca NVIDIA, Pascal'ı oluşturarak (GP100 ve GP102'nin gösterdiği gibi) çeşitli hesaplama görevlerinde performansı artırmakla kalmadı, aynı zamanda Maxwell çip mimarisini grafik oluşturmayı optimize eden işlevlerle destekledi.

Başlıca yenilikleri kısaca vurgulayalım:

  • 8:1'e varan oranlarda geliştirilmiş renk sıkıştırması;
  • PolyMorph Engine'in tek geçişte 16 adede kadar sahne geometrisi projeksiyonu oluşturmaya izin veren Eşzamanlı Çoklu Projeksiyon işlevi (NVIDIA Surround konfigürasyonunda VR ve çoklu ekran sistemleri için);
  • GPU hesaplama kaynaklarının dinamik tahsisi ile birlikte, asenkron hesaplama (Async Compute) için tam destek sağlayan, bir beraberlik çağrısının yürütülmesi (oluşturma sırasında) ve bir komut akışı (hesaplamalar sırasında) sırasında kesme (preemption) yeteneği - API DirectX 12 altındaki oyunlarda ek bir performans kaynağı ve VR'de azaltılmış gecikme.

Son nokta özellikle ilginçtir, çünkü Maxwell çipleri teknik olarak asenkron hesaplamalarla (hesaplama ve grafik komut kuyruklarıyla eşzamanlı çalışma) uyumluydu, ancak bu moddaki performans arzulanan çok şey bıraktı. Pascal'daki asenkron bilgi işlem olması gerektiği gibi çalışır ve fizik hesaplamaları için ayrı bir iş parçacığına sahip oyunlarda daha verimli GPU yüklemesine izin verir (kuşkusuz, NVIDIA yongaları için gölgelendirici ALU'larının tam yüklenmesi sorunu AMD GPU'ları kadar akut değildir).

GTX 1070 ve GTX 1080'de kullanılan GP104 işlemci, GM204'ün (Maxwell ailesindeki ikinci katman çip) halefidir, ancak NVIDIA, GTX 1080'nin GTX TITAN X'ten daha iyi performans gösterecek kadar yüksek saat hızlarına ulaştı (daha büyük GPU'ya dayalı). ) ortalama% 29 ve tüm bunlar daha muhafazakar bir termal paket çerçevesinde (180'e karşı 250 W). Kesilmesi GTX 980'e kıyasla GTX 970'ten çok daha zor olan GTX 1070 bile (ayrıca GTX 1070, GTX 1080'de GDDR5X yerine GDDR5 bellek kullanıyor), GTX TITAN X'ten hala %5 daha hızlı.

NVIDIA, artık DisplayPort 1.3 / 1.4 ve HDMI 2.b ile uyumlu olan Pascal'daki ekran denetleyicisini güncelledi; bu, 60'ta 5K'ya kadar tek bir kablo üzerinden daha yüksek çözünürlüklü veya yenileme hızına sahip bir görüntü çıkışı almanıza olanak tanıdığı anlamına gelir. 120 Hz'de Hz veya 4K. 10/12 bit renk gösterimi, daha az yetenekli ekranda dinamik aralık (HDR) desteği sağlar. Özel Pascal donanımı, HEVC (H.265) videoyu 4K çözünürlüğe, 10 bit renge (12 bit kod çözme) ve 60 Hz'ye kadar kodlayabilir ve kodunu çözebilir.

Son olarak, Pascal'da, SLI veri yolunun önceki sürümünde bulunan sınırlamalar ortadan kalktı. Geliştiriciler arayüzün frekansını yükseltti ve yeni, iki kanallı bir köprü yayınladı.

Pascal mimarisinin bu özellikleri hakkında daha fazla bilgiyi GeForce GTX 1080 incelememizde okuyabilirsiniz. Ancak geçen yılın diğer yeniliklerine geçmeden önce, NVIDIA'nın 10. GeForce serisinde ilgili modellerin ömrü boyunca ilk kez referans tasarım kartlarını piyasaya süreceğini belirtmekte fayda var. Artık Founders Edition olarak adlandırılıyorlar ve ortak grafik kartları için MSRP'den daha fazlasına satılıyorlar. Örneğin, GTX 1070 ve GTX 1080 için önerilen fiyatlar 379 dolar ve 599 dolar (gençliklerinde GTX 970 ve GTX 980'den zaten daha yüksek) ve Founders Edition sürümleri 449 dolar ve dolar olarak fiyatlandırılıyor. 699.

GeForce GTX 1050 ve1060

GP106 yongası, Pascal mimarisini oyun hızlandırıcılarının ana akım segmentine genişletti. İşlevsel olarak eski modellerden farklı değil ve bilgi işlem birimi sayısı açısından GP104'ün yarısı kadar. Doğru, GP106, GM206'nın (GM204'ün yarısıydı) aksine, 192 bitlik bir bellek veriyolu kullanır. Ek olarak, NVIDIA, GTX 1060 kartından SLI konektörlerini çıkardı ve fanları video alt sisteminin kademeli olarak yükseltilmesini üzdü: bu hızlandırıcı yeteneklerini tükettiğinde, ona ikinci bir video kartı eklemeyeceksiniz (DirectX 12 altındaki oyunlar hariç). Sürücüyü atlayarak yükü GPU'lar arasında dağıtmanıza izin verir).

GTX 1060 orijinal olarak tamamen işlevsel bir GP106 yongası olan 6GB GDDR5 ile geldi ve 249/299 dolara (sırasıyla ortak kartlar ve Founders Edition) satışa çıktı. Ancak daha sonra NVIDIA, 3 GB belleğe ve önerilen 199 $ fiyatına sahip bir video kartı çıkardı ve bu da hesaplama birimlerinin sayısını azalttı. Her iki ekran kartı da 120W'lık çekici bir TDP'ye sahip ve hız açısından GeForce GTX 970 ve GTX 980'e benziyor.

GeForce GTX 1050 ve GTX 1050 Ti, Pascal mimarisi tarafından benimsenen en düşük kategoriye aittir. Ancak ağabeylerinin geçmişine karşı ne kadar mütevazı görünürlerse görünsünler, NVIDIA bütçe nişinde ileriye doğru en büyük adımı attı. Daha önce işgal eden GTX 750/750 Ti, Maxwell mimarisinin ilk yinelemesine aittir, bu nedenle GTX 1050/1050 Ti, Pascal ailesinin diğer hızlandırıcılarının aksine, bir değil bir buçuk nesil ilerlemiştir. Önemli ölçüde daha büyük bir GPU ve daha yüksek frekanslarda saat hızına sahip bellek sayesinde GTX 1050/1050 Ti, Pascal serisindeki diğerlerinden daha fazla performans sunar (GTX 750 Ti ve GTX 1050 Ti arasında %90 fark).

GTX 1050/1050 Ti biraz daha fazla güç çekse de (75 W'a karşı 60 W), yine de güç konektörü olmayan PCI Express kartlarının güç gereksinimleri dahilindedir. Daha genç hızlandırıcılar NVIDIA, Founders Edition formatında piyasaya sürmedi ve önerilen perakende fiyatları 109 $ ve 139 $ idi.

AMD Polaris: Radeon RX 460/470/480

AMD'nin Pascal'a yanıtı Polaris çip ailesidir. Polaris hattı şimdi, AMD'nin yerleşik RAM miktarının ek olarak değiştirildiği üç video kartı (Radeon RX 460, RX 470 ve RX 480) ürettiği temelinde yalnızca iki yonga içeriyor. Model numaralarından da rahatlıkla anlayabileceğiniz gibi, 400 serisi Radeon'da performansın en üst kademesi işgal edilmiyor. AMD, onu Vega silikon bazlı ürünlerle doldurmak zorunda kalacak. 28 nm çağında, AMD bu alışkanlığı edindi - yenilikleri nispeten küçük yongalarda test etmek ve ancak daha sonra bunları amiral gemisi GPU'larda uygulamak.

Hemen belirtmek gerekir ki, AMD söz konusu olduğunda, yeni grafik işlemcileri ailesi, temel mimari GCN'nin (Graphics Core Next) yeni sürümüyle aynı değildir, ancak mimarinin ve ürünün diğer özelliklerinin bir kombinasyonunu yansıtır. AMD, yeni işlem teknolojisi kullanılarak oluşturulan GPU'lar için kod adındaki çeşitli "adaları" (Kuzey Adaları, Güney Adaları, vb.) terk etti ve onları yıldız adlarıyla belirtiyor.

Bununla birlikte, Polaris'teki GCN mimarisi, (14 nm FinFET işlem teknolojisine geçişle birlikte) AMD'nin watt başına performansı önemli ölçüde artırdığı için arka arkaya üçüncü bir güncelleme daha aldı.

  • GCN'de gölgelendirici ALU'larını düzenlemenin temel bir biçimi olan Bilgi İşlem Birimi, talimatların önceden getirilmesi ve önbelleğe alınmasıyla ilgili bir dizi değişiklikten geçti, L2 önbelleğine yapılan çağrılar, birlikte spesifik CU performansını %15 artırdı.
  • Artık bilgisayarla görme ve makine öğrenimi programlarında kullanılan yarı hassas (FP16) hesaplamalar için destek var.
  • GCN 1.3, donanımdan soyutlanan DirectX ve OpenGL gölgelendirici dillerinin aksine, geliştiricilerin mümkün olduğunca "düşük seviyeli" ve hızlı kod yazmasına olanak tanıyan akış işlemcilerinin dahili komut kümesine (ISA) doğrudan erişim sağlar. .
  • Geometrik işlemciler artık boru hattının ilk aşamalarında sıfır boyutlu çokgenleri veya projeksiyonda pikselsiz çokgenleri hariç tutabilir ve küçük kopya geometriyi işlerken kaynak tüketimini azaltan bir dizin önbelleği aldı.
  • Çift L2 önbellek.

Ek olarak, AMD mühendisleri Polaris'in mümkün olan en yüksek frekansta çalışmasını sağlamak için büyük çaba harcadı. GPU frekansı artık minimum bir gecikme ile kontrol ediliyor (1 ns'den az gecikme) ve voltaj eğrisi, bireysel yongalar ve silikonun yaşlanması arasındaki parametrelerdeki değişimi hesaba katmak için bilgisayar her başlatıldığında kart tarafından düzeltiliyor. operasyon sırasında.

Ancak 14nm FinFET sürecine geçiş AMD için sorunsuz gitmedi. Gerçekten de şirket, watt başına performansı %62 oranında artırmayı başardı (oyun testlerinde Radeon RX 480 ve Radeon R9 380X'in sonuçlarına ve kartların pasaport TDP'sine bakılırsa). Bununla birlikte, Polaris'in maksimum frekansları 1266 MHz'i geçmez ve yalnızca birkaç üretici ortağı, soğutma ve güç kaynağı üzerinde ek çalışmalarla daha fazlasını elde etti. Öte yandan, GeForce video kartları performans açısından hâlâ liderliğini koruyor - NVIDIA'nın Maxwell neslinde ulaştığı güç. Görünüşe göre AMD, yeni nesil süreç teknolojisinin tüm yeteneklerini ortaya çıkaramadı veya GCN mimarisinin kendisi zaten derin bir modernizasyon gerektiriyor - son görev Vega yongalarında kaldı.

Polaris tabanlı hızlandırıcıların fiyatları 109 ile 239 dolar arasında değişiyor (tabloya bakın), ancak GeForce GTX 1050/1050 Ti'nin gelişine yanıt olarak AMD, iki düşük kaliteli kartın fiyatlarını 100 dolar ve 170 dolara düşürdü. , sırasıyla. Şu anda, her fiyat/performans kategorisinde, rakip ürünler arasında benzer bir güç dengesi var: GeForce GTX 1050 Ti, 4GB RAM'e sahip Radeon RX 460'tan daha hızlı, 3GB belleğe sahip GTX 1060, diğer modellerden daha hızlı. RX 470 ve tam teşekküllü GTX 1060, RX.480'den daha iyi performans gösteriyor. Aynı zamanda, AMD ekran kartları daha ucuz, yani popülerler.

AMD Radeon Pro Duo

"Kırmızı" ekran kartlarından birini görmezden gelirsek, ayrı GPU'lar alanındaki geçen yılki rapor tamamlanmayacaktır. AMD, Radeon R9 Fury X'in yerini alacak amiral gemisi tek işlemcili video adaptörünü henüz piyasaya sürmemiş olsa da, şirketin yeni sınırları fethetmeye devam etmek için kanıtlanmış bir hamlesi kaldı - bir karta iki Fiji yongası kurmak. AMD'nin defalarca çıkışını ertelediği bu kart, yine de GeForce GTX 1080'den kısa bir süre önce satışa çıktı, ancak profesyonel Radeon Pro hızlandırıcıları kategorisine girdi ve VR ortamında oyun oluşturmak için bir platform olarak konumlandı.

Oyuncular için 1.499 dolardan (yayınlandığı sırada bir çift Radeon R9 Fury X'ten daha pahalı), Radeon Pro Duo ilginç değil ve bu kartı test etme fırsatımız bile olmadı. Yazık çünkü teknik açıdan Radeon Pro Duo ilgi çekici görünüyor. AMD işlemcilerin tepe frekanslarının 50 MHz düşürülmesine rağmen, kartın pasaport TDP'si Fury X'e kıyasla sadece %27 arttı. Daha önce AMD, başarılı bir çift işlemcili ekran kartı - Radeon R9 295X2 piyasaya sürmeyi başardı, bu nedenle üretici tarafından açıklanan özellikler fazla şüpheciliğe neden olmuyor.

2017'de neler bekleniyor?

Önümüzdeki yıl için ana beklentiler AMD ile ilgili. NVIDIA muhtemelen kendisini GeForce GTX 1080 Ti adlı amiral gemisi GP102 tabanlı bir oyun kartını piyasaya sürmekle sınırlayacak ve belki de 10 serisi GeForce - GTX 1060 Ti'deki başka bir boşluğu dolduracak. Pascal hızlandırıcı serisinin geri kalanı zaten oluşturuldu ve bir sonraki mimari Volta'nın ilk çıkışı sadece 2018 için planlandı.

CPU'da olduğu gibi AMD, GPU'lar için gerçekten yıkıcı bir mikromimari geliştirmek için tüm gücünü topladı, Polaris ise ikincisine giden yolda yalnızca bir hazırlık noktası oldu. Muhtemelen, zaten 2017'nin ilk çeyreğinde, şirket en iyi silikonu Vega 10'u ilk kez kitle pazarına sunacak (ve onunla veya daha sonra - hatta bir veya daha fazla junior çip). Yeteneklerinin en güvenilir kanıtı, derin öğrenme görevleri için bir hızlandırıcı olarak konumlandırılan Radeon Instinct serisindeki MI25 bilgi işlem kartının duyurulmasıydı. Spesifikasyonlara dayanarak, Vega 10'dan başkasını temel almıyor. Kart, 12,5 TFLOPS tek duyarlıklı (FP32) bilgi işlem gücü sağlıyor - GP102'deki TITAN X'ten daha fazla - ve 16 GB HBM2 bellekle geliyor. Video kartının TDP'si 300 watt içinde. İşlemcinin gerçek hızı herkesin tahmininde olsa da, Vega'nın beş yıl önce ilk GCN tabanlı çiplerin piyasaya sürülmesinden bu yana en büyük GPU mikromimari güncellemesini getireceği biliniyor. İkincisi, watt başına performansı önemli ölçüde artıracak ve oyun uygulamalarında gölgelendirici ALU'ların (AMD çiplerinde geleneksel olarak eksik olan) bilgi işlem gücünün daha verimli kullanılmasına izin verecektir.

Ayrıca AMD mühendislerinin 14nm FinFET işleminde mükemmel bir şekilde ustalaştığı ve şirketin önemli ölçüde daha düşük TDP ile Polaris grafik kartlarının ikinci sürümünü piyasaya sürmeye hazır olduğu söyleniyor. Bize öyle geliyor ki, eğer bu doğruysa, güncellenen yongalar mevcut 400 serisinde artan indeksler almak yerine Radeon RX 500 hattına gidecek.

Başvuru. AMD ve NVIDIA'dan mevcut ayrık video bağdaştırıcıları serisi

Üretici firma AMD
modeli Radeon RX 460 Radeon RX470 Radeon RX480 Radeon R9 Nano Radeon R9 Öfke Radeon R9 Öfke X
GPU
İsim Kutup 11 Kutup 10 Kutup 10 Fiji XT Fiji PRO Fiji XT
mikromimari GCN 1.3 GCN 1.3 GCN 1.3 GCN 1.2 GCN 1.2 GCN 1.2
Proses teknolojisi, nm 14 nm FinFET 14 nm FinFET 14 nm FinFET 28 28 28
Transistör sayısı, milyon 3 000 5 700 5 700 8900 8900 8900
1 090 / 1 200 926 / 1 206 1 120 / 1 266 — / 1 000 — / 1 000 — / 1 050
Gölgelendirici ALU'larının sayısı 896 2 048 2 304 4096 3584 4096
56 128 144 256 224 256
ROP numarası 16 32 32 64 64 64
Veri deposu
Otobüs genişliği, bit 128 256 256 4096 4096 4096
Çip türü GDDR5 SDRAM'i GDDR5 SDRAM'i GDDR5 SDRAM'i HBM HBM HBM
1 750 (7 000) 1 650 (6 600) 1 750 (7 000) / 2 000 (8 000) 500 (1000) 500 (1000) 500 (1000)
Hacim, MB 2 048 / 4 096 4 096 4 096 / 8 192 4096 4096 4096
G / Ç veri yolu PCI Express 3.0x8 PCI Express 3.0x16 PCI Express 3.0x16 PCI Express 3.0x16 PCI Express 3.0x16 PCI Express 3.0x16
Verim
2 150 4 940 5 834 8 192 7 168 8 602
FP32 / FP64 performansı 1/16 1/16 1/16 1/16 1/16 1/16
112 211 196/224 512 512 512
Görüntü çıkışı
DL DVI-D, HDMI 2.0b, DisplayPort 1.3 / 1.4 DL DVI-D, HDMI 2.0b, DisplayPort 1.3 / 1.4 HDMI 1.4a, DisplayPort 1.2 HDMI 1.4a, DisplayPort 1.2 HDMI 1.4a, DisplayPort 1.2
TDP, W <75 120 150 175 275 275
109/139 179 199/229 649 549 649
8 299 / 10 299 15 999 16 310 / 18 970 ND ND ND
Üretici firma NVIDIA
modeli GeForce GTX 1050 GeForce GTX 1050 Ti GeForce GTX 1060 3 GB GeForce GTX 1060 GeForce GTX 1070 GeForce GTX 1080 TİTAN X
GPU
İsim GP107 GP107 GP106 GP106 GP104 GP104 GP102
mikromimari paskal paskal Maxwell Maxwell paskal paskal paskal
Proses teknolojisi, nm 14 nm FinFET 14 nm FinFET 16 nm FinFET 16 nm FinFET 16 nm FinFET 16 nm FinFET 16 nm FinFET
Transistör sayısı, milyon 3 300 3 300 4 400 4 400 7 200 7 200 12 000
Saat frekansı, MHz: Temel Saat / Hızlandırma Saati 1 354 / 1 455 1 290 / 1 392 1506/1708 1506/1708 1 506 / 1 683 1 607 / 1 733 1 417 / 1531
Gölgelendirici ALU'larının sayısı 640 768 1 152 1 280 1 920 2 560 3 584
Doku eşleme birimlerinin sayısı 40 48 72 80 120 160 224
ROP numarası 32 32 48 48 64 64 96
Veri deposu
Otobüs genişliği, bit 128 128 192 192 256 256 384
Çip türü GDDR5 SDRAM'i GDDR5 SDRAM'i GDDR5 SDRAM'i GDDR5 SDRAM'i GDDR5 SDRAM'i GDDR5X SDRAM'i GDDR5X SDRAM'i
Saat frekansı, MHz (kişi başına bant genişliği, Mbps) 1 750 (7 000) 1 750 (7 000) 2000 (8000) 2000 (8000) 2000 (8000) 1 250 (10 000) 1 250 (10 000)
Hacim, MB 2 048 4 096 6 144 6 144 8 192 8 192 12 288
G / Ç veri yolu PCI Express 3.0x16 PCI Express 3.0x16 PCI Express 3.0x16 PCI Express 3.0x16 PCI Express 3.0x16 PCI Express 3.0x16 PCI Express 3.0x16
Verim
En yüksek performans FP32, GFLOPS (belirtilen maksimum frekansa göre) 1 862 2 138 3 935 4 373 6 463 8 873 10 974
FP32 / FP64 performansı 1/32 1/32 1/32 1/32 1/32 1/32 1/32
Bellek bant genişliği, GB / s 112 112 192 192 256 320 480
Görüntü çıkışı
Görüntü çıkış arayüzleri DL DVI-D, DisplayPort 1.3 / 1.4, HDMI 2.0b DL DVI-D, DisplayPort 1.3 / 1.4, HDMI 2.0b DL DVI-D, DisplayPort 1.3 / 1.4, HDMI 2.0b DL DVI-D, DisplayPort 1.3 / 1.4, HDMI 2.0b DL DVI-D, DisplayPort 1.3 / 1.4, HDMI 2.0b DL DVI-D, DisplayPort 1.3 / 1.4, HDMI 2.0b
TDP, W 75 75 120 120 150 180 250
Yayınlanma sırasındaki MSRP (ABD, vergi hariç), $ 109 139 199 249/299 (Founders Edition / Ortaklık Kartları) 379/449 (Founders Edition / Ortaklık Kartları) 599/699 (Founders Edition / Ortaklık Kartları) 1 200
Piyasaya sürüldüğü sırada önerilen perakende satış fiyatı (Rusya), ruble 8 490 10 490 ND 18,999 / - (Founders Edition / Ortaklık Kartları) ND / 34 990 (Founders Edition / ortak kartları) ND / 54 990 (Founders Edition / ortak kartları)

Video kartının temel bileşenleri:

  • çıktılar;
  • arayüzler;
  • soğutma sistemi;
  • grafik işlemcisi;
  • video belleği.

Grafik teknolojileri:

  • sözlük;
  • GPU mimarisi: işlevler
    köşe / piksel birimleri, gölgelendiriciler, doluluk oranı, doku / raster birimleri, boru hatları;
  • GPU mimarisi: teknoloji
    teknik süreç, GPU frekansı, yerel video belleği (boyut, veri yolu, tür, frekans), birkaç video kartıyla çözümler;
  • görsel işlevler
    DirectX, yüksek dinamik aralık (HDR), tam ekran kenar yumuşatma, doku filtreleme, yüksek tanımlı dokular.

Temel grafik terimleri sözlüğü

Yenileme hızı

Tıpkı bir sinemada veya TV'de olduğu gibi, bilgisayarınız bir dizi kare görüntüleyerek bir monitörde hareketi simüle eder. Monitörün yenileme hızı, görüntünün saniyede kaç kez ekranda yenileneceğini gösterir. Örneğin 75 Hz, saniyede 75 güncellemeye karşılık gelir.

Bilgisayar, kareleri monitörün görüntüleyebileceğinden daha hızlı işliyorsa, oyunlarda sorunlar ortaya çıkabilir. Örneğin, bilgisayar saniyede 100 kare oluşturuyorsa ve monitör yenileme hızı 75 Hz ise, bindirmeler nedeniyle monitör yenileme süresi boyunca resmin yalnızca bir bölümünü görüntüleyebilir. Sonuç olarak, görsel artefaktlar ortaya çıkar.

Çözüm olarak V-Sync'i (dikey senkronizasyon) etkinleştirebilirsiniz. Bilgisayar tarafından yayılan çerçeve sayısını monitörün yenileme hızıyla sınırlayarak yapaylık oluşmasını engeller. V-Sync'i etkinleştirirseniz, oyunda oluşturulan kare sayısı hiçbir zaman yenileme hızını aşamaz. Yani 75 Hz'de bilgisayar saniyede 75 kareden fazla çıktı vermeyecektir.

piksel

"Piksel" kelimesi " resim tur el ement "bir görüntü öğesidir. Bu, ekranda belirli bir renkte parlayabilen küçük bir noktadır (çoğu durumda bir ton, üç temel rengin birleşiminden elde edilir: kırmızı, yeşil ve mavi). Ekran çözünürlüğü 1024 × 768 ise, 1024 piksel genişliğinde ve 768 piksel yüksekliğinde bir matris görebilirsiniz. Pikseller birlikte görüntüyü oluşturur. Ekrandaki resim, ekran tipine ve video kartının çıktısı tarafından üretilen verilere bağlı olarak saniyede 60 ila 120 kez yenilenir. CRT monitörler ekranı satır satır güncellerken düz panel LCD monitörler her pikseli ayrı ayrı güncelleyebilir.

tepe noktası

3B sahnedeki tüm nesneler köşelerden oluşur. Köşe, X, Y ve Z koordinatlarına sahip üç boyutlu uzayda bir noktadır. Birkaç köşe bir çokgen halinde gruplandırılabilir: çoğu zaman bir üçgendir, ancak daha karmaşık şekiller de mümkündür. Daha sonra poligona, nesnenin gerçekçi görünmesini sağlayan bir doku uygulanır. Yukarıdaki şekilde gösterilen 3B küpün sekiz köşesi vardır. Daha karmaşık nesneler, aslında çok sayıda köşeden oluşan kavisli yüzeylere sahiptir.

Doku

Bir doku, yüzeyini simüle etmek için bir 3B nesnenin üzerine bindirilen herhangi bir boyuttaki 2B bir görüntüdür. Örneğin, 3B küpümüzün sekiz köşesi vardır. Doku haritalamadan önce basit bir kutuya benziyor. Ama dokuyu uyguladığımızda kutu renkleniyor.

gölgelendirici

Piksel gölgelendirici yazılımı, grafik kartının Elder Scrolls: Oblivion'daki su gibi etkileyici efektler üretmesini sağlar.

Bugün iki tür gölgelendirici vardır: köşe ve piksel. Vertex gölgelendiriciler, 3B nesneleri değiştirebilir veya dönüştürebilir. Piksel gölgelendiriciler, verilere dayalı olarak piksellerin renklerini değiştirmenize olanak tanır. Bir 3B sahnede, aynı anda diğer nesnelere gölge düşürürken aydınlatılan nesnelerin daha parlak olmasını sağlayan bir ışık kaynağı hayal edin. Bütün bunlar piksellerin renk bilgisi değiştirilerek gerçekleştirilir.

Piksel gölgelendiriciler, favori oyunlarınızda karmaşık efektler oluşturmak için kullanılır. Örneğin, gölgelendirici kodu, 3B kılıcı çevreleyen piksellerin daha parlak parlamasını sağlayabilir. Başka bir gölgelendirici, karmaşık bir 3B nesnenin tüm köşelerini işleyebilir ve bir patlamayı simüle edebilir. Oyun geliştiricileri, gerçekçi grafikler oluşturmak için giderek daha karmaşık gölgelendirici programlara yöneliyor. Zengin grafiklere sahip hemen hemen her modern oyun gölgelendirici kullanır.

Bir sonraki Microsoft DirectX 10 Uygulama Programlama Arayüzü'nün (API) piyasaya sürülmesiyle birlikte, geometri gölgelendiriciler adı verilen üçüncü bir gölgelendirici türü olacaktır. Onların yardımıyla, istenen sonuca bağlı olarak nesneleri kırmak, değiştirmek ve hatta yok etmek mümkün olacaktır. Üçüncü tür gölgelendirici, ilk ikisiyle aynı şekilde programlanabilir, ancak rolü farklı olacaktır.

Doldurma oranı

Çok sık bir video kartı olan kutuda, doluluk oranının değerini bulabilirsiniz. Temel olarak doluluk oranı, GPU'nun pikselleri ne kadar hızlı teslim edebileceğini gösterir. Eski video kartlarında üçgen doluluk oranını görebilirdiniz. Ancak bugün iki tür doldurma hızı vardır: piksel doldurma hızı ve doku doldurma hızı. Belirtildiği gibi, piksel doldurma hızı, piksel çıkış hızına karşılık gelir. Raster işlemlerinin (ROP) sayısının saat hızıyla çarpımı olarak hesaplanır.

ATi ve nVidia doku doldurma oranlarını farklı şekilde hesaplar. nVidia, hızın piksel ardışık düzenlerinin sayısını saat hızıyla çarparak elde edildiğini düşünüyor. ATi, doku birimlerinin sayısını saat hızıyla çarpar. Prensipte, her iki yöntem de doğrudur, çünkü nVidia piksel gölgelendirici birimi başına bir doku birimi kullanır (yani, piksel ardışık düzeni başına bir tane).

Bu tanımları göz önünde bulundurarak, bir GPU'nun en önemli işlevlerini, ne yaptıklarını ve neden bu kadar önemli olduklarını tartışmama izin verin.

GPU mimarisi: özellikler

3D grafiklerin gerçekçiliği, büyük ölçüde video kartının performansına bağlıdır. İşlemci ne kadar çok piksel gölgelendirici bloğu içeriyorsa ve frekans ne kadar yüksekse, görsel algısını iyileştirmek için bir 3B sahneye o kadar fazla efekt uygulanabilir.

GPU, birçok farklı işlevsel blok içerir. Bazı bileşenlerin sayısına göre GPU'nun ne kadar güçlü olduğunu tahmin edebilirsiniz. Devam etmeden önce, en önemli fonksiyonel bloklara bir göz atalım.

Vertex işlemciler (köşe gölgelendirici birimleri)

Piksel gölgelendirici birimleri gibi, köşe işlemcileri de köşelere dokunan gölgelendirici kodunu yürütür. Daha yüksek bir köşe bütçesi, daha karmaşık 3B nesneler oluşturmanıza izin verdiğinden, köşe işlemcilerinin performansı, karmaşık nesneler veya çok sayıda nesne içeren 3B sahnelerde çok önemlidir. Bununla birlikte, köşe gölgelendirici birimleri, performansı piksel işlemciler kadar açık bir şekilde etkilemiyor.

Piksel İşlemciler (Piksel Gölgelendirici Birimleri)

Bir piksel işlemcisi, piksel gölgelendirici programlarını işlemeye ayrılmış grafik yongasının bir bileşenidir. Bu işlemciler yalnızca piksele özgü hesaplamalar gerçekleştirir. Pikseller renk bilgisi içerdiğinden, piksel gölgelendiriciler etkileyici grafik efektler elde edebilir. Örneğin, oyunlarda gördüğünüz su efektlerinin çoğu piksel gölgelendiriciler kullanılarak oluşturulur. Tipik olarak, video kartlarının piksel performansını karşılaştırmak için piksel işlemcilerinin sayısı kullanılır. Bir kart sekiz piksel gölgelendirici birimiyle ve diğeri 16 birim ile donatılmışsa, 16 birimli bir video kartının karmaşık piksel programlarını daha hızlı işleyeceğini varsaymak oldukça mantıklıdır. Saat hızını da göz önünde bulundurmalısınız, ancak günümüzde piksel işlemcilerinin sayısını iki katına çıkarmak, grafik yongasının frekansını iki katına çıkarmaktan daha fazla enerji tasarrufu sağlıyor.

Birleşik gölgelendiriciler

Birleşik (tek biçimli) gölgelendiriciler henüz PC dünyasına gelmedi, ancak yaklaşan DirectX 10 standardı benzer bir mimariye dayanıyor. Yani, gölgelendiriciler farklı işler yapacak olsa da, köşe, geometrik ve piksel programlarının kodunun yapısı aynı olacaktır. Yeni özellik, GPU'nun ATi tarafından Microsoft için özel olarak tasarlandığı Xbox 360'ta görüntülenebilir. Yeni DirectX 10'un nasıl bir potansiyele sahip olduğunu görmek oldukça ilginç olacak.

Doku Eşleme Birimleri (TMU)

Dokular seçilmeli ve filtrelenmelidir. Bu iş, piksel ve tepe gölgelendiricileri ile birlikte çalışan doku eşleme birimleri tarafından yapılır. TMU'nun işi, piksellere doku işlemleri uygulamaktır. Bir GPU'daki doku birimlerinin sayısı, genellikle video kartlarının doku performansını karşılaştırmak için kullanılır. Daha fazla TMU'ya sahip bir ekran kartının daha yüksek doku performansı vereceğini varsaymak oldukça mantıklı.

Raster Operatör Birimleri (ROP'ler)

RIP'ler, piksel verilerinin belleğe yazılmasından sorumludur. Bu işlemin gerçekleştirilme hızı doluluk oranıdır. 3D hızlandırıcıların ilk günlerinde, ROP'ler ve doluluk oranları, grafik kartlarının çok önemli özellikleriydi. Günümüzde ROP performansı hala önemlidir, ancak bir video kartının performansı artık eskisi gibi bu bloklarla sınırlı değildir. Bu nedenle, ROP'lerin performansı (ve sayısı) zaten bir video kartının hızını tahmin etmek için nadiren kullanılmaktadır.

konveyörler

Boru hatları, video kartlarının mimarisini tanımlamak için kullanılır ve GPU'nun performansının çok görsel bir temsilini sağlar.

Konveyör katı bir teknik terim değildir. GPU, farklı işlevleri gerçekleştiren farklı ardışık düzenleri kullanır. Tarihsel olarak, bir boru hattı, kendi doku eşleme birimine (TMU) bağlı bir piksel işlemcisi olarak anlaşıldı. Örneğin Radeon 9700 video kartı, her biri kendi TMU'suna bağlı sekiz piksel işlemci kullanıyor, bu nedenle kartın sekiz ardışık düzene sahip olduğu düşünülüyor.

Ancak modern işlemcileri boru hatlarının sayısına göre tanımlamak çok zordur. Önceki tasarımlarla karşılaştırıldığında, yeni işlemciler modüler, parçalı bir yapı kullanıyor. ATi, X1000 serisi video kartlarıyla modüler bir yapıya geçerek dahili optimizasyon yoluyla performans kazanımları elde etmeyi mümkün kılan bu alanda bir yenilikçi olarak kabul edilebilir. Bazı CPU blokları diğerlerinden daha fazla kullanılır ve GPU performansını iyileştirmek için ATi, gerekli blok sayısı ile kalıp alanını dengelemeye çalıştı (bu aşırı boyutlandırılamaz). Bu mimaride, piksel işlemcileri artık kendi TMU'larına bağlı olmadığı için "piksel ardışık düzen" terimi anlamını yitirmiştir. Örneğin, ATi Radeon X1600 GPU, 12 Piksel Gölgelendiriciye ve sadece dört TMU'ya sahiptir. Dolayısıyla bu işlemcinin mimarisinin 12 piksel ardışık düzene sahip olduğu söylenemez, tıpkı sadece dört tane olduğunu söylemek gibi. Bununla birlikte, gelenek gereği, piksel boru hatlarından hala bahsedilmektedir.

Bu varsayımlar dikkate alındığında, bir GPU'daki piksel ardışık düzenlerinin sayısı genellikle video kartlarını karşılaştırmak için kullanılır (ATi X1x00 hattı hariç). Örneğin, 24 ve 16 boru hatlı ekran kartlarını alırsak, 24 boru hatlı bir kartın daha hızlı olacağını varsaymak oldukça mantıklıdır.

GPU mimarisi: teknoloji

teknik süreç

Bu terim, çipin bir elemanının (transistör) boyutunu ve üretim sürecinin hassasiyetini ifade eder. Teknik süreçlerin iyileştirilmesi, daha küçük boyutlu elemanlar elde etmenizi sağlar. Örneğin, 0.18 mikronluk işlem 0.13 mikronluk işlemden daha büyük elementler üretir, bu nedenle o kadar verimli değildir. Daha küçük transistörler daha düşük voltajlarda çalışır. Buna karşılık, voltajdaki bir düşüş, termal dirençte bir azalmaya yol açar ve bu da üretilen ısı miktarında bir azalma sağlar. Teknik sürecin iyileştirilmesi, çipin işlevsel blokları arasındaki mesafenin azaltılmasına olanak tanır ve veri aktarımı daha az zaman alır. Daha kısa mesafeler, daha düşük voltajlar ve diğer iyileştirmeler, daha yüksek saat hızlarının elde edilmesini sağlar.

Bugün teknik süreci belirtmek için hem mikrometre (μm) hem de nanometre (nm) kullanıldığından, anlayış biraz karmaşıktır. Aslında her şey çok basit: 1 nanometre 0,001 mikrometreye eşittir, yani 0,09 mikron ve 90 nm teknik işlemler bir ve aynıdır. Yukarıda belirtildiği gibi, daha küçük bir işlem teknolojisi, daha yüksek saat hızları elde etmenizi sağlar. Örneğin 0,18 mikron ve 0,09 mikron (90 nm) çipli ekran kartlarını karşılaştırırsak, 90 nm'lik bir karttan daha yüksek bir frekans beklemek oldukça mantıklıdır.

GPU saat hızı

GPU saat hızları, saniyede milyonlarca saat döngüsü olan megahertz (MHz) cinsinden ölçülür.

Saat hızı, GPU'nun performansını doğrudan etkiler. Ne kadar yüksekse, bir saniyede o kadar fazla iş yapılabilir. İlk örnek için nVidia GeForce 6600 ve 6600 GT grafik kartlarını ele alalım: 6600 GT GPU 500 MHz'de, normal 6600 kartı ise 400 MHz'de çalışır. İşlemciler teknik olarak aynı olduğu için 6600 GT'nin saat hızındaki %20'lik bir artış daha iyi performans anlamına geliyor.

Ancak saat hızı her şey değildir. Mimarinin performansı büyük ölçüde etkilediği unutulmamalıdır. İkinci örnek için GeForce 6600 GT ve GeForce 6800 GT ekran kartlarını ele alalım. 6600 GT'nin GPU'su 500 MHz'de çalışıyor, ancak 6800 GT sadece 350 MHz'de çalışıyor. Şimdi 6800 GT'nin 16 piksel ardışık düzen kullandığını, 6600 GT'nin ise yalnızca sekiz piksel kullandığını hesaba katalım. Bu nedenle, 350 MHz'de 16 işlem hattına sahip bir 6800 GT, sekiz işlem hattına sahip bir işlemci ile yaklaşık aynı performansı ve saat hızının iki katı (700 MHz) verecektir. Bununla birlikte, performansı karşılaştırmak için saat hızı kullanılabilir.

Yerel video belleği

Ekran kartı belleğinin performans üzerinde büyük etkisi vardır. Ancak farklı bellek parametreleri farklı şekillerde etkiler.

Video belleği boyutu

Video belleği miktarı, muhtemelen bir video kartının en fazla abartılan parametresi olarak adlandırılabilir. Deneyimsiz tüketiciler, farklı kartları birbirleriyle karşılaştırmak için genellikle video belleği miktarını kullanır, ancak gerçekte, bellek veri yolu frekansı ve arabirim (veri yolu genişliği) gibi parametrelerle karşılaştırıldığında miktarın performans üzerinde çok az etkisi vardır.

Çoğu durumda, 128 MB video belleğe sahip bir kart, 256 MB'lik bir kartla hemen hemen aynı performansı gösterecektir. Elbette, daha fazla belleğin performans artışına yol açtığı durumlar vardır, ancak daha fazla belleğin oyunlarda otomatik olarak hız artışına yol açmayacağını unutmayın.

Hacmin kullanışlı olduğu yer, yüksek çözünürlüklü dokulara sahip oyunlardır. Oyun geliştiricileri, oyun için birkaç doku seti sağlar. Ve video kartında ne kadar fazla bellek varsa, yüklenen dokuların çözünürlüğü o kadar yüksek olabilir. Yüksek çözünürlüklü dokular, oyunda daha yüksek tanım ve ayrıntı sağlar. Bu nedenle, diğer tüm kriterler aynıysa, büyük miktarda belleğe sahip bir kart almak oldukça mantıklıdır. Bellek veriyolu genişliği ve frekansının performans üzerinde karttaki fiziksel bellek miktarından çok daha güçlü bir etkiye sahip olduğunu bir kez daha hatırlatalım.

Bellek veriyolu genişliği

Bellek veriyolu genişliği, bellek performansının en önemli yönlerinden biridir. Modern veri yolları 64 ila 256 bit genişliğinde ve hatta bazı durumlarda 512 bittir. Bellek veriyolu ne kadar geniş olursa, saat döngüsü başına o kadar fazla bilgi iletebilir. Bu da performansı doğrudan etkiler. Örneğin, eşit frekanslara sahip iki veriyolu alırsak, teorik olarak 128-bit veriyolu, 64-bit veriyoluna göre saat başına iki kat daha fazla veri aktaracaktır. Ve 256-bit veri yolu iki kat daha büyük.

Daha yüksek veri yolu bant genişliği (saniyedeki bit veya bayt olarak ifade edilir, 1 bayt = 8 bit), daha yüksek bellek performansı sağlar. Bu nedenle bellek veriyolu, boyutundan çok daha önemlidir. Eşit frekanslarda, 64-bit bellek veriyolu, 256-bit olanın sadece %25'i hızında çalışır!

Aşağıdaki örneği ele alalım. 128 MB video belleğine sahip ancak 256 bit veri yoluna sahip bir video kartı, 64 bit veri yoluna sahip 512 MB modelden çok daha yüksek bellek performansı sağlar. Bazı ATi X1x00 kartları için üreticilerin dahili bellek veri yolunun özelliklerini belirttiğine dikkat etmek önemlidir, ancak biz harici veri yolunun parametreleriyle ilgileniyoruz. Örneğin, X1600'ün dahili halka veri yolu 256 bit genişliğindedir, ancak harici olan yalnızca 128 bit genişliğindedir. Ve gerçekte, bellek veri yolu 128 bit performansta çalışır.

Bellek türleri

Bellek iki ana kategoriye ayrılabilir: verilerin saat başına iki kat daha hızlı aktarıldığı SDR (tek veri aktarımı) ve DDR (çift veri aktarımı). Bugün, SDR tekli iletim teknolojisi eskidir. DDR bellek, verileri SDR bellekten iki kat daha hızlı aktardığından, DDR belleğe sahip video kartlarının genellikle fiziksel olanın değil, iki katı frekansta gösterildiğini unutmamak önemlidir. Örneğin, DDR bellek 1000 MHz olarak listeleniyorsa, bu, aynı bant genişliğini vermek için normal SDR belleğin çalışması gereken etkin frekanstır. Aslında, fiziksel frekans 500 MHz'dir.

Bu nedenle, video kartlarının belleği için 1200 MHz DDR frekansı belirtildiğinde ve yardımcı programlar 600 MHz bildirdiğinde çoğu kişi şaşırır. O yüzden alışmak zorundasın. DDR2 ve GDDR3/GDDR4 bellek aynı şekilde yani iki kat veri aktarımı ile çalışır. DDR, DDR2, GDDR3 ve GDDR4 arasındaki fark, üretim teknolojisinde ve bazı ayrıntılarda yatmaktadır. DDR2, DDR bellekten daha yüksek frekanslarda çalışabilir ve DDR3, DDR2'den bile daha yüksek frekanslarda çalışabilir.

Bellek veriyolu frekansı

Bir işlemci gibi, bellek (veya daha doğrusu bir bellek veri yolu), megahertz cinsinden ölçülen belirli saat hızlarında çalışır. Burada saat hızlarının artması bellek performansını doğrudan etkiler. Ve bellek veri yolu frekansı, video kartlarının performansını karşılaştırmak için kullanılan parametrelerden biridir. Örneğin, diğer tüm özellikler (bellek veriyolu genişliği vb.) aynıysa, 700 MHz belleğe sahip bir ekran kartının 500 MHz'lik bir ekran kartından daha hızlı olduğunu söylemek oldukça mantıklıdır.

Yine, saat hızı her şey değildir. 64 bit veri yoluna sahip 700 MHz bellek, 128 bit veri yoluna sahip 400 MHz bellekten daha yavaş olacaktır. 128-bit veri yolu üzerindeki 400 MHz belleğin performansı, 64-bit veri yolu üzerindeki 800 MHz belleğin performansı ile aşağı yukarı aynıdır. GPU ve bellek frekanslarının tamamen farklı parametreler olduğu ve genellikle farklı oldukları da unutulmamalıdır.

Grafik kartı arayüzü

Video kartı ile işlemci arasında aktarılan tüm veriler video kartı arayüzünden geçer. Günümüzde video kartları için üç tip arayüz kullanılmaktadır: PCI, AGP ve PCI Express. Bant genişliği ve diğer özelliklerde farklılık gösterirler. Bant genişliği ne kadar yüksek olursa, döviz kurunun o kadar yüksek olduğu açıktır. Bununla birlikte, yalnızca en modern kartlar yüksek bant genişliğini ve hatta o zaman bile yalnızca kısmen kullanabilir. Bir noktada, arayüz hızı bir "darboğaz" olmaktan çıktı, bugün bu yeterli.

Video kartlarının üretildiği en yavaş veri yolu PCI'dir (Peripheral Components Interconnect). Tarihe geçmezseniz tabii. PCI, video kartlarının performansına gerçekten zarar verdi, bu yüzden AGP (Hızlandırılmış Grafik Bağlantı Noktası) arayüzüne geçtiler. Ancak AGP 1.0 ve 2x spesifikasyonları bile performansı sınırladı. Standart, hızı AGP 4x'e çıkardığında, video kartlarının kullanabileceği bant genişliğinin pratik sınırına yaklaşmaya başladık. AGP 8x özelliği, bant genişliğini AGP 4x'e (2.16 GB/sn) kıyasla bir kez daha ikiye katladı ancak grafik performansında gözle görülür bir artış elde edemedik.

En yeni ve en hızlı veri yolu PCI Express'tir. Daha yeni grafik kartları tipik olarak, toplam 4 GB/sn (tek yön) bant genişliği için 16 PCI Express hattını birleştiren PCI Express x16 kullanır. Bu, AGP 8x'in bant genişliğinin iki katıdır. PCI Express veri yolu, her iki yön için de belirtilen bant genişliğini sağlar (video kartına ve video kartından veri aktarımı). Ama AGP 8x standardının hızı zaten yeterliydi yani PCI Express'e geçişin AGP 8x'e göre performans artışı sağladığı bir durumla henüz karşılaşmadık (diğer donanım parametreleri aynı ise). Örneğin, GeForce 6800 Ultra'nın AGP versiyonu, PCI Express için 6800 Ultra ile aynı şekilde çalışacaktır.

Bugün PCI Express arayüzlü bir kart satın almak en iyisidir, piyasada birkaç yıl daha dayanacaktır. En üretken kartlar artık AGP 8x arayüzü ile mevcut değildir ve kural olarak PCI Express çözümlerini bulmak AGP analoglarından daha kolaydır ve daha az maliyetlidir.

Çoklu GPU çözümleri

Grafik performansını artırmak için birden fazla grafik kartı kullanmak yeni bir fikir değil. 3D grafiklerin ilk günlerinde 3dfx, paralel çalışan iki grafik kartıyla pazara girdi. Ancak 3dfx'in ortadan kalkmasıyla birlikte, ATi, Radeon 9700'ün piyasaya sürülmesinden bu yana profesyonel simülatörler için benzer sistemler üretmesine rağmen, birkaç tüketici video kartının işbirliği teknolojisi unutulmaya terk edildi. Birkaç yıl önce, teknoloji piyasaya geri döndü: nVidia SLI çözümlerinin gelişiyle ve biraz sonra ATi Crossfire.

Birden fazla grafik kartını paylaşmak, oyunu yüksek çözünürlükte yüksek kalite ayarlarında çalıştırmak için yeterli performansı sağlar. Ancak bir çözüm veya diğerini seçmek o kadar kolay değil.

Başlangıç ​​olarak, birden fazla video kartına dayalı çözümler çok fazla enerji gerektirir, bu nedenle güç kaynağı yeterince güçlü olmalıdır. Tüm bu ısının video kartından çıkarılması gerekecek, bu nedenle sistemin aşırı ısınmaması için PC kasasına ve soğutmaya dikkat etmeniz gerekiyor.

Ayrıca, SLI / CrossFire'ın genellikle standart modellerden daha pahalıya mal olan uygun bir anakart (bir teknoloji veya diğeri için) gerektirdiğini unutmayın. nVidia SLI yapılandırması yalnızca belirli nForce4 kartlarında çalışır ve ATi CrossFire kartları yalnızca CrossFire yonga setli anakartlarda veya belirli Intel modellerinde çalışır. Bazı CrossFire konfigürasyonları, işleri karmaşık hale getirmek için kartlardan birinin özel olmasını gerektirir: CrossFire Edition. Bazı video kartı modelleri için CrossFire'ın piyasaya sürülmesinden sonra, ATi, PCI Express veri yolu aracılığıyla işbirliği teknolojisinin dahil edilmesine izin verdi ve yeni sürücü sürümlerinin piyasaya sürülmesiyle olası kombinasyonların sayısı arttı. Bununla birlikte, ilgili bir CrossFire Edition kartına sahip donanım CrossFire, daha yüksek performans sağlar. Ancak CrossFire Edition kartları da normal modellerden daha pahalıdır. Şimdilik, Radeon X1300, X1600 ve X1800 GTO grafik kartlarında CrossFire yazılım modunu (CrossFire Edition kartı olmadan) etkinleştirebilirsiniz.

Dikkate alınması gereken başka faktörler de var. Birlikte çalışan iki grafik kartı bir performans artışı sağlarken, iki katına çıkmaktan çok uzak. Ama iki kat daha fazla para vereceksin. Çoğu zaman, verimlilik kazancı %20-60'tır. Ve bazı durumlarda, uzlaşma için ek hesaplama maliyetleri nedeniyle hiçbir kazanç yoktur. Bu nedenle, daha pahalı bir video kartı genellikle her zaman birkaç daha ucuz karttan daha iyi performans gösterdiğinden, çoklu kart yapılandırmalarının daha ucuz modellerle kendilerini haklı çıkarmaları pek olası değildir. Genel olarak, çoğu tüketici için bir SLI / CrossFire çözümü almanın bir anlamı yoktur. Ancak, tüm kalite geliştirme seçeneklerini etkinleştirmek veya kare başına 4 milyondan fazla piksel oluşturmanız gerektiğinde, örneğin 2560 × 1600 gibi aşırı çözünürlüklerde oynatmak istiyorsanız, iki veya dört eşleştirilmiş video kartı olmadan yapamazsınız.

Görsel fonksiyonlar

Tamamen donanım özelliklerine ek olarak, farklı GPU nesilleri ve modelleri özellik setinde farklılık gösterebilir. Örneğin, ATi Radeon X800 XT neslinin kartlarının Shader Model 2.0b (SM) ile uyumlu olduğu, nVidia GeForce 6800 Ultra'nın ise donanım özellikleri birbirine yakın olmasına rağmen SM 3.0 ile uyumlu olduğu sıklıkla söylenir (16). boru hatları). Bu nedenle, birçok tüketici, bu farkın ne anlama geldiğini bile bilmeden, şu veya bu çözüm lehinde bir seçim yapar.

Microsoft DirectX ve Shader Model sürümleri

Bu isimler genellikle anlaşmazlıklarda kullanılır, ancak çok az kişi gerçekten ne anlama geldiğini bilir. Anlamak için, grafik API'lerinin geçmişiyle başlayalım. DirectX ve OpenGL, herkesin kullanımına açık olan grafik API'ler veya Uygulama Programlama Arayüzleridir.

Grafik API'lerinin ortaya çıkmasından önce, her GPU üreticisi oyunlarla iletişim kurmak için kendi mekanizmasını kullandı. Geliştiricilerin desteklemek istedikleri her GPU için ayrı kod yazmaları gerekiyordu. Çok pahalı ve etkisiz bir yaklaşım. Bu sorunu çözmek için, geliştiricilerin belirli bir video kartı için değil, belirli bir API için kod yazabilmeleri için 3D grafikler için API'ler geliştirildi. Bundan sonra uyumluluk sorunları, sürücülerin API ile uyumlu olmasını sağlamak zorunda olan ekran kartı üreticilerinin omuzlarına düştü.

Tek komplikasyon, bugün iki farklı API'nin, yani Microsoft DirectX ve OpenGL'nin olmasıdır; burada GL, Grafik Kitaplığı anlamına gelir. DirectX API bugün oyunlarda daha popüler olduğu için ona odaklanacağız. Ve bu standart, oyunların gelişimini daha güçlü bir şekilde etkiledi.

DirectX, Microsoft'un eseridir. Aslında DirectX, yalnızca biri 3D grafikler için kullanılan birkaç API içerir. DirectX, ses, müzik, giriş aygıtları ve daha fazlası için API'ler içerir. Direct3D API, DirectX'teki 3D grafiklerden sorumludur. Video kartları hakkında konuştuklarında, bunu kastediyorlar, bu nedenle, bu açıdan DirectX ve Direct3D terimleri birbirinin yerine geçebilir.

DirectX, grafik teknolojisi geliştikçe ve oyun geliştiricileri oyunları programlamak için yeni yollar sundukça periyodik olarak güncellenir. DirectX'in popülaritesi arttıkça, GPU üreticileri DirectX'in yeteneklerine uyacak şekilde yeni ürün sürümlerini değiştirmeye başladı. Bu nedenle, video kartları genellikle bir veya başka nesil DirectX (DirectX 8, 9.0 veya 9.0c) için donanım desteğine bağlıdır.

Sorunları karmaşık hale getirmek için, Direct3D API'sinin parçaları DirectX nesillerini değiştirmeden zaman içinde değişebilir. Örneğin, DirectX 9.0 spesifikasyonu Pixel Shader 2.0 desteğini belirtir. Ancak DirectX 9.0c güncellemesi Pixel Shader 3.0'ı içeriyor. Böylece kartlar DirectX 9 olarak sınıflandırılsalar da farklı fonksiyon setlerini destekleyebilirler. Örneğin, Radeon 9700, Shader Model 2.0'ı ve Radeon X1800, Shader Model 3.0'ı destekler, ancak her iki kart da DirectX 9 nesline atfedilebilir.

Yeni oyunlar oluştururken geliştiricilerin eski makinelerin ve video kartlarının sahiplerini dikkate aldığını unutmayın, çünkü bu kullanıcı segmentini görmezden gelirseniz satış seviyesi daha düşük olacaktır. Bu nedenle, oyunlara birden çok kod yolu gömülüdür. DirectX 9 sınıfındaki bir oyun, uyumluluk için muhtemelen bir DirectX 8 yoluna ve hatta bir DirectX 7 yoluna sahiptir.Genellikle, eski yolu seçerseniz, yeni video kartlarındaki bazı sanal efektler oyunda kaybolur. Ama en azından eski donanımda bile oynayabilirsiniz.

Birçok yeni oyun, grafik kartı önceki nesilden olsa bile, DirectX'in en son sürümünün yüklenmesini gerektirir. Yani DirectX 8 yolunu kullanacak yeni bir oyun, bir DirectX 8 ekran kartının yüklenmesi için hala DirectX 9'un en son sürümünü gerektirir.

DirectX'te Direct3D API'sinin farklı sürümleri arasındaki farklar nelerdir? DirectX'in ilk sürümleri - 3, 5, 6 ve 7 - Direct3D API'leri açısından nispeten basitti. Geliştiriciler, bir listeden görsel efektler seçebilir ve ardından oyundaki performanslarını test edebilir. Grafik programlamadaki bir sonraki önemli adım DirectX 8'di. Bir video kartını gölgelendiriciler kullanarak programlama yeteneğini getirdi, böylece geliştiriciler ilk kez efektleri istedikleri şekilde programlama özgürlüğüne sahip oldular. DirectX 8, Pixel Shader 1.0 ila 1.3 ve Vertex Shader 1.0'ı destekler. DirectX 8'in güncellenmiş bir sürümü olan DirectX 8.1, Pixel Shader 1.4 ve Vertex Shader 1.1'i aldı.

DirectX 9'da daha da karmaşık gölgelendirici programları oluşturabilirsiniz. DirectX 9, Pixel Shader 2.0 ve Vertex Shader 2.0'ı destekler. DirectX 9'un güncellenmiş bir sürümü olan DirectX 9c, Pixel Shader 3.0 spesifikasyonunu içerir.

API'nin yeni sürümü olan DirectX 10, Windows Vista'nın yeni sürümüne eşlik edecek. DirectX 10'u Windows XP'ye yükleyemezsiniz.

HDR aydınlatma ve OpenEXR HDR

HDR, Yüksek Dinamik Aralık, yüksek dinamik aralık anlamına gelir. HDR aydınlatma ile oynamak, onsuz oynamaktan çok daha gerçekçi bir resim üretebilir ve tüm grafik kartları HDR aydınlatmayı desteklemez.

DirectX 9 grafik kartlarının ortaya çıkmasından önce, GPU'lar aydınlatma hesaplamalarının doğruluğu nedeniyle ciddi şekilde sınırlıydı. Şimdiye kadar aydınlatma sadece 256 (8 bit) dahili seviye ile hesaplanabiliyordu.

DirectX 9 grafik kartları piyasaya sürüldüğünde, tam 24 bit veya 16.7 milyon seviye olan yüksek kaliteli aydınlatma üretebildiler.

16.7 milyon seviye ile DirectX 9 / Shader Model 2.0 grafik performansında bir sonraki adımı atan HDR aydınlatma artık bilgisayarlarda mümkün. Bu oldukça karmaşık bir teknoloji ve dinamik olarak izlemeniz gerekiyor. Basit bir ifadeyle, HDR aydınlatma kontrastı artırır (koyu gölgeler daha koyu, açık gölgeler daha parlak görünür), aynı zamanda karanlık ve aydınlık alanlarda aydınlatma ayrıntısı miktarını artırır. HDR aydınlatma ile oynamak, onsuz olduğundan daha canlı ve gerçekçi hissettiriyor.

En yeni Pixel Shader 3.0 spesifikasyonunu karşılayan GPU'lar, daha yüksek 32-bit hassas aydınlatma ve kayan nokta karışımına izin verir. Böylece, SM 3.0 sınıfı video kartları, film endüstrisi için özel olarak tasarlanmış özel OpenEXR HDR aydınlatma yöntemini destekleyebilir.

Yalnızca OpenEXR kullanarak HDR aydınlatmayı destekleyen bazı oyunlar, Shader Model 2.0 grafik kartlarında HDR aydınlatma ile çalışmayacaktır. Ancak OpenEXR yöntemine dayanmayan oyunlar herhangi bir DirectX 9 grafik kartında çalışır.Örneğin, Oblivion OpenEXR HDR yöntemini kullanır ve yalnızca Shader Model 3.0 spesifikasyonunu destekleyen en son grafik kartlarında HDR aydınlatmaya izin verir. Örneğin, nVidia GeForce 6800 veya ATi Radeon X1800. Aynı Counter-Strike: Source ve yakında çıkacak Half-Life 2: Aftermath olan Half-Life 2 3D motorunu kullanan oyunlar, yalnızca Pixel Shader 2.0'ı destekleyen eski DirectX 9 video kartlarında HDR oluşturmayı etkinleştirmenize olanak tanır. Örnekler arasında GeForce 5 serisi veya ATi Radeon 9500 sayılabilir.

Son olarak, tüm HDR işleme biçimlerinin ciddi işlem gücü gerektirdiğini ve en güçlü GPU'ları bile dize getirebileceğini unutmayın. En yeni oyunları HDR aydınlatma ile oynamak istiyorsanız, yüksek performanslı grafikler çok önemlidir.

Tam ekran kenar yumuşatma

Tam ekran kenar yumuşatma (AA olarak kısaltılır), çokgenlerin sınırlarındaki karakteristik "merdivenleri" ortadan kaldırmanıza olanak tanır. Bununla birlikte, tam ekran kenar yumuşatma işleminin çok fazla bilgi işlem kaynağı tükettiği ve bunun da kare hızlarında düşüşe neden olduğu akılda tutulmalıdır.

Kenar yumuşatma, video belleğinin performansına çok bağlıdır, bu nedenle, hızlı belleğe sahip yüksek hızlı bir video kartı, tam ekran kenar yumuşatma işlemini, pahalı olmayan bir video kartına göre performansa daha az zarar vererek gerçekleştirebilir. Kenar yumuşatma çeşitli modlarda etkinleştirilebilir. Örneğin, 4x kenar yumuşatma, 2x kenar yumuşatmadan daha iyi bir resim kalitesi sağlar, ancak bu büyük bir performans artışı olacaktır. 2x kenar yumuşatma, yatay ve dikey çözünürlüğü ikiye katlarsa, 4x modu bunu dört katına çıkarır.

Doku filtreleme

Oyundaki tüm 3B nesnelere dokular uygulanır ve görüntülenen yüzeyin açısı ne kadar büyük olursa doku o kadar bozuk görünür. Bu etkiyi ortadan kaldırmak için GPU'lar doku filtrelemeyi kullanır.

İlk filtreleme yöntemi bilinear olarak adlandırıldı ve göze pek hoş gelmeyen karakteristik şeritler üretti. Durum, trilinear filtrelemenin tanıtılmasıyla düzeldi. Her iki seçenek de modern grafik kartlarında çok az veya hiç performans kaybı olmadan çalışır.

Anizotropik filtreleme (AF), günümüzde dokuları filtrelemenin en iyi yoludur. Tam ekran kenar yumuşatma gibi, anizotropik filtreleme de farklı düzeylerde etkinleştirilebilir. Örneğin, 8x AF, 4x AF'den daha kaliteli bir filtreleme sağlar. Tam ekran kenar yumuşatma gibi, anizotropik filtreleme de AF seviyesi yükseldikçe artan belirli bir miktarda işlem gücü gerektirir.

Yüksek çözünürlüklü dokular

Tüm 3D oyunlar belirli özellikler göz önünde bulundurularak oluşturulmuştur ve böyle bir gereksinim, bir oyunun ihtiyaç duyacağı doku belleğini belirler. Oyun sırasında gerekli tüm dokular video kartının belleğine sığmalıdır, aksi takdirde RAM'deki dokuya erişim, sabit diskteki disk belleği dosyasından bahsetmeden önemli bir gecikme sağladığından performans önemli ölçüde düşecektir. Bu nedenle, bir oyun geliştiricisi minimum gereksinim olarak 128 MB video belleğine güveniyorsa, etkin dokular kümesi hiçbir zaman 128 MB'ı geçmemelidir.

Modern oyunların birkaç doku seti vardır, bu nedenle oyun daha az video belleği olan eski video kartlarında ve daha fazla video belleği olan daha yeni kartlarda sorunsuz çalışır. Örneğin, bir oyun üç doku grubu içerebilir: 128 MB, 256 MB ve 512 MB. Bugün 512 MB video belleği destekleyen çok az oyun var, ancak yine de bu miktarda belleğe sahip bir ekran kartı satın almak için en objektif sebepler. Bellekteki artışın performans üzerinde çok az veya hiç etkisi olmasa da, oyun uygun doku setini destekliyorsa daha iyi görsel kalite elde edeceksiniz.

Grafik kartları hakkında bilmeniz gerekenler?

Temas halinde