GeForce RTX 4000 serisi ekran kartlarının en üst modeli olan RTX 4090 ofisimizde. Kartı kapsamlıca inceliyoruz.
İlk bilgisayar programcısı olarak kabul edilen Ada Lovelace’ın adını taşıyan GeForce “Ada” grafik mimarisi, CUDA çekirdeklerinden RT çekirdeklerine, yapay zeka konusunda önemli bir faktör olan Tensor çekirdeklerinden gölgelendirici performansını artıran Shader Execution Reordering SIMD optimizasyonlarına kadar her alanda yenilikler getiriyor.
NVIDIA GeForce RTX 4090 Özellikleri
“Ada” CUDA çekirdekleri, Ampere mimarisi üzerinde çok büyük frekans ve IPC artışları sağlıyor. Yeni nesil GPU’ların NVIDIA’ya özel olarak optimize edilen TSMC 4nm üretim teknolojisinden faydalandığını biliyoruz. GeForce RTX 4090 ise bu nesil için geliştirilen en büyük GPU olan “AD102” silikonundan gücünü alıyor. AD102 silikonu aslında 18.432 CUDA çekirdeğinin kullanılmasına imkan tanıyor, ancak mevcut amiral gemisi 16.384 CUDA çekirdeğiyle çalışacak şekilde ayarlanmış.
CUDA çekirdeklerinin yanı sıra, 568 Tensor çekirdeğinden 512’si, 142 RT çekirdeğinden 128’i kullanılıyor. Kart ayrıca 512 TMU ve 192 ROP ile donatılmış. Tam yapılandırma ise muhtemelen GeForce RTX 4090 Ti için saklanıyor. Mevcuttaki en güçlü kart olan 4090, RTX 3090 Ti ile aynı şekilde 21 Gbps hızda çalışan, teorik olarak 1008 GB/sn bant genişliği sunan 24 GB GDDR6X belleklerden yararlanıyor.
NVIDIA, donanımsal ve rasterizasyon açısından nesiller arasında büyük performans artışları sağlamış. Tüm bunlara bir de devrimsel DLSS 3 teknolojisi dahil olduğunda işler apayrı bir noktaya geliyor. Yalnızca RTX 4000 serisine özel olan DLSS 3 teknolojisi, GPU’nun ana grafik işleme mekanizmasından hariç olarak yalnızca yapay zeka kullanarak yeni kareler üretebiliyor. Şirket bundan “sinirsel işleme (neural rendering)” olarak bahsediyor ve grafik dünyasına yeni tabir daha getiriyor. Bu gerçekten çok önemli bir atılım. NVIDIA, yeni teknolojisini rasterizasyon ve ışın izleme tekniklerinin yanında ayrı bir şekilde konumlandırıyor.
İncelememize konuk NVIDIA GeForce RTX 4090 Founders Edition, yeşil ekil ekibin referans tasarımını temsil ediyor. Yeni nesil kartların genel görünümü RTX 3000 serisiyle aynı kalmış, ancak RTX 4090 gerçekten heybetli ve çok büyük. RTX 4000 serisi PCI-Express Gen 4 bağlantı arabirimini kullanmaya devam ederken, güç mimarisi için PCIe Gen 5 standardına geçiş yapılmış. 12VHPWR adı verilen yeni 12+4 pin tasarımı, referans tasarım da dahil olmak üzere üretim ortakları tarafından geliştirilen RTX 4090 modellerinde standart haline geliyor.
RTX 4090 Çıkış Fiyatı Ne Kadar?
Türkiye’de satışa sunulmayan RTX 4090 Founders Edition 1.599 dolarlık fiyatla satışa çıktı. GeForce RTX 3090 ise iki yıl öncesinde 100 dolarlık farkla, 1.499 dolar fiyatla çıkış yapmıştı. Bu arada, özel soğutmalı RTX 4090 modellerinin 1.999 dolara kadar uzandığını ve hatta bazı modellerin 2.000 dolar üzerine çıktığını belirtelim. Ülkemizde ise özel tasarımlar 40.000-50.000 lira civarında fiyatlarla satılıyor.
Ekran Kartı | RTX 4090 | RTX 3090 Ti | RTX 3090 | RTX 3080 Ti | RX 6950 XT | Arc A770 16GB |
---|---|---|---|---|---|---|
Mimari | AD102 | GA102 | GA102 | GA102 | Navi 21 | ACM-G10 |
Üretim Teknolojisi | TSMC 4N | Samsung 8N | Samsung 8N | Samsung 8N | TSMC N7 | TSMC N6 |
Transistör Sayısı | 76.3 milyar | 28.3 milyar | 28.3 milyar | 28.3 milyar | 26.8 milyar | 21.7 milyar |
Kalıp Boyutu | 608.4 mm^2 | 628.4 mm^2 | 628.4 mm^2 | 628.4 mm^2 | 519 mm^2 | 406 mm^2 |
SM / CU / Xe-Core | 128 | 84 | 82 | 80 | 80 | 32 |
GPU Çekirdeği | 16384 | 10752 | 10496 | 10240 | 5120 | 4096 |
Tensor Çekirdeği/ XMX Motoru | 512 | 336 | 328 | 320 | – | 512 |
Işın İzleme Çekirdeği | 128 | 84 | 82 | 80 | 80 | 32 |
Boost Frekansı | 2520 MHz | 1860 MHz | 1695 MHz | 1665 MHz | 2310 MHz | 2100 MHz |
Bellek Hızı | 21 Gbps | 21 Gbps | 19.5 Gbps | 19 Gbps | 18 Gbps | 17.5 Gbps |
Bellek Kapasitesi | 24 GB | 24 GB | 24 GB | 12 GB | 16 GB | 16 GB |
Bellek Bant Genişliği | 384-bit | 384-bit | 384-bit | 384-bit | 256-bit | 256-bit |
L2 / Infinity Önbellek | 72 | 6 | 6 | 6 | 128 | 16 |
ROP | 176 | 112 | 112 | 112 | 128 | 128 |
TMU | 512 | 336 | 328 | 320 | 320 | 256 |
TFLOPS FP32 | 82.6 | 40 | 35.6 | 34.1 | 23.7 | 17.2 |
TFLOPS FP16 (FP8/INT8) | 661 (1321) | 160 (320) | 142 (285) | 136 (273) | 47.4 | 138 (275) |
Bant Genişliği | 1008 GBps | 1008 GBps | 936 GBps | 912 GBps | 576 GBps | 560 GBps |
TDP | 450W | 450W | 350W | 350W | 335W | 225W |
Liste Fiyatı | 1,599$ | 1,999$ | 1,499$ | 1,199$ | 1,099$ | 349$ |
NVIDIA Ada Lovelace Mimarisi
Yukarıdaki teknik özellikler tablosu aslında birçok şeyin göstergesi; transistör sayıları Ampere mimarisine kıyasla neredeyse üç katına çıktı, RTX 4090’daki çekirdek sayıları RTX 3090 Ti’den %52 daha yüksek, GPU saat hızları %35 daha fazla ve 12 kat daha fazla L2 önbellek mevcut. RTX 4090’ın potansiyelini teorik olarak rahatlıkla görebiliyoruz ve RTX 3090/3090 Ti’ye kıyasla önemli farklar var. Ancak GPU’nun içinde fark yaratan başka değişiklikler de var.
Eğer ekran kartlarını profesyonel amaçla kullanacaksanız, özellikle de derin öğrenme ve yapay zeka alanında iş yapıyorsanız, GeForce RTX 4000 serisi gerçekten parasının hakkını verecek bir ürün serisi. Ayrıca içerik üreten kişiler için de Ada mimarili kartlar ideal bir seçenek olabilir. Bu işten para kazananlar için zaman=para demek. RTX 4000 serisi kartlar da gerçekten önemli gelişmeler sunuyor.
Peki ya oyuncular? RTX 3090 ve 3090 Ti’nin aksine NVIDIA, RTX 4090’ın yalnızca profesyoneller için tasarlandığını söylemiyor. Evet, RTX 4090 profesyoneller için harika işler çıkaracak. Ancak bu kart aynı zamanda GeForce ailesinin bir parçası ve şirket oyun performansı konusunda sürekli grafik kıyaslamaları yapıyor. RTX 4090 ile yaptığımız testlerde gördüğünüz üzere, yeni amiral gemisi DLSS 3 devre dışı olsa bile gerçekten çok güçlü. DLSS 3 devreye girdiğinde ise işler zaten bambaşka bir hal alıyor.
3. Nesil Ray Tracing Çekirdekleri
Işın izleme bir kez daha büyük önem kazanıyor ve üç yeni teknoloji hayatımıza giriyor: Shader Execution Reordering (SER), Opacity Micro-Maps (OMM) ve Displaced Micro-Meshes (DMM). Bu yeniliklerin tümüyle birlikte çeşitli iyileştirmeler sunuluyor, ancak geliştiricilerin yeni teknolojileri oyunlarına uygulaması gerekecek.
OMM Motoru, yapraklar, parçacıklar ve çitler için sıklıkla kullanılan dokuların çok daha iyi işlenmesini sağlıyor. DMM Motoru ise 20 kata kadar daha az BVH depolama alanı ile 10 kata kadar daha hızlı Bounding Volume Hierarchy (BVH) oluşturma süresi sunarak geometrik olarak karmaşık sahnelerin gerçek zamanlı ışın takibini mümkün hale getiriyor.
Ada GPU içinde yer alan ışın izleme birimleri, Faster Ray-Triangle Intersection Throughput (Işın-Üçgen Kesişme Verimi) açısından iki kat daha gelişmiş ve bu da geliştiricilerin sanal dünyalarına daha fazla ayrıntı eklemelerini sağlıyor.
Shader Execution Reordering
Gelişmiş ışın izleme, bir sahne boyunca çok sayıda farklı nesneye çarpan, çok sayıda ışının hesaplamasını gerektiriyor. Böylelikle çekirdekler için farklı iş yükleri doğmuş oluyor. Shader Execution Reordering (SER) teknolojisi, önceden verimsiz olan bu iş yüklerini dinamik olarak yeniden düzenleyerek çok daha verimli hale getiriyor. SER, ışın izleme işlemleri için gölgelendirici performansını 3 kata kadar ve oyun içi kare hızlarını %25’e kadar artırabiliyor.
4. Nesil Tensor Çekirdekleri
Derin öğrenme ve yapay zeka iş yüklerine gelince, yine bu alanda büyük gelişmeler kaydedildiğini görüyoruz. Ada’nın dördüncü nesil Tensor çekirdekleri, ilk olarak Hopper H100 veri merkezi GPU’su ile tanıtılan FP8 Transformer Engine’i kullanarak verimi 5 kata kadar artırıyor ve 1.4 Tensor-petaFLOPS’luk güç ortaya çıkıyor.
Transformer Engine sayesinde FP16 yerine FP8 kullanabilen algoritmalar için Tensor çekirdeği başına hesaplama becerisi iki katına çıkıyor.
AV1 Kodek Desteği
Önceki nesil Ampere ekran kartlarında AV1 kod çözme desteği sunulsa da AV1 kodlama desteği sunulmuyordu. Ada mimarisi üzerine inşa edilen ekran kartları, AV1 kodlama desteği sunan sekizinci nesil NVIDIA Encoder’a (NVENC) sahip olacak. Böylelikle yayıncılar ve video işiyle uğraşanlar için yeni olanaklar sağlanacak. AV1 kodek, H.264’ten %40 daha verimli. Ayrıca 1080p’de yayın yapan kullanıcıların aynı bit hızı ve kalitede çalışırken yayın çözünürlüklerini 1440p’ye yükseltmelerine imkan verecek.
Ada GPU’lar ayrıca çift NVENC kodlayıcı ile destekleniyor. Bu gelişim ise profesyonel video düzenleme için 8K/60 veya dört adet 4K/60 video kodlamasına olanak sağlıyor. DaVinci Resolve, Adobe Premiere Pro için popüler Voukoder eklentisi ve Çin’in en iyi video düzenleme uygulaması olan Jianying, AV1 desteğinin yanı sıra çift kodlama desteğiyle kullanıma sunulacak. NVIDIA ayrıca popüler efekt uygulaması Notch’a AV1 desteği getirmek ve Topaz yazılımına çift kodlama desteği sunmak için çalışıyor.
DLSS 3, Gerçek Zamanlı 3D Uygulamalarına da Katkı Sağlıyor
Grafik dünyasında 3D düzenleme yapmak zorlu bir deneyimdir. 3D içerik üreticileri, çalışma yaptığı sıralarda sürekli önizleme yapmak zorunda kalırlar. Ancak DLSS 3’ün performans kazanımları sayesinde sanatçılar, gerçek zamanlı render uygulamalarında akıcı ve sorunsuz şekilde içerik üretebilecekler.
DLSS 3 teknolojisi ilk etapta Unreal Engine, Unity ve Omniverse’e geliyor. 3D sanatçıları, daha önce hiç görülmemiş gerçekçilik seviyeleriyle gerçek zamanlı etkileşime olanak tanıyan materyaller, aydınlatma, nesneler, karakterler ve sahneler oluşturabilecekler. Sanatçılar sahnelerinde değişiklikler yaparken görüntü anında işlenecek ve hızlı geri bildirim alabilecekler.
24 GB GDDR6X Bellek
Bildiğiniz gibi, birçok iş yükü için GPU bellek boyutu ve hızları çok önemli. GeForce RTX 4090, diğer iyileştirmelerin yanı sıra 21 Gbps hızında çalışan 24 GB GDDR6X belleğiyle içerik üreticilerin işlerini kolaylaştıracak. Çok sayıda malzeme ve doku kullanan, büyük veri kümeleriyle çalışan kişiler, yoğun GPU kullanımına ihtiyaç duyan iş akışlarını rahat yürütebilecek.
DLSS 3 Ne Yenilik Sunuyuor?
DLSS 3, kaliteyi bozmadan FPS oranlarında iki kat ve bazı durumlarda daha yüksek performans artışları getiriyor. Bu gerçekten oyun ve grafik dünyasında devrim yaratan bir teknoloji.
DLSS 2’nin tüm özelliklerine ek olarak, bu teknoloji grafik oluşturma işlem hattını dahil etmeden yalnızca yapay zeka kullanarak kareleri oluşturma yeteneğine sahip. DLSS 3 ile değişen her kare, önceki işlenmiş karenin bir kopyası olmaksızın yapay zeka ile üretilmekte.
DLSS 3, görüntü kalitesi ve yanıt verme özelliğini korurken performansı büyük ölçüde artıran yapay zeka destekli grafiklerde devrim niteliğinde bir atılım olarak tanımlanıyor. DLSS Frame Generation otomatik kodlayıcısı 4 temel veriyi ele alıyor: mevcut ve önceki oyun kareleri, Ada mimarisinin Optical Flow Accelerator’ı tarafından oluşturulan bir optik akış alanı, hareket vektörleri ve derinlik gibi oyun motoru verileri.
Optical Flow Accelerator, iki ardışık oyun içi kareyi analiz ediyor ve bir optik akış alanı hesaplaması yapıyor. Optik akış alanı, piksellerin kare 1’den kare 2’ye hareket ettiği yönü ve hızı yakalamakta. Optik Akış Hızlandırıcı, oyun motoru hareket vektörü hesaplamalarına dahil edilmeyen parçacıklar, yansımalar, gölgeler ve aydınlatma gibi piksel düzeyinde bilgileri yakalama yeteneğine sahip. Aşağıdaki motosiklet örneğinde, motosikletlinin hareket akışı gölgenin motosiklete göre ekranda kabaca aynı yerde kaldığını doğru bir şekilde temsil etmekte.
Optik Akış Hızlandırıcı, yansıma gibi piksel düzeyindeki efektleri doğru bir şekilde takip ederken, DLSS 3 ayrıca sahnedeki geometrinin hareketini tam olarak izlemek için oyun motoru hareket vektörlerini kullanıyor. Aşağıdaki örnekte oyun hareket vektörleri motosikletçinin yanından geçen yolun hareketini doğru bir şekilde izlediği (ancak gölgeleri değil) gösterilmiş. Yalnızca motor hareket vektörlerini kullanarak çerçeveler oluşturmak, gölgede pürüz gibi görsel anormalliklere neden olmakta.
DLSS Frame Generation yapay zeka ağı, her piksel için ara kareler oluşturmak üzere oyun hareket vektörlerinden, optik akış alanından ve sıralı oyun karelerinden gelen bilgilerin nasıl kullanılacağına karar veriyor. Bu ağ, hareketi izlemek için hem motor hareket vektörlerini hem de optik akışı kullanarak (aşağıdaki resimde görüldüğü gibi) hem geometriyi hem de efektleri doğru bir şekilde yeniden oluşturabiliyor.
Yapay zeka, DLSS 3 etkinleştirildiğinde ilk karenin dörtte üçünü ve DLSS Frame Generation kullanarak ikinci karenin tamamını yeniden yapılandırıyor. Biraz önce belirttiğimiz gibi, görüntülenen toplam piksellerin sekizde yedisi yeniden yapılandırılıyor ve performansa büyük katkı sağlanıyor.
DLSS 3’ün Performans Katkısı
NVIDIA’nın iddialarına bakılırsa belirli oyun ve motorlarda geleneksel işlemeye kıyasla dört kata kadar performans artışı sağlanabiliyor. Erken yaptığımız DLSS 3 testlerine aşağıdaki videomuzdan ulaşabilirsiniz. Yeni sürücüler, oyun güncellemeleri ve gelişmiş DLSS 3 desteği ile çok daha iyisini görebiliriz.
İçerik Üretimi ve Yayıncılık için RTX 4090
Eskiden içerik üretimi büyük stüdyolar tarafından yapılırken, artık bireysel geliştiriciler güçlü sistemleriyle birlikte üstün görseller sunan içerikler üretebiliyor. NVIDIA, bildiğiniz gibi Game Ready sürücüsünün yanı sıra Studio sürücüsüyle profesyonel kullanıcılar için yenilikler ve optimizasyonlar sağlıyor. İşte yeşil takımın sunduğu bazı ayrıcalıklar:
- 3D, video ve yapay zeka destekli işleri hızlandırmak için özel donanım optimizasyonları.
- Güvenilirliği en üst düzeye çıkarmak için uygulamalar üzerinde kapsamlı bir şekilde test edilmiş Studio sürücüleri.
- 110’dan fazla popüler uygulamada RTX donanımı için uygulama optimizasyonları.
- Ayrıca bu uygulamaların daha hızlı çalışmasını sağlayan, Optix, DLSS ve Maxine gibi özel özellikler sunan yazılım geliştirme kitleri.
- NVIDIA Omniverse, Broadcast, Canvas ve RTX Remix dahil olmak üzere Studio Suite uygulamaları.
RTX 4000 serisiyle birlikte sunulan yenilikler:
- Canlı yayınlar yapıyorsanız, daha iyi canlı akış kalitesi için AV1 destekli yeni sekizinci nesil kodlayıcıdan yararlanabilir, ayrıca NVIDIA Broadcast yapay zeka efektleriyle mikrofon ses kalitenizi ve web kamera görüntülerinizi iyileştirebilirsiniz.
- Video düzenleme işleriyle ilgileniyorsanız, RTX 4000 serisiyle sunulan çift kodlayıcı sayesinde 2 kata kadar daha yüksek yapay zeka performansı ve 2 kata kadar daha yüksek çıktı performansı elde edebilirsiniz.
- 3D sanatçılar, 3. nesil RT çekirdekleri, gölgelendirici yürütme yeniden düzenlemesi, DLSS 3 ve NVIDIA Omniverse sayesinde 4K60’ta içerik oluşturabilir.
- Mod yapımcısıysanız klasik oyunları yeniden düzenleyebilir, RTX Remix ile RTX’i aktif edebilirsiniz.
AV1 ve Yapay Zeka Destekli Yayıncılık
Canlı yayıncılar genellikle bant genişliğiyle ilgili sorunlar (örneğin Twitch veya Discord’un maksimum 8 Mbps bit hızı gibi) yaşar. Bu da yayıncıların sunduğu kaliteyi ve çözünürlüğü olumsuz etkilemekte. AV1 ile canlı yayınlar daha detaylı ve daha hatasız görünecek, artık daha yüksek çözünürlükte yayın yapabilecek. AV1 ayrıca HDR ve düşük gecikme yetenekleriyle gelişmiş kodlama özelliklerini de destekliyor.
NVIDIA, AV1 için sektördeki önde gelen şirketlerle birlikte çalıştığını söylüyor. Popüler uygulamalardan olan OBS Studio, 2022 Ekim ayında yayınlanan Beta sürümü ile NVENC ile AV1 desteği sunmaya başladı. Bunun yanında, oyuncuların her gün kullandığı Discord, 2022 sonlarında AV1 ile uçtan uca canlı yayın özelliği alıyor.
Video Düzenleme
Adobe Premiere Pro ve Blackmagic Design DaVinci Resolve gibi video düzenleme uygulamaları, CUDA çekirdeklerinin yanı sıra yapay zeka destekli Tensor çekirdekleriyle birlikte GPU gücünden yararlanıyor. Renk düzeltme, video kare boyutu dönüştürme, bulanıklaştırma, keskinleştirme, görüntü işleme efektleri ve RAW dosya dönüştürme gibi temel işlevlerin tümü, gelişmiş GPU teknolojileri sayesinde her zamankinden daha kısa sürede tamamlanıyor.
RTX 4090 Video Düzenleme Performansı
RTX 4090, AI Magic Mask kullanımında RTX 3090 Ti’ye kıyasla 1.7 kat daha hızlı:
RTX 4000 serisinde bulunan çift kodlayıcı, yeni algoritma ve mimari performans iyileştirmeleri ile birlikte HEVC/AV1 kodlamasında RTX 3000 serisine göre 2 kata kadar daha iyi performans sağlıyor:
ON1 Resize AI 2022, daha yüksek çözünürlüklü çıktılar oluşturmak için GPU hızlandırmalı AI işlevselliğini kullanıyor. Böylelikle görüntü ayrıntılarından ödün vermeden düşük çözünürlüklü görüntülerden yüksek çözünürlüklü görüntü çıktıları almamıza imkan veriyor. RTX 4090, ON1 Resize AI 2022’d yapay zeka hızlandırmalı görüntü boyutlandırma senaryosunda RTX 3090 Ti’ye kıyasla 1.6 kata kadar daha hızlı.
Işın izleme destekli işleme, animatörlerin filmlerdeki görsel efektler ve oyunlardaki animasyonlu karakterler gibi fotogerçekçi dijital varlıklar tasarlamasına olanak tanıyor. Bu teknoloji yıllardır Hollywood’da standart olarak kullanılıyor ancak yüksek güçlü sunucular ve iş istasyonları gerektiriyor. RTX 4000 serisi ise bu işi son tüketici bazında başka bir noktaya taşıyor.
Yeni amiral gemisi, ışın izlemeli işleme konusunda en güçlü GPU oldu. Bu kart Blender Cycles, Chaos VRay ve Luxion Keyshot gibi video işleme uygulamalarında önceki nesil RTX 3090 Ti’ye kıyasla 1.9 kata kadar daha hızlı kare işleme performansı sunuyor. DLSS 3 ve gölgelendirici yürütme yeniden sıralama özelliğiyle birleştirildiğinde ise gerçek zamanlı render uygulamalarında 4 kata kadar daha hızlı render performansı elde etmek mümkün.
8K Oyunculuğa Doğru Adım Adım
AD102 GPU, DLSS 3 Frame Generation ile desteklendiğinde ve Ultra Performans moduna oyunlarda 8K HDR oyun deneyimine hazır. Ayrıca RTX 4090’da bulunan çift kodlayıcılar sayesinde GeForce Experience üzerinden 8K video oyun çekimi yapabiliyoruz.
NVIDIA, 8K çözünürlüğe giden yolda DLSS 3 faktörünün çok önemli olduğunu vurguluyor. İşte şirket tarafından paylaşılan bir test çizelgesi:
Kaynak: https://www.technopat.net/2022/10/17/nvidia-geforce-rtx-4090-incelemesi
Yorumlar
Ad: Umut Yanbakan
Başlık: Fiyatıda çok iyi
Gerçekten fiyatı da Türkiye için çok iyi :D
24.02.2023
Bir Yorum Bırak