DeepSeek’in Eğitim Maliyeti 400 Kat Fazla Çıktı

DeepSeek’in R1 büyük dil modelini eğitme maliyetleriyle ilgili tartışmalar, piyasaları sarsmıştı. Ancak gerçek rakamlar ortaya çıkınca durumun çok farklı olduğu anlaşıldı.

Eğitim Maliyetleri İlk Açıklananın Çok Üzerinde

Araştırma şirketi SemiAnalysis’in yaptığı detaylı incelemeye göre DeepSeek’in eğitim maliyetleri, gerçekte açıklanan rakamların çok ötesinde. Piyasalar, DeepSeek’in R1 modelini eğitmek için sadece 5 milyon dolar harcadığını ve bunun OpenAI’ın GPT o1 modeliyle benzer olduğunu düşünüyordu. Bu iddia, ABD borsalarında bir paniğe yol açmıştı. Fakat SemiAnalysis, sunduğu raporlarıyla bu iddiaları çürüttü.

DeepSeek’in Çin merkezli High-Flyer’ın bir yan projesi olduğu biliniyor. SemiAnalysis raporuna göre DeepSeek, 2021 yılında ABD ihracat kısıtlamalarının henüz bu kadar sert olmadığı bir dönemde 10 bin adet NVIDIA A100 GPU satın aldı. Daha sonra High-Flyer, bu projeyi kendi bünyesinden ayırarak bağımsız bir şirket haline getirdi. İşte tam da bu noktada DeepSeek’in donanım altyapısı da hızla büyümeye başladı.

Rapor, DeepSeek’in şu anda Çin’e özel üretilen 10 bin adet NVIDIA H800 AI GPU ve 10 bin adet üst seviye H100 AI çipe sahip olduğunu belirtiyor. Ayrıca şirket, NVIDIA’nın H20 AI hızlandırıcılarına da yatırım gerçekleştirdi. DeepSeek ve High-Flyer, bu devasa donanım kaynaklarını eğitim, çıkarım, ticaret ve araştırma gibi farklı alanlarda ortaklaşa kullanıyor. Tüm bu yatırımlar, DeepSeek’in yaklaşık 1.6 milyar dolarlık bir sermaye harcaması (CapEx) yaptığını gösteriyor. İşletme maliyetlerinin ise 944 milyon dolar civarında olduğu tahmin ediliyor. Bu rakamlar, piyasaların ilk başta düşündüğünden yaklaşık 400 kat daha yüksek.

İlk açıklanan 5 milyon dolarlık maliyetin, modelin son halini çalıştırma aşamasıyla sınırlı olduğu düşünülüyor. DeepSeek’in başarısının ardındaki en önemli faktörlerden biri, yerel yetenekleri etkili bir şekilde kullanması oldu. Şirket, Çin’in önde gelen üniversitelerinde düzenlediği işe alım etkinlikleriyle bazı çalışanlarına 1.3 milyon doların üzerinde maaşlar ödeyerek yetenekli beyinleri kendine çekti. DeepSeek’in R1 modeli, OpenAI gibi rakiplerle yarışacak kadar verimli bir çözüm sunmayı başardı. Ancak finansal verilerin yanlış yansıtılması, piyasalarda geçen hafta yaşanan büyük çalkantının ana sebeplerinden biri oldu.

SemiAnalysis, DeepSeek’in R1 modeli üzerinde kapsamlı testler ile kamuoyunun ilgisini çekmeyi başardı. Raporda modelin performansı ve donanım kullanımıyla ilgili ilginç detaylar yer alıyor. Eğer yapay zeka teknolojileri ve DeepSeek’in geleceği hakkında daha fazla bilgi edinmek istiyorsanız bu raporu inceleyebilirsiniz.

Kaynak: wccftech.com