Yapay zeka savaşı kızışıyor. Gemini, ChatGPT kullanıcılarını "çalarken" DeepSeek’ten de yeni atılım geldi

Dec 3, 2025 - 16:20
 0
Yapay zeka savaşı kızışıyor. Gemini, ChatGPT kullanıcılarını "çalarken" DeepSeek’ten de yeni atılım geldi
Yapay zeka savaşı kızışıyor. Gemini, ChatGPT kullanıcılarını

DeepSeek bu hafta, akıl yürütme ve planlama kapasitesine odaklanan iki yeni modeli V3.2 ve V3.2-Speciale’yi piyasaya sürdü.

Google’ın yapay zeka modeli Gemini 3’ün yakın zamanda piyasaya sürülmesiyle birlikte teknoloji sektörü kıran kırana bir rekabete sahne oluyor.

 

Kullanıcıların öve öve bitiremediği Gemini 3, rakip firma OpenAI’ın, müşterilerinin yüzde 6’sını kaybetmesine neden oldu. ChatGPT’nin geliştiricisi OpenAI kırmızı alarma geçerken, Çin’in bu yılın başında büyük ses getiren az maliyetli güçlü modeli DeepSeek de yeni bir sürüm yayınladı.

DeepSeek bu hafta, akıl yürütme ve planlama kapasitesine odaklanan iki yeni modeli V3.2 ve V3.2 Speciale’yi piyasaya sürdü.

 

Bu adım, şirketin daha çok “ajan tarzı” çalışan, yani yalnızca metin üretmeyip arama motorları, yazılım araçları ve diğer uygulamaları kullanarak “iş çözebilen” sistemlere yöneldiğinin işareti olarak görülüyor.

 

Her iki model de firmanın önceki deneysel çalışmalarının geliştirilmiş sürümleri niteliğinde.

 

YOĞUN AKIL YÜRÜTME

 

DeepSeek’e göre V3.2 modeli, araç kullanımına “yapılandırılmış düşünme” yeteneği katıyor. Model hem hızlı hem de daha iyi düşünerek çalışan iki modda görev yapabiliyor ve büyük ölçekli eğitim veri setleri üretebiliyor. Bu yaklaşımın, binlerce göreve yayılan testlerde çok daha kapsamlı doğrulama yapılmasını sağladığı belirtiliyor.

 

V3.2-Speciale ise daha ağır mantık yürütme ve yarışma tarzı zorlu görevler için tasarlandı. DeepSeek, bu özel sürümün performansının bazı üst seviye tescilli (kapalı) modellerle yarıştığını söylüyor. 

 

Modelin “Sparse Attention” yöntemi, uzun ve karmaşık girdilerde maliyeti belirgin şekilde düşürüyor.

Bu iki modelin çıkışı, sektörde özellikle OpenAI, Anthropic, Alibaba, Tencent ve Moonshot gibi rakiplerin hızlı atılımları nedeniyle DeepSeek üzerindeki baskının arttığı bir döneme denk geldi. Şirket ise yeni serinin, daha düşük bütçelere rağmen rakiplerle arasındaki yetenek farkını kapattığını savunuyor.

 

YENİ MİMARİ

 

Sparse Attention, büyük dil modellerinin özellikle uzun girdileri işlerken yaşadığı hesaplama maliyetini azaltmak için kullanılan bir dikkat tekniği.

 

Klasik “full attention” (tam dikkat) mekanizmasında model, bir metindeki her kelimeyi tüm diğer kelimelerle karşılaştırarak bağlam hesaplıyor; bu da giriş uzunluğu arttıkça işlem maliyetinin üstel büyümesine yol açıyor ve donanım gereksinimlerini hızla artırıyor.

 

Sparse Attention (aralıklı dikkat) ise bu yoğun bağlantı yapısını seyrelterek yalnızca en gerekli kelimeler, bölgeler veya belirli örüntüler arasında dikkat ilişkisi kuruyor. Böylece model, tüm bağlantıları hesaplamak yerine önceden belirlenmiş veya öğrenilmiş sınırlı sayıdaki bağlantıya odaklanıyor. Sonuçta hem hesaplama yükü hem bellek kullanımı düşüyor ve model uzun metinlerle çalışırken hızdan veya doğruluktan çok az ödün veriyor.

 

Sparse Attention bu nedenle uzun belge işleme, kod çözümleme, araştırma görevleri ve “ajan tarzı planlama” gibi uzun bağlam gerektiren uygulamalarda kritik bir rol oynuyor.

 

Öte yandan Sparse Attention yalnızca DeepSeek’e özgü bir mimari değil. DeepSeek bunu öne çıkarıyor çünkü modellerinin uzun bağlam kapasitesini ucuzlatan temel tekniklerden biri.

 

DeepSeek bu yıl başında piyasaya çıktığından beri az kaynak (az sayıda GPU) ve az maliyetle büyük hesaplama gücü sağlamasıyla tanınan bir yapay zeka ailesi oldu.

 

YETENEKLERİ NELER?

 

DeepSeek, V3.2 modelleriyle şu iddiaları öne sürüyor:

 

- V3.2 ile GPT-5 seviyesinde genel performans

 

- V3.2-Speciale ile Gemini 3 Pro seviyesinde mantık ve problem çözme becerisi

 

- Uluslararası matematik ve yazılım yarışmaları gibi zorlu testlerde yüksek başarı

 

- Uzun girdilerde maliyeti düşüren Sparse Attention mimarisi

 

- Metin üretmenin ötesinde dış araçları kullanabilen ajan-tarzı planlama yeteneği

 

R2 MODELİ HALEN GELMEDİ

 

DeepSeek, 20 Ocak 2025’teki çıkışıyla yapay zeka ekosisteminde bir kırılma noktası yaratmıştı. Açık kaynak ve açık ağırlık (OS/OW) modellerindeki başarısı, Çin’deki neredeyse tüm büyük laboratuvarları benzer modeller geliştirmeye yöneltti. Bu kırılmanın arkasında az kaynakla çok ileri seviyeye ulaşabilen R1 modeli vardı.

 

Sektörde asıl merak konusu ise DeepSeek’in üzerinde çalıştığı yeni R2 akıl yürütme modeli. Modelin henüz resmi olarak çıkmamasının nedenleri arasında hesaplama kaynağının yetersizliği gösteriliyor. 

 

Ancak DeepSeek’in çok yakında duyuru yapması bekleniyor. R2’nin gelmesiyle performans rekabetinin yeni bir tura girmesi öngörülüyor.

 

DeepSeek, Alibaba, Tencent, Moonshot AI ve Zhipu AI gibi oyuncuların OS/OW tabanlı modelleri Çin’de kamu kurumlarından özel sektöre kadar yaygın biçimde kullanılmaya başladı. Bu eğilimin, Çin’in yapay zeka stratejisi kapsamında 2026’da daha da güçleneceği belirtiliyor.

 

ABD ALARMDA

 

ABD hükümetinin Çin yapay zeka modellerine yönelik endişeleri ise artıyor.

 

Sızdırılan Beyaz Saray belgeleri, Washington’un yalnızca DeepSeek değil, artık diğer Çinli OS/OW modelleri konusunda da daha agresif inceleme yapacağını gösteriyor. Exiger ve CrowdStrike gibi güvenlik kuruluşlarından Çinli şirketler hakkında askeri bağlantı iddiaları içeren raporların gelmeye devam edeceği öngörülüyor.

 

GPU SAVAŞI

 

2025 boyunca ABD’nin Çin’e grafik işlemci birimi (GPU) çiplerinin satışını hangi koşullarda sınırlayacağı tartışma konusuydu. 2026’da da benzer tartışmaların devam etmesi bekleniyor.

 

ABD Başkanı Donald Trump, Nvidia’nın H200 Hopper-era GPU’sunun Çin’e ihracatına onay vermeyi değerlendiriyor. Beyaz Saray’ın yapay zeka yetkilisi David Sacks ve Nvidia CEO’su Jensen Huang, GPU ihracatında kuşak bazlı esnek bir model öneriyor: Hopper GPU’lara şimdilik izin verilmesi, Blackwell, Rubin ve Feynman GPU’larına henüz verilmemesi öngörülüyor.

 

Öte yandan, Çinli şirketlerin hâlâ yurtdışı veri merkezlerinde yer alan gelişmiş GPU’lara erişebildiği, bunun 2026’da daha da genişleyebileceği söyleniyor. Nvidia GB200/300 ve bazı AMD GPU modellerine Orta Doğu’daki veri merkezleri için verilen sınırlı lisanslar da ABD Ticaret Bakanlığı’nın yeni bir düzenleyici çerçeve hazırladığını düşündürüyor.

 

Bu süreçte hem ABD hem Çin tarafında sürekli bir “sarsıntı” yaşanması bekleniyor. ABD Adalet Bakanlığı’nın geçen ay bazı kişileri A100 GPU kaçakçılığı iddiasıyla tutuklaması, miktarların düşük olmasına rağmen uyarı niteliğindeydi.

 

2026’da Çinli model geliştiricilerin, Nvidia dışı alternatif donanımlara da daha fazla yöneleceği öngörülüyor: Huawei, Moore Threads, Biren, Enflame gibi yerli üreticilerin GPU çözümleri hız kazanıyor.