Çin merkezli yapay zeka laboratuvarı DeepSeek, V3 serisinin en yeni üyesi olan V3.2 modelini tanıttı. Bu gelişmiş yapay zeka, Pazartesi günü kullanıma açıldığında iki farklı versiyonla sunuldu: “Thinking” ve daha güçlü olan “Speciale”. DeepSeek’in bu yeni modeli, açık kaynaklı yapay zekanın sınırlarını zorlamanın yanı sıra, düşük maliyet avantajı ile de öne çıkmayı hedefliyor.
Model, Hugging Face platformu üzerinden erişilebilir hale getirildi ve geliştiricilere daha erişilebilir yapay zekaya ulaşma imkanı sunuyor. Şirketin yayınladığı verilere göre, V3.2 Speciale modeli, endüstri devleri OpenAI GPT-5 High, Anthropic Claude 4.5 Sonnet ve Google Gemini 3.0 Pro gibi kapalı kaynak modelleri bazı akıl yürütme testlerinde geride bırakıyor.
Maliyet açısından bakıldığında ise fark büyük. Gemini 3 API ücretleri 1 milyon token başına 4 dolar seviyesinde iken, V3.2 Speciale’nin maliyeti sadece 0.028 dolar civarında kalıyor. Ayrıca, modelin Uluslararası Matematik Olimpiyatı ve Uluslararası Bilişim Olimpiyatları’nda altın seviyesine ulaşması, performansını kanıtlar nitelikte.
DeepSeek, açık kaynaklı modellerin performansını artırmak ve işlem yükünü azaltmak için önemli altyapı yeniliklerine imza attı. Bu bağlamda, geleneksel “vanilla attention” mekanizmasının neden olduğu yavaşlığı aşmak amacıyla DeepSeek Sparse Attention (DSA) adında yeni bir yöntem geliştirdi. Bu mekanizma, veriyi öncelikle hızlıca tarayıp yalnızca ilgili bölümlere odaklanarak daha verimli işlem sağlıyor. Bunu, dağınık bir kitap yığını içinden aradığınız bilgiyi hemen bulmaya çalışmak yerine, düzenli bir kütüphanelerden doğrudan aradığınız bölüme gitmek gibi düşünebilirsiniz.
Ancak, yeni teknolojinin bazı sınırlamaları da bulunuyor. Yayınlanan makaleye göre, modelin “dünya bilgisi” yani genel kültür alanındaki bilgi kapasitesi, kapalı kaynaklı lider modellere kıyasla daha sınırlı kalıyor. Ayrıca, karmaşık ve zor görevlerde zaman zaman zorlanabiliyor ve benzer kalitede çıktı almak için daha fazla token kullanabiliyor. Yine de, Çinli bir şirketin geliştirdiği bu açık kaynaklı modelin, en gelişmiş kapalı sistemlerle rekabet edebilmesi, sektörün “performans farkı” algısını değiştirme potansiyeli taşıyor.
Bu gelişmeler, yüksek maliyetli kapalı yapay zeka sistemlerinin gerekliliği konusunu yeniden gündeme getirirken, geliştiricilere neredeyse ücretsiz erişim imkanı sağlayan alternatiflerin yükselişini hızlandırıyor. Eğer açık kaynaklı modeller bu hızla ilerlemeye devam ederse ve farkı kapatırsa, kullanıcıların yüksek ücret ödemeye olan motivasyonu ciddi ölçüde azalabilir.