Pentagon, yapay zekaya olan bağımlılığını artırırken, bu teknolojilerin beklenen şekilde işlev gördüğünden emin olmak için önemli bir tartışma gündeme geliyor. En etkili yöntem, kullanıcılara sunulmadan önce bu yapay zeka modellerini kapsamlı bir şekilde denemek olarak öne çıkıyor. Savunma Bakanlığı ve Ulusal İstihbarat Direktörlüğü, yapay zeka sistemlerinin belirlenen standartlara uyup uymadığını değerlendirebilecek bir mekanizma arayışında.
Bu kapsamda, Savunma İnovasyon Birimi’nin açıklamalarına göre, yapay zeka teknolojilerindeki hızlı ilerlemeler, hükümeti sürekli bir değerlendirme altyapısı kurmaya zorluyor. Değerlendirmeler, yalnızca yapay zekanın kendi başına görevleri yerine getirip getiremediğini değil, aynı zamanda insan-yapay zeka ekiplerinin performansını da kapsıyor. Bu ekiplerin, tek başına insan veya yapay zeka çalışmalarından daha üstün sonuçlar üretip üretemeyeceği analiz ediliyor.
Önerilen standart takılabilir mimari, herhangi bir yapay zeka modelini tutarlı şekilde test edebilecek bir ‘kablo demeti’ şeklinde tasarlanıyor. Bu sistem, farklı iş akışlarını incelemeyi, yapay zeka ajanlarını güvenli bir ortamda denetlemeyi ve uzmanların yalnızca insan, yalnızca yapay zeka veya karma senaryolarda iş yükünü, kullanılabilirliği ile performansı değerlendirmesine olanak tanıyor.
Sistem ayrıca, kaotik koşullarda yapay zekanın dayanıklılığını test etmek için operasyonel stresi ve ağ bozulmalarını simüle edebiliyor. Düşman yapay zeka tehditlerine karşı direnci ölçmek amacıyla, otomatik kırmızı ekip simülasyonları da dahil ediliyor. Değerlendirme kriterleri, görevlere özel yetenekleri belirleyerek, karmaşık süreçleri daha küçük ve ölçülebilir parçalara ayırıyor.
Değerlendirme Sonuçlarının Şeffaflığı ve Adaleti
Sonuçlar, karar vericiler için kolay anlaşılır bir formatta sunulmalı ve belirli yapay zeka mimarilerine haksız avantaj sağlamamalı. Bu yaklaşım, yapay zekanın güvenilir ve adil kullanımını teşvik ediyor. Süreç, 24 Mart tarihine kadar tamamlanacak adımlarla ilerliyor.