Johns Hopkins Üniversitesi’nden araştırmacılar, yapay zekâ sistemlerinin dinamik sosyal sahneleri yorumlamada insanlar kadar başarılı olmadığını tespit etti. Çalışmaya göre insanlar, kısa videolar üzerinden sosyal etkileşimleri tanımlamada ve değerlendirmede yapay zekâya göre çok daha tutarlı sonuçlar veriyor.
Bu eksiklik, özellikle otonom araçlar ve insansı robotlar gibi yapay zekâya dayalı teknolojiler için büyük bir sorun teşkil ediyor. Zira bu sistemlerin güvenli çalışabilmesi için insan davranışlarını doğru analiz edebilmesi gerekiyor.
Katılımcılara üç saniyelik videolar izletilerek sosyal etkileşimleri değerlendirmeleri istendi. Aynı klipler, 350’den fazla yapay zekâ modeline de analiz ettirildi. İnsanlar kendi aralarında yüksek oranda fikir birliğine varırken, yapay zekâ modelleri tutarsız sonuçlar verdi.
Hangi modeller ne kadar başarılıydı?
Görüntü modelleri insan etkileşimlerini tanımada başarısız oldu. Video modelleri beyin aktivitesini öngörmede daha başarılıydı. Dil modelleri, insan davranışlarını tahmin etmede nispeten daha iyi sonuçlar verdi.
Temel bir eksiklik olabilir
Araştırmacılar, bu başarısızlığın yapay zekâ modellerinin temel yapısından kaynaklandığını düşünüyor. Çünkü mevcut modeller, durağan görselleri işleyen beyin bölgelerinden esinlenerek geliştirildi. Oysa sosyal etkileşimler gibi hareketli sahneler, beynin farklı bölgeleri tarafından algılanıyor.
Araştırmanın yazarlarından Kathy Garcia, “Bir görüntüde yüzleri ve nesneleri tanımak AI için büyük bir adımdı, ancak gerçek hayat durağan değil. AI’nin artık hikâyeyi, ilişkileri ve bağlamı da anlaması gerekiyor” dedi.
Kaynak TRT