Geliştirilen yeni bir yapay zeka, Street Fighter’da insan şampiyonu yendi

TeknolojiHaberleri

Singapur Teknoloji ve Tasarım Üniversitesi’nden (SUTD) araştırmacılar, karmaşık hareket tasarımını anlamak için tasarlanmış, takviyeli öğrenme ve faz değişimi hafızası üzerine kurulu yeni bir yazılım geliştirdiler.

Önceki çalışmalar bu tür derin öğrenmeyi satranç veya Go gibi diğer oyunlara uygulamıştı ancak araştırmacılar bunun yerine D-PPO algoritmasını Street Fighter Champion Edition II’nin zorluğuna karşı test etmeye karar verdi. SUTD araştırmacıları, SF-R2 AI oynatıcısını iki gün üst üste bilgisayara karşı oynayarak eğitti. Daha sonra yapay zeka, bir Street Fighter şampiyonunu yenmeyi başararak kendisinden bekleneni gerçekleştirdi.

Araştırma makalesine göre, bu çalışmanın kinesiyoloji için daha geniş etkileri var. Örneğin robotik ve otonom araçların geliştirilmesinde önemli bir rol oynayabilir. Aynı zamanda makinelerin insan normlarını gözlemleyebildiği ve onları taklit edip daha iyi performans gösterebildiği alanlarda yaygın olarak uygulanabilir eğitimin önünü açıyor.

Yapay zeka araştırmacılarının geliştirdikleri sistemlerin etkinliğini ölçmek için kullandıkları en yaygın yöntemlerden biri, bu sistemleri farklı oyun türlerinde insan oyuncularla rekabet etmektir. 2017’de Derin Düşünce tarafından geliştirilen bir Alfa Git Yapay zekası, bir önceki yıl Fan Hui’ye karşı kazandığı ilk zaferin ardından dünyanın bir numaralı insan Go oyuncusunu ikinci kez yendi. Microsoft’un yapay zekası dünyanın ilk kusursuz Bayan’ını piyasaya sürdü. Pac-Man skorunu elde etti ve ağustos ayında bir OpenAI motoru elde etti. Zamanın en iyi Dota 2 oyuncularını yendiğini gördük.

Bir Street Fighter şampiyonunu mağlup eden bu son başarı, faz değişimi hafızası ve takviyeli öğrenme sayesinde mümkün oldu. İlk olarak HP tarafından geliştirilen bu bellek, kalkojen cam üzerindeki alanları değiştirmek için elektrik yükleri kullanılarak elde edilen, kalıcı bir bellek türüdür. Yani yaygın olarak kullanılan Flash belleklerden çok daha hızlıdır.

Baş araştırmacı Desmond Loke TechXplore’a şunları söyledi:Yaklaşımımız benzersiz çünkü en iyi insan oyunculardan daha iyi performans gösteren hareketler oluşturma sorununu çözmek için takviyeli öğrenmeyi kullanıyoruz. Bu, önceki yaklaşımlarla mümkün değildi ve yaratabileceğimiz hareket türlerini dönüştürme potansiyeline sahip.” söz konusu.