Yapay zeka ile sahne performansı!
Madonna konser turnesinde 1980’lerin hit şarkısı La Isla Bonita’yı her söylediğinde, arkasındaki dev arena ekranlarında dönen, gün batımı tonlarında bulutların hareketli görüntüleri oynatıldı. Bu ruhani görünümü elde etmek için pop efsanesi, yapay zekanın henüz keşfedilmemiş bir dalı olan metinden video üreten yapay zeka teknolojisini kullandı. Gerçeküstü bulut, gün batımı yada şafak vakti, ormanda şelale gibi birkaç kelime yazıldığı anda videolar oluşturularak sahne performansında gösterildi.
Yapay zeka ile birleşen sohbet robotları ve görüntü oluşturan teknolojilerin izinden giden meraklı insanlar, bu yeni teknolojinin bir gün eğlence sektörünü altüst edebileceğini ve özelleştirilebilir hikayeler ile kendi filminizi üretmenize olanak sağlayabileceğini söylüyor. Ancak bunu yapabilmeleri için önlerinde uzun bir yol var ve bu yolda pek çok etik tuzak bulunuyor.
Sanatın sınırlarını uzun süredir zorlayan Madonna gibi sanatçılar için bu teknoloji bir deneme nitelinliğindeydi. Nisan sonuna kadar devam edecek Celebration Tour’un içerik direktörü Sasha Kasiuha, “CGI’ı (Bilgisayar Tabanlı Görüntü) denedik fakat oldukça sade ve sevimsiz görünüyordu. Ayrıca Madonna bundan hoşlanmadı ve bizde yapay zekayı denemeye karar verdik” dedi.
OpenAI, henüz halka açık olmayan yeni bir araç olan Sora’yı, kısa bir süre önce gösterdiğinde sofistike metinden videoya dönüştüren teknolojinin neye benzeyebileceğine dair insanlara bir fikir vermişti. Madonna’nın ekibi, geçtiğimiz mart ayında ilk halka açık metinden videoya dönüştüren modelini yayınlayarak teknolojiye öncülük eden New York merkezli girişim Runway’in farklı bir ürününü denedi. Şirket haziran ayında daha gelişmiş bir “Gen-2” versiyonunu piyasaya sürdü.
Runway CEO’su Cristóbal Valenzuela, bazı kişilerin bu araçları bir kelime yazarak bir şekilde tam olarak kafanızdakini ortaya çıkaran sihirli bir cihaz olarak gördüğünü, ancak en etkili yaklaşımların, düzenli olarak kullandıkları onlarca yıllık dijital düzenleme yazılımlarına bir yükseltme yapmak isteyen yaratıcı profesyoneller tarafından kullanıldığını söyledi.
Runway’in henüz tam uzunlukta bir belgesel yapamayacağını söyledi. Ancak hikayeyi anlatmaya yardımcı olan destekleyici çekimler ve sahneler için yardımcı olabileceğini belirtti. Bu teknolojilerin çeşitli kullanım örneklerindeki ortak noktanın insanların yapabilecekleri işlerin üzerine daha fazlasını ekleyerek hızlandırma yöntemi olarak kullandığını belirtti.
Valenzuela, Runway’in hedef müşterileri büyük yayın şirketleri, prodüksiyon şirketleri, post prodüksiyon şirketleri, görsel efekt şirketleri, pazarlama ekipleri, reklam şirketleri ve geçimini sağlamak için içerik üreten pek çok kişi olduğunu söyledi. Bu teknolojinin bir çok tehlikeli tarafıda mevcut. Etkili önlemler alınmazsa, yapay zeka video üreticileri hiç yaşanmamış olayları bu teknolojilerle üreterek tehdit unsuru olarak kullanabilir, tanınabilir yüzlere sahip gerçek insanlar gibi görünen fenomen ve yıldızları sahte uygunsuz içeriklerin içine ekleyebilir. Düzenleyicilerin baskısı altındaki büyük teknoloji şirketleri, neyin gerçek olduğunu belirlemeye yardımcı olmak için yapay zeka tarafından üretilen çıktıları filigranlama sözü verdi.
Ayrıca, yapay zeka sistemlerinin eğitildiği video ve görüntü koleksiyonları Runway ve OpenAI gibi şirketler tarafından açıklanmıyor. Bu nedenle ticari markalı eserleri ne ölçüde haksız bir şekilde kopyaladıkları konusunda telif hakkı anlaşmazlıkları da var. Ve bir noktada, video yapım makinelerinin insan işlerinin ve sanatın yerini alabileceğine dair korkular var.
Şimdilik, yapay zeka tarafından üretilen en uzun video klipler hala saniyelerle ölçülüyor ve sarsıntılı hareketler ile bozuk eller ve parmaklar gibi belirgin hatalar içerebiliyor. Carnegie Mellon Üniversitesi’nde bilgisayar bilimleri profesörü olan ve 1970’lerden bu yana yapay zeka araştırmaları yapan Alexander Waibel, bunu düzeltmenin sadece daha fazla veri ve daha fazla eğitim meselesi olduğunu ve bu eğitimin, bilgisayarların sahip olduğu bilgi ve işlem gücüne bağlı olduğunu söyledi.
Waibel, “Artık ‘Bana Napolyon gibi giyinmiş bir tavşanın New York’ta yürüdüğü bir video hazırla’ diyebiliyorum. New York’un neye benzediğini, bir tavşanın neye benzediğini, Napolyon’un neye benzediğini biliyor” dedi. Waibel, bunun etkileyici olduğunu, ancak yine de ilgi çekici bir hikaye oluşturmaktan uzak olduğunu sözlerine ekledi.
Massachusetts Teknoloji Enstitüsü’nde bilgisayar bilimleri profesörü olan Phillip Isola, “Difüzyon modellerinin yaptığı şey, gazların yayılma prensibini tersine çevirmektir. Rastgelelikten içeriğe geçmenin yolu budur ve bu şekilde rastgele videolar oluşturabilirsiniz” dedi.
Bilgisayar Bilimi ve Yapay Zeka Laboratuvarı’nı yöneten bir başka MIT profesörü Daniela Rus, video oluşturmanın hareketsiz görüntülerden daha karmaşık olduğunu, çünkü zamansal dinamikleri veya videodaki öğelerin zaman içinde ve kare dizileri boyunca nasıl değiştiğini hesaba katılması gerektiğini söyledi. Rus, gerekli bilgi işlem kaynaklarının hareketsiz görüntü üretiminden önemli ölçüde daha yüksek olduğunu söyledi. Bunun sebebi ise videonun her saniyesi için birden fazla karenin işlenmesi ve üretilmesi gerektiğini belirtti.
Bu durum, bazı varlıklı teknoloji şirketlerinin daha uzun sürelerde daha yüksek kalitede yapay zeka video üretimi konusunda birbirlerini geçmeye çalışmalarını engellemiyor. Bir görüntü oluşturmak için yazılı açıklamalara ihtiyaç duymak sadece bir başlangıçtı. Google kısa bir süre önce, bir fotoğrafı ya da bir taslağı bile keşfedebilecek video oyunu dünyalarının, sonsuz çeşitliliğe dönüşmesi için oluşturdukları Genie adlı yeni bir projeyi sergiledi.
Cleveland Eyalet Üniversitesi’nde metinden video üretim pazarını inceleyen araştırmacı Aditi Singh, yakın vadede yapay zeka tarafından üretilen videoların pazarlama ve eğitim içeriklerinde ortaya çıkarak stok videolara daha ucuz bir alternatif olacağını söyledi. Singh, “Yapay zeka tarafından üretilen daha uzun filmler zaten yapılıyor. Runway, bu tür çalışmaları sergilemek için yıllık bir yapay zeka film festivaline ev sahipliği yapıyor. Ancak izleyicilerin bunları izlemeyi tercih edip etmeyeceğini zaman gösterecek” dedi.