Yazılı Metni Resme Çeviren Yapay Zeka
Siz yazın DALL·E çizsin
San Francisco merkezli AI laboratuvarı Doğal dilde ifade edilebilen çok çeşitli kavramlar için metin başlıklarından görüntüler oluşturan DALL · E adlı bir sinir ağını eğitti.
Yeni geliştirilen yapay zeka hayvanların veya insan özelliklerine sahip şeylerin resimlerini çizebilir ve ilgisiz öğeleri mantıklı bir şekilde birleştirerek tek bir resim oluşturabilir. Görsellerin başarı oranı, metnin ne kadar iyi ifade edildiğine bağlı olacaktır. Görüntünün açıkça belirtilmeyen belirli bir ayrıntı içermesi gerektiğini ima ettiğinde genellikle “boşlukları doldurabilir”. Örneğin, ‘kaplumbağadan yapılmış bir zürafa’ veya ‘avakado şeklindeki bir koltuk’ metni size tatmin edici bir çıktı verecektir.
Kontrastlı Dil-Görüntü Ön Eğitimi (CLIP)
Doğal dile dayalı olarak doğru görüntü sınıflandırması yapabilen bir sinir ağıdır. Görüntüleri “filtrelenmemiş, çok çeşitli ve oldukça karmaşık ve kusurlu verilerden” farklı kategorilerle daha doğru ve verimli bir şekilde sınıflandırmaya yardımcı olur. CLIP’i farklı kılan, görsel sınıflandırma için mevcut modellerin çoğunun yaptığı gibi, küratörlü bir veri setinden görüntüleri tanımamasıdır. CLIP, İnternette bulunan çok çeşitli doğal dil denetimi konusunda eğitilmiştir. Böylece CLIP, bir veri kümesindeki etiketli tek bir kelimeden ziyade, bir resimde ne olduğunu ayrıntılı bir açıklamadan öğrenir. CLIP, tanınacak görsel kategorilerin adları sağlanarak herhangi bir görsel sınıflandırma karşılaştırmasına uygulanabilir. OpenAI bloguna göre CLIP, GPT-2 ve GPT-3’ün “zero-shot” yeteneklerine benzer.
DALL · E ve CLIP gibi modeller, önemli toplumsal etki potansiyeline sahiptir. OpenAI ekibi, bu modellerin belirli meslekler üzerindeki ekonomik etki, model çıktılarındaki önyargı potansiyeli ve bu teknolojinin ima ettiği uzun vadeli etik zorluklar gibi toplumsal meselelerle nasıl ilişkili olduğunu analiz edeceklerini söylüyor.
Görüntüleri doğrudan İnternet’ten alan DALL · E gibi üretken bir yapay zeka modeli, çeşitli telif hakkı ihlallerinin önünü açabilir. DALL · E, İnternette mevcut bir görüntünün herhangi bir dikdörtgen bölgesini yeniden oluşturabilir.
Detaylı bilgi ve DALL·E tarafından çizilen görüntüleri incelemek için tıklayın.