VFusion3D, tek bir görüntüden 3B modeller oluşturmak için tasarlanmış yeni bir üretken yapay zekadır

Özetle:Üretken AI işinde yer alan şirketler, benzeri görülmemiş üretkenlik iyileştirmeleri ve maliyet kesintileri hakkında abartılı vaatlerde bulunmaya devam ediyor. Meta artık, yeni bir makine öğrenme algoritması sayesinde görünüşte kolaylıkla ve çok az girdi verisiyle gerçekleştirilebilen 3B model oluşturmaya odaklanıyor.

Meta ve Oxford Üniversitesi’ndeki araştırmacılar, 3B modellere odaklanan ölçeklenebilir üretken algoritmalar geliştirmek için yeni bir yöntem olan VFusion3D üzerinde birlikte çalıştılar. Teknoloji, temel 3B üretken modellerdeki ana sorunu aşmanın bir yolu olarak tasarlandı: bu yeni modelleri başlangıçta eğitmek için yeterli 3B veri olmaması gerçeği.

vfusion3d tek bir goruntuden 3b modeller olusturmak icin tasarlanmis yeni bir uretken yapay zekadir HmZVT7Vm

Araştırmacılar, görsellerin, metinlerin veya videoların bol miktarda bulunduğunu ve bunların “geleneksel” üretken AI algoritmalarını eğitmek için kullanılabileceğini açıklıyor. Ancak, 3B modeller söz konusu olduğunda, belirli varlıklar kolayca bulunamıyor. Çalışmada, “Bu, diğer veri türlerinin muazzam miktarlarına kıyasla ölçekte önemli bir farklılığa yol açıyor” deniyor.

VFusion3D, 3B veri için bir kaynak olarak, geniş hacimli metin, resim ve hatta videolarla eğitilmiş bir görüntü yayma modelini benimseyerek bu sorunun üstesinden gelebilir. Yeni yöntem, algoritmik ince ayar sayesinde çoklu görünüm oluşturma yeteneklerini “açabilir” ve gelecekte yeni 3B oluşturma modellerini beslemek için yeni bir büyük ölçekli, sentetik veri kümesi oluşturmak için de kullanılabilir.

vfusion3d tek bir goruntuden 3b modeller olusturmak icin tasarlanmis yeni bir uretken yapay zekadir lVpwIka7

Araştırmacılar, VFusion3D temel modelinin yaklaşık 3 milyon “sentetik çoklu görünüm verisi” ile eğitildiğini ve artık tek bir (2D, varsayıyoruz) görüntüden saniyeler içinde yeni bir 3D varlık üretebildiğini söylüyor. VFusion3D, diğer 3D üretici modellere kıyasla daha yüksek bir performans seviyesi sağlayabilir ve kullanıcılar görünüşe göre sonuçlarını %90’dan fazla tercih ediyor.

Resmi proje sayfası, VFusion3D’yi geliştirmek için benimsenen boru hattını açıklar. Araştırmacılar önce bir görüntü yayılım modelini ayarlamak için sınırlı miktarda 3B veri kullandılar, ardından söz konusu modeli bir “veri motoru” olarak çalışan çoklu görünüm görüntü oluşturucusuna dönüştürdüler. Motor, büyük miktarda tuhaf sentetik varlık oluşturmak için kullanıldı ve bunlar sonunda VFusion3D’yi uygun bir üretken AI algoritması olarak eğitmek için kullanıldı.

Araştırmacılar, VFusion3D’nin eğitim için daha büyük bir veri kümesi kullanıldığında üretilen 3B varlıkların kalitesini artırabileceğini söylüyor. “Daha güçlü” görüntü yayılım modelleri ve daha fazla 3B varlık kullanarak algoritma daha da gelişebilir. Nihai hedef, eğlence sektöründe çalışan şirketlere 3B grafikler oluşturmak için çok daha kolay bir yol sağlamak, ancak bu sefer üretken AI’nın ürkütücü perdelerinin arkasına saklanan düşük ücretli, itibarsız insan işçiler olmayacağını umuyoruz.

Facebook
Twitter
LinkedIn
WhatsApp
Pinterest
Tumblr

Benzer Haberler

Son Haberler