Bu sitedeki içerik yapay zeka (AI) veya makine çeviri teknolojisi kullanılarak çevrilmiştir ve hatalar içerebilir.

Skip to content

Roblox Cube'u Tanıtıyoruz: 3D ve 4D için Temel Üretken Yapay Zeka Sistemimiz

SEO image for Introducing Cube: Roblox’s Open-Source 3D Generative Model
  • Üretken yapay zeka için Cube 3D temel modelimizi yayınlıyoruz.
  • Ayrıca, Cube 3D temel modelinin bir sürümünü açık kaynak olarak yayınlıyoruz.
  • Roblox Studio'da ve deneyim içi Lua API olarak sunulan Cube 3D ağ oluşturma özelliğinin beta sürümü bu hafta kullanıma sunulacak. 

Geçen sonbaharda, Roblox'ta 3D nesneler ve sahneler oluşturmak için açık kaynaklı bir 3D temel model geliştirmek üzere iddialı bir proje duyurmuştuk. Bu hafta, bu modelin ilk sürümünü GitHub ve HuggingFace'de açık kaynak olarak yayınlayarak Roblox platformu içindeki veya dışındaki herkesin kullanımına sunuyoruz. Bu modele Cube 3D adını verdik. Ayrıca, mesh oluşturma API'mizin beta sürümüyle birlikte bu modelin ilk özelliklerini de kullanıma sunuyoruz. Cube, son derece karmaşık sahne oluşturma araçları da dahil olmak üzere, önümüzdeki yıllarda geliştireceğimiz birçok AI aracının temelini oluşturacak. Sonuçta, metin, görüntü, video ve diğer giriş türleri üzerinde eğitilmiş çok modlu bir model olacak ve mevcut AI oluşturma araçlarımızla entegre edilecek.

Cube 3D, doğrudan metinlerden ve gelecekte görüntü girdilerinden 3D modeller ve ortamlar oluşturur. Günümüzde, en gelişmiş 3D oluşturma teknolojisi, 3D nesneleri oluşturmak için görseller ve bir yeniden yapılandırma yaklaşımı kullanır. Bu, yeterli 3D eğitim verisi olmadığında iyi bir seçenektir. Ancak, platformumuzun doğası gereği, biz yerel 3D verilerle eğitim yapıyoruz. Oluşturulan nesne, günümüz oyun motorlarıyla tamamen uyumludur ve nesneleri işlevsel hale getirmek için genişletilebilir. 

Buradaki fark, bir yarış pisti film setine benziyor. Televizyonda, tribünleri, garajları ve zafer şeridi ile tamamen işlevsel bir yarış pisti gibi görünen bir şey görebilirsiniz. Ancak o sette dolaşırsanız, yapıların aslında düz olduğunu hemen fark edersiniz. Gerçekten sürükleyici bir 3D dünya oluşturmak için, içine girebileceğiniz garajlar, oturabileceğiniz tribünler ve işlevsel bir podyumun bulunduğu bir zafer şeridi gibi eksiksiz, işlevsel yapılar gerekir.

Bunu başarmak için, bir cümle oluşturmak üzere bir sonraki tokeni tahmin edebilmeleri için metin tokenleri (veya karakter kümeleri) üzerinde eğitilmiş son teknoloji modellerden ilham aldık. Yenilikçiliğimiz aynı temel fikir üzerine inşa edilmiştir. 3D nesneleri tokenize etme ve şekilleri token olarak anlama yeteneği geliştirdik ve Cube 3D'yi, eksiksiz bir 3D nesne oluşturmak için bir sonraki şekil tokenini tahmin edecek şekilde eğittik. Bunu tam sahne oluşturmaya genişlettiğimizde, Cube 3D düzeni tahmin eder ve bu düzeni tamamlamak için şekli yinelemeli olarak tahmin eder.

Herkes, ihtiyaçlarına göre Cube 3D'yi kendi verileriyle ince ayarlayabilir, eklentiler geliştirebilir veya eğitebilir. AI araçlarının açıklık ve şeffaflık üzerine kurulması gerektiğine inanıyoruz; bu nedenle açık kaynaklı AI topluluğunda kararlı bir ortağız. AI güvenlik alanındaki gelişmeleri paylaşmanın tüm sektörün inovasyon ve teknik ilerlemeleri hızlandırmasına yardımcı olacağına yürekten inandığımız için AI güvenlik modellerimizden birini yayınladık. Bu nedenle, açık kaynaklı güvenlik araçlarıyla dijital güvenlikteki önemli alanları ele almaya adanmış yeni bir kar amacı gütmeyen kuruluş olan ROOST'un kurulmasına da yardımcı olduk. Cube 3D'yi açık kaynak haline getirerek amacımız, araştırmacıların, geliştiricilerin ve daha geniş AI topluluğunun sektör genelinde 3D oluşturmayı öğrenmesini, geliştirmesini ve ilerletmesini sağlamaktır.

Yaratıcılık için Cube 3D

AI'nın 3D varlıkların, aksesuarların ve deneyimlerin oluşturulmasını nasıl hızlandırabileceğinden daha önce bahsetmiştik. Sonuçta AI, daha da sürükleyici ve kişiselleştirilmiş oyun ve bağlantılar sağlayacaktır. Hem bu deneyimlerin geliştiricileri hem de bu deneyimlerde zaman geçiren kullanıcılar için, yaratım döngüsünün her aşamasında AI'yı desteklemek üzere altyapıya yatırım yapıyoruz. Geliştiricilerin, deneyimlerinde yapay zekayı etkinleştirerek kullanıcılarına yeni yaratım yolları sunacağı bir gelecek hayal ediyoruz. Bu, 85 milyondan fazla günlük aktif kullanıcının oyun deneyiminin bir parçası olarak yapay zekanın gücünü ellerine verecektir.

Geçtiğimiz yıl, geliştiricilere yaratmak için ihtiyaç duydukları araçları ve yetenekleri sunmak ve saatlerce süren manuel çalışmayı ortadan kaldırmak amacıyla Roblox Studio içindeki AI destekli Asistanımız aracılığıyla birkaç yeni özellik sunduk. Cube ile 3D yaratımı daha verimli hale getirmeyi amaçlıyoruz. 3D mesh oluşturma sayesinde geliştiriciler, yeni yaratıcı yönleri hızla keşfedebilir ve hangisiyle devam edeceklerine hızlıca karar vererek üretkenliklerini artırabilirler.

Bir yarış pisti oyunu oluşturduğunuzu hayal edin. Bugün, Assistant içindeki Mesh Generation API'sini kullanarak "/generate a motorcycle" veya "/generate orange safety cone" gibi hızlı bir komut yazabilirsiniz. Saniyeler içinde API, bu nesnelerin bir mesh versiyonunu oluşturur. Daha sonra bunlar doku, renk vb. ile detaylandırılabilir. Bu API ile, basit nesneleri modellemek için saatler harcamaya gerek kalmadan, sahne donanımlarını modelleyebilir veya alanınızı çok daha hızlı tasarlayabilirsiniz. Bu sayede, pist düzenini tasarlamak ve arabanın yol tutuşunu ince ayarlamak gibi eğlenceli işlere odaklanabilirsiniz. Bu API, oluşturulan her nesne için saatler kazandırır ve size bu zamanı, çok fazla zaman veya çaba harcamaktan endişe etmeden yeni fikirleri denemek için geri verir. Uzun vadede, daha karmaşık ve işlevsel nesneleri, hatta sahneleri bile etkinleştirmeyi planlıyoruz.

Bu teknoloji, her gün Roblox'ta oynayan ve bağlantı kuran on milyonlarca yaratıcı insana uzanıyor. Gelecekte, geliştiricilerin kullanıcılarının yapay zeka kullanarak yaratıcı olmalarını sağlayacağını öngörüyoruz. Mesh Generation API etkinleştirildiğinde, oyuncular hayal edebilecekleri her şeyi hayata geçirebilirler. Bir oyuncu fütüristik bir araba istiyorsa, sadece "yan kanatlı kırmızı fütüristik araba" veya "siyah deri motosiklet ceketi" yazarak bunun oluşturulduğunu görebilir. Bu tür oyun içi yapay zeka oluşturma, yepyeni bir yaratıcılık düzeyinin kapılarını açacak. Oyuncular, geliştiricilerin hayal bile edemeyeceği şekillerde deneyimlerini kişiselleştirebilecek ve bu da oyunlarını daha da ilgi çekici hale getirecek.

Perde Arkası: 3D ve Metin/Görüntü Belirteçleri Arasındaki Çapraz Dikkat

Temel teknik zorluk, metin ve görüntüleri 3D şekillerle ilişkilendirmekti. Temel teknik atılımımız, 3D nesneleri metnin token olarak temsil edilebildiği gibi token olarak temsil etmemizi sağlayan 3D tokenleştirmedir. Bu, dil modellerinin bir cümlede sonraki kelimeyi tahmin ettiği gibi, bir sonraki şekli tahmin etme yeteneği sağlar.

3D oluşturma işlemini gerçekleştirmek için, tek nesnenin otoregresif oluşturulması, şekil tamamlama ve çoklu nesne/sahne düzeni oluşturma için birleşik bir mimari tasarladık. Otoregresif dönüştürücüler, bir sonraki bileşeni tahmin etmek için önceki girdileri kullanan sinir ağlarıdır. Bu mimari, hem ölçeklenebilirlik hem de çok modlu uyumluluk sağlar; böylece modeli genişlettikçe, birçok farklı türde girdi (metin, görsel, ses ve 3D) ile çalışacaktır. Bu modeli açık kaynak olarak yayınlıyoruz. Bu ilk aşamada, içerik oluşturucular metin komutlarına dayalı olarak 3D nesneler oluşturabilecekler. İleride, içerik oluşturucuların çok modlu girdilere dayalı olarak tüm sahneleri oluşturabilmelerini hedefliyoruz.

Şekil oluşturma için önceden eğitilmiş bir dönüştürücü (GPT) eğitmek amacıyla, ayrık 3D şekil belirteçleri kullanıyor ve bunları metin komutlarıyla eşleştiriyoruz. Bu yenilikçi yaklaşım, oynanabilir 3D sahne oluşturma dünyasına adım atmamızı sağlıyor.

Cube'un Gittiği Yön

Günümüzde dünyanın büyük bir kısmı, cümlelerdeki kelimeleri tahmin etmek için metinlerde yapay zeka kullanıyor. Birçoğu da görüntüleri tahmin etmek için piksellerde kullanıyor. Tüm bu unsurların bir araya geldiği ve birbirleriyle bağlam içinde çalışması gereken sahneler oluşturulduğunda işler çok daha karmaşık hale geliyor. Örneğin, "ağaçların bulunduğu bir yarış pistinin önünde motosiklet süren bir avatar" olarak tanımlanabilecek basit bir sahneyi içeren bir deneyim düşünün. 

Bu deneyimi oluşturmak için birçok unsur kullanılır. Ağaçlar iki 3D ağın birleşiminden oluşur, motosiklet detaylar ve üçgenler içeren yoğun bir ağdır ve binalar Roblox parçalarından oluşur. Motosiklet üzerindeki avatarın vücudu, uzuvları ve kafası daha karmaşık geometrik özelliklere sahiptir. Son olarak, tüm bunları bir düzenle birbirine bağlayacak bir yola ihtiyacımız var. Bunun için, bu geometriyi nasıl düzenleyeceğimizi bilmek üzere, bir nesnenin boyutunu ve konumunu tanımlamak için dış hatlarını çizen sınırlayıcı kutulara ihtiyacımız var. Bu zahmetli bir süreçtir, ancak AI her adımda yardımcı olabilir. AI ile yaratıcılar ilk versiyona daha hızlı ulaşabilir ve yeni fikirleri test etmek veya sahnelerini iyileştirmek için daha fazla zamana sahip olabilirler. 

Bu aşamaya geldiğimizde, oluşturduğumuz 3D nesnelerin ve sahnelerin tam olarak işlevsel olmasını istiyoruz. Buna 4D yaratım diyoruz; burada dördüncü boyut, nesneler, ortamlar ve insanlar arasındaki etkileşimdir. Bunu başarmak için sadece sürükleyici 3D nesneler ve sahneler oluşturmakla kalmayıp, bu nesneler arasındaki bağlamları ve ilişkileri de anlamak gerekir. Cube ile hedeflediğimiz nokta budur. 

Ağ oluşturmanın bu ilk kullanım örneğinin ötesinde, sahne oluşturma ve anlama alanlarına da genişlemeyi planlıyoruz. Kullanıcılara en çok ilgilerini çeken deneyimleri sunabilecek ve bağlam içinde nesneler ekleyerek sahneleri zenginleştirebileceğiz. Örneğin, bir orman sahnesinin yer aldığı bir deneyimde, bir geliştirici Assistant'tan ağaçlardaki tüm yemyeşil yaprakları sonbahar yapraklarıyla değiştirmesini isteyerek mevsim değişikliğini gösterebilir. AI Assistant araçlarımız, geliştiricilerin isteklerine yanıt vererek deneyimlerini hızla oluşturmalarına, uyarlamalarına ve ölçeklendirmelerine yardımcı olur. 

Temel modelimizi geliştirmeye ve genişletmeye devam ederken, güncellemeleri ve yeni işlevleri sizlerle paylaşacağız. O zamana kadar, GitHub ve HuggingFace'den erişebileceğiniz açık kaynaklı Cube 3D modelimizi kullanmaktan ve bu model üzerine geliştirmeler yapmaktan keyif almanızı dileriz.