Generasi ketiga: Generalisasi dengan Veo
Terobosan terbaru kami terus berlanjut Jadi begitugenerasi video tercanggih dari Google. Kekuatan utama Veo adalah kemampuannya menghasilkan video yang menangkap interaksi kompleks antara cahaya, material, tekstur, dan geometri. Arsitektur berbasis difusi yang kuat dan kemampuannya untuk menyempurnakan berbagai tugas multi-modal memungkinkannya unggul dalam sintesis tampilan baru.
Untuk menyempurnakan Veo agar dapat mengubah gambar produk menjadi video 360° yang konsisten, pertama-tama kami menyusun kumpulan data jutaan aset sintetis 3D berkualitas tinggi. Kami kemudian merender aset 3D dari berbagai sudut kamera dan kondisi pencahayaan. Terakhir, kami membuat kumpulan data gambar dan video berpasangan dan mengawasi Veo untuk menghasilkan putaran 360° yang dikondisikan pada satu atau lebih gambar.
Kami menemukan bahwa pendekatan ini dapat diterapkan secara efektif pada beragam kategori produk, termasuk furnitur, pakaian jadi, elektronik, dan lainnya. Veo tidak hanya mampu menghasilkan tampilan baru yang sesuai dengan gambar produk yang tersedia, namun juga mampu menangkap pencahayaan kompleks dan interaksi material (misalnya permukaan mengkilap), sesuatu yang merupakan tantangan bagi pendekatan generasi pertama dan kedua.