Baru-baru ini saya berkesempatan untuk mencoba terobosan terbaru Google dalam teknologi video AI, Veo 3. Teknologi ini dirilis pada 20 Mei 2025, selama acara I/O 2025 mereka.
Fitur-fiturnya yang keren telah menciptakan banyak kehebohan. Dan sebagai seseorang yang bekerja di bidang pembuatan video berbasis AI, saya ingin berbagi pemikiran dan pengalaman jujur saya dengan model ini.

Ringkasan singkat:
Saya menguji Veo 3 dengan membuat podcast dan beberapa video konser. Meskipun tidak sempurna dan memiliki beberapa gangguan aneh, sangat mengesankan bagaimana ia mampu menciptakan video realistis dan audio yang tersinkronisasi dengan baik.
Namun, saya juga terkadang merasa frustrasi dengan model ini: pembuatan audio dan teks terjemahan tidak sepenuhnya terkontrol, dan teks yang dihasilkannya seringkali kacau.
| Keuntungan | Kekurangan |
| ✔️ Menghasilkan video dan audio sekaligus | ❌ Paket berlangganan yang sangat mahal |
| ✔️ Sinkronisasi bibir dan efek suara yang realistis | ❌ Pembuatan audio & teks terjemahan yang tidak terkontrol |
| ✔️ Visual berkualitas tinggi dengan fisika yang baik | ❌ Sering terlihat kejanggalan dan teks yang berantakan |
| ✔️ Terintegrasi dengan Google Flow |
Video, Audio, Sulih Suara, Sinkronisasi Bibir, … Semuanya dalam Satu Paket
Hal pertama yang saya perhatikan adalah bagaimana Veo 3 menyederhanakan berbagai langkah pembuatan video menjadi satu proses yang sederhana.
Saat menggunakan Veo 3, saya kagum bagaimana perangkat lunak ini menghidupkan video saya dengan suara. Saya dapat menambahkan suara latar seperti kicauan burung di pepohonan atau hiruk pikuk jalanan kota, yang benar-benar membuat adegan saya terasa autentik.
Yang paling membuat saya terkesan adalah bagaimana ia dapat menciptakan dialog yang sesuai dengan gerakan bibir karakter - sangat alami sehingga terkadang tidak terlihat seperti dihasilkan oleh AI.
Alur Kerja Video AI yang Didefinisikan Ulang
Kemampuan multimodal baru ini jelas merupakan salah satu fitur utama dari model ini. Anda tidak perlu lagi repot-repot mengatur musik atau mencari sulih suara dan sinkronisasi bibir secara terpisah.
Hal ini dapat mengubah cara orang memproduksi video dengan AI:
- Alur kerja lama: Membuat video > membuat sulih suara/efek suara/musik > sinkronisasi bibir > pengeditan.
- Alur kerja baru dengan Veo 3: Cukup masukkan teks perintah, dan semuanya akan diurus.
Contoh Generasi
Saya ingin sekali melihat bagaimana Veo 3 mampu menangani permintaan video yang sedang tren, jadi saya memintanya untuk menghasilkan empat video unik.
Pada contoh pertama, saya meminta pengumuman pembawa berita cuaca palsu yang tampak otentik, yang menggambarkan invasi taco yang dengan cepat menuju Amerika Serikat.
Saya terkejut betapa semi-realistisnya rekaman itu. Meskipun ada beberapa distorsi wajah, penyiar tampak seperti nyata dengan sinkronisasi bibir yang cukup akurat.
Contoh selanjutnya adalah video unik yang menampilkan seekor gorila yang tampak realistis dan bisa berbicara, sedang menghadiri pertandingan sepak bola besar di Inggris. Gorila tersebut memegang tongkat selfie dan dengan marah mengomel kepada para penontonnya tentang keputusan wasit yang tidak adil saat berada di tribun bersama penggemar lainnya.
Hasilnya cukup menggelikan, karena gorila itu terlihat dan terdengar sangat hidup dengan ekspresi dan gerakan tubuh yang alami. Namun, masih ada beberapa distorsi latar belakang yang cukup terlihat.
Untuk contoh ketiga, saya ingin melihat seperti apa bagian dalam sayuran jika dipotong menjadi dua.
Sebagian besar, instruksi saya diikuti dengan akurat, tetapi karena suatu alasan, alat tersebut menghasilkan sayuran yang mengkristal, yang mengurangi realisme visual yang saya inginkan. Omong-omong, suaranya menenangkan.
Pada contoh terakhir ini, saya meminta Veo 3 untuk menghasilkan rangkaian sinematik perjalanan waktu tentang seorang wanita yang melakukan perjalanan kembali ke tanggal 14 April 1912, dan mencoba memperingatkan para penumpang di atas kapal Titanic tentang tenggelamnya kapal tersebut di Samudra Atlantik Utara, dekat Newfoundland.
Kali ini, menurut saya adegannya terlalu berlebihan dan urutan menghilang secara tiba-tiba itu tidak perlu. Terus terang, itu adalah rendering video AI yang cukup acak dan tidak akurat.
Secara keseluruhan, Veo 3 bekerja cukup baik untuk sebagian besar waktu. Terdapat beberapa kendala dalam ketepatan waktu dan konsistensi visualnya. Jadi, mungkin diperlukan perbaikan sesekali, tetapi saya pikir model AI ini memiliki kapasitas untuk menghasilkan video yang siap viral.
Flow: Mengintip Sekilas Produksi Video AI Generasi Berikutnya
Google merilis Flow bersamaan dengan Veo 3. Ini adalah platform storyboard video berbasis AI yang mengintegrasikan Veo 3 dan model video pendahulunya, serta banyak alat pembuatan dan pengeditan berbasis AI.

Papan cerita
Konsep storyboard bukanlah hal baru. Sora memperkenalkannya, tetapi diabaikan karena performanya yang buruk. Google Flow mengambil konsep storyboard dan membuatnya jauh lebih bermanfaat.
Anda dapat menempatkan klip apa pun yang Anda unggah atau hasilkan oleh keluarga model Veo ke garis waktu, mengaturnya, memangkasnya, dan melakukan pengeditan dasar. Tetapi fitur yang paling keren adalah apa yang mereka sebut "ekstensi".
Ekstensi Video Halus
Begini cara kerjanya: Anda mengambil video berdurasi 8 detik dan dapat menggunakan bingkai mana pun sebagai titik awal untuk menghasilkan animasi baru yang berlanjut dari momen tersebut.

Yang menakjubkan adalah betapa mulusnya transisi antara konten asli dan konten baru. Flow tampaknya menganalisis tren gerakan dalam video asli, bukan hanya menggunakan satu gambar sebagai referensi.
Fitur ekstensi ini sangat penting karena melampaui batasan panjang video yang dihasilkan AI pada umumnya. Alih-alih terpaku pada klip pendek, kini Anda dapat membuat video yang lebih panjang dan lebih naratif.
Ini mirip dengan apa yang dijanjikan Sora , tetapi implementasi Google sebenarnya berfungsi cukup baik untuk dapat bermanfaat.
Namun perlu diperhatikan: saat ini, fitur ekstensi hanya berfungsi dengan Veo 2 , bukan Veo 3 yang lebih baru.
Mengesankan, Tetapi Juga Tidak Konsisten
Saya cukup antusias dengan fitur-fitur keren dan video menakjubkan yang dapat dihasilkan Veo 3. Namun, saat saya menjelajahinya lebih lanjut, saya juga menyadari bahwa beberapa video yang saya buat memiliki masalah kualitas.
Generasi Audio & Teks Tak Terkendali
Satu hal yang benar-benar mengganggu saya adalah betapa acaknya pembuatan audio dan teks terjemahan. Anda tidak dapat mengontrol apakah keduanya akan muncul atau tidak, bahkan jika Anda menentukannya dalam perintah Anda.
Salah satu contohnya adalah video ini yang dihasilkan dengan perintah berikut: Gadis berusia 20 tahun itu sangat cemas dan berkata, "Ada apa? Esai yang saya tulis sendiri ternyata dibuat oleh AI?" Gadis itu memegang kepalanya, ekspresinya cemas, tanpa teks keterangan.
Saya secara khusus meminta agar gadis itu mengucapkan sesuatu dan tanpa teks dalam permintaan saya. Video yang dihasilkan benar-benar tanpa suara, tetapi dengan teks.
Dan dalam contoh video TikTok yang mempromosikan sikat gigi ini, Anda juga tidak dapat mendengar suara apa pun.
Keunikan & Kesalahan
Saya juga memperhatikan beberapa gangguan pada video yang dihasilkan oleh Veo 3. Ini termasuk gerakan yang canggung atau gangguan visual yang tidak masuk akal,
Sebagai contoh, saya mencoba membuat video unboxing laptop. Alih-alih menunjukkan seseorang benar-benar membuka kotak dan mengeluarkan laptop, kotak kardus itu sendiri langsung berubah menjadi laptop!
Sangat mengecewakan melihat bahwa masalah-masalah dari Veo 2 masih berlanjut di versi baru ini.
Selain itu, menurut saya kualitas suara secara keseluruhan masih perlu disempurnakan, dan beberapa efek suara yang dihasilkan terdengar aneh. Ini memang hal kecil, tetapi tetap terasa ketika saya mendengarkannya dengan saksama.
Teks Acak
Masalah lainnya adalah kualitas pembuatan teks. Veo 3 dapat menghasilkan teks keterangan untuk video, tetapi teks yang dihasilkan seringkali berantakan dan penuh dengan kesalahan ejaan.
Anda dapat melihat masalah ini pada contoh-contoh sebelumnya. Dan berikut beberapa contoh lagi untuk menunjukkan seberapa sering hal ini bisa terjadi.



Saya mengerti ini adalah masalah umum yang terjadi pada banyak model AI. Tetapi seperti yang disebutkan, Anda tidak dapat memiliki kendali penuh atas penampilannya. Jadi Anda mungkin perlu mencoba menghasilkan beberapa kali lagi untuk menghindari masalah ini.
Akses Mahal
Kelemahan lain yang saya temukan adalah Veo 3 sangat mahal. Ponsel ini hanya tersedia untuk pengguna yang berlangganan paket Ultra Google, yang harganya $249,99 per bulan.
Itu harga yang mahal. Jika Anda hanya pengguna biasa atau kreator kecil yang mungkin ingin bereksperimen dengan model ini, maka saya rasa ini bukan untuk Anda. Mudah-mudahan, Google akan memperluas akses atau menawarkan opsi yang lebih terjangkau di masa mendatang.
Tidak Dapat Menggunakan Veo 3? Coba Pollo AI!
Jika Anda mencari generator video AI berkualitas tinggi tetapi merasa Veo 3 sulit diakses, Anda pasti harus mencoba Pollo AI !
Pollo AI adalah platform pembuatan video dan gambar AI yang canggih dan lengkap yang memungkinkan Anda mencoba semua model video terbaik di satu tempat yang nyaman. Sebagai mitra resmi Google Cloud, Anda sekarang dapat mencoba Veo 3 di Pollo AI dan merasakan langsung kemampuan mutakhirnya!

Selain Veo 3, platform ini memungkinkan Anda untuk beralih dengan mudah dan merasakan kemampuan unik dari model-model unggulan lainnya seperti Veo 3.1 , Vidu, Hailuo, Kling, dan PixVerse. Ini memberikan akses ke semua model canggih yang Anda butuhkan untuk membuat video berkualitas tinggi yang menakjubkan.
Terlebih lagi, Pollo AI menawarkan serangkaian lengkap alat video bawaan untuk memenuhi semua kebutuhan kreatif Anda.
Sebagai contoh, Anda dapat mencoba fitur inovatifnya seperti konversi gambar ke video menggunakan AI, teks ke video menggunakan AI, referensi ke video , video ke video menggunakan AI , dan banyak lagi. Selain itu, Anda dapat menerapkan berbagai efek video AI untuk membuat berbagai macam video AI yang menyenangkan dan imajinatif.
Kesimpulan Akhir
Sebagai seseorang yang telah mencoba sebagian besar alat pembuatan video berbasis AI, saya sangat gembira dengan kualitas tinggi yang diberikan oleh Veo 3 .
Integrasi audio alami, detail realistis, dan proses pembuatan video yang efisien, semua fitur keren ini benar-benar membuat saya terkesan.
Di sisi lain, harga membatasi jangkauannya, dan masih ada ruang untuk perbaikan dalam kualitas dan konsistensi produksi.
Meskipun demikian, Veo 3 tetap memberi saya gambaran yang menarik tentang ke mana arah teknologi video AI, dan saya penasaran untuk melihat bagaimana Google dan perusahaan lain membangun di atas fondasi ini.
Dan juga, jika Anda mencari platform pembuatan video AI serba guna, saya sarankan Anda mencoba generator video Pollo AI !