Jika Anda menggunakan gambar yang dihasilkan AI, Anda pasti sudah mendengar bahwa Google DeepMind baru saja meluncurkan model gambar AI terbaru mereka, Imagen 4. Tetapi, apakah model ini benar-benar sepadan dengan semua gembar-gembornya? Saya sangat ingin mengetahuinya!
Diperkenalkan di Google I/O 2025 , model AI baru ini dikembangkan untuk menghasilkan citra yang lebih kaya dan lebih detail dengan kejelasan dan kecepatan yang lebih tinggi daripada pendahulunya,Imagen 3 .
Google juga mengklaim bahwa mereka dapat secara realistis menampilkan warna yang bernuansa, serta detail dan tekstur yang rumit seperti kain, bulu hewan, atau bahkan tetesan air.
Dalam hal ini, model gambar AI dapat unggul dalam fotorealisme dan gaya abstrak. Selain itu, Imagen 4 juga dirancang untuk menawarkan ejaan dan tipografi yang lebih baik.
Artinya, saya dapat menggunakannya untuk membuat berbagai macam gambar yang sarat teks seperti poster, komik, slide, undangan, dan lain sebagainya.

Imagen 4 juga akan menawarkan kepatuhan yang lebih cepat, menyediakan akses ke berbagai rasio aspek yang lebih luas, dan menghasilkan gambar hingga resolusi 2K.
Melihat banyaknya peningkatan yang ditawarkan Imagen 4 , tampaknya Google DeepMind sedang berupaya mencapai tingkat kontrol kreatif dan kualitas yang baru.
Perjalanan Saya dengan Imagen 4
Namun pertanyaannya tetap: Bagaimana kinerja Imagen 4 saat digunakan oleh pengguna biasa? Saya penasaran ingin mengetahuinya, jadi saya memilih untuk melakukan pengujian sendiri.
Sejak awal, saya ingin memulai dengan sesuatu yang sederhana. Jadi, saya meminta model Imagen 4 untuk menghasilkan adegan pangkalan militer dengan tentara yang bersiap untuk perang.
Sayangnya, hasil yang dihasilkan kurang memuaskan. Meskipun Imagen 4 berhasil menciptakan rendering adegan militer yang relatif bagus, ia gagal menangkap detail karakter utama.

Lebih tepatnya, wajah mereka terlihat seperti hancur dan cacat. Hampir tidak ada upaya yang dilakukan untuk menampilkan fitur wajah yang tepat dan unik pada setiap karakter dalam adegan tersebut.
Tampaknya model AI tersebut difokuskan untuk menciptakan lingkungan secara keseluruhan, tetapi mengabaikan aspek-aspek kecil yang seharusnya dapat lebih menekankan realisme gambar tersebut.
Dalam pengujian ini, saya akan memberikan Imagen 4 nilai 5/10.
Karena percobaan itu gagal, saya memutuskan untuk mencoba sesuatu yang lebih sederhana. Saya meminta Imagen 4 untuk membuat gambar seorang wanita di tepi sungai menggunakan lensa fisheye.
Saya ingin melihat apakah hasilnya akan lebih baik dengan satu subjek daripada adegan dengan banyak karakter. Tetapi bahkan dengan perubahan ini, hasilnya masih sedikit mengecewakan.

Model AI tersebut menghasilkan gambar yang tidak biasa, yaitu seorang wanita dengan tiga tangan! Saya tidak yakin mengapa itu terjadi, tetapi jelas bahwa Imagen 4 sedikit kesulitan dalam hal kepatuhan yang konsisten terhadap perintah yang diberikan.
Malahan, tampaknya film ini bahkan kurang efektif daripada Imagen 3. Saya akui kualitas gambar dan detail dalam adegan ini bagus, jadi itu lumayan.
Namun, bahkan dengan subjek spesifik untuk dikerjakan, Imagen 4 tetap gagal menghasilkan penggambaran realistis yang dapat digunakan.
Dan berdasarkan kesan pengguna lain , sepertinya saya bukan satu-satunya yang kesulitan membuat gaya pemberian petunjuk berfungsi pada model gambar AI ini.
Untuk tes ini, saya akan memberi Imagen 4 nilai 3/10.
Untuk lebih menekankan maksud saya, saya mencoba perintah yang sama pada Imagen 3, dan berikut hasilnya. Seperti yang Anda lihat, Imagen 4 jelas-jelas mengalami kemunduran dibandingkan pendahulunya dalam hal mengikuti instruksi secara akurat dan menghasilkan gambar yang tepat.

Untuk tes terakhir saya, saya memutuskan untuk menggunakan petunjuk yang lebih detail lagi. Berikut deskripsi yang saya masukkan: "Sebuah kendaraan futuristik berwarna gelap, mengingatkan pada hovercraft atau kendaraan lapis baja, digambarkan di udara, berada di atas cakrawala kota pada malam hari. Kendaraan tersebut ramping dan bersudut, dengan ban off-road besar dan beberapa lampu merah di sepanjang bagian belakangnya. Jejak hujan terlihat di permukaannya, dan tampaknya sedang bergerak, mungkin terbang atau melayang. Kota diterangi oleh lampu neon yang semarak, terutama merah muda dan merah, menciptakan kontras yang mencolok terhadap kendaraan yang gelap. Latar perkotaan menunjukkan bangunan yang diterangi dan sebuah jembatan di latar belakang, menunjukkan pemandangan kota di malam hari. Perspektifnya sedikit rendah, seolah-olah dilihat dari bawah kendaraan, meningkatkan kesan kecepatan dan kelincahan. Komposisi berfokus pada kendaraan, menempatkannya di tengah bingkai, dengan pemandangan kota sebagai latar belakang. Orientasi kendaraan menghadap ke depan, dan warnanya berani, dengan palet warna dingin berupa hitam pekat, abu-abu, dan kontras warna neon terang. Rasa energi dan dinamisme sangat terasa dalam gambar. Gayanya modern, bergaya, dan Mengingatkan pada adegan permainan video atau film aksi futuristik, dengan fokus signifikan pada pencahayaan yang detail, hujan, dan efek visual. Suasana keseluruhan terasa keras, intens, dan serba cepat, menyampaikan nuansa petualangan perkotaan.
Dan berikut adalah hasil yang dihasilkan:

Dalam pengujian ini, saya sangat terkesan. Imagen 4 berhasil menangkap hampir setiap detail penting dengan akurasi sempurna untuk menciptakan gambar menakjubkan yang tampak seperti langsung diambil dari video game.
Tingkat detail pada mobil, pencahayaan kota berpendar, dan bahkan nuansa urgensi dalam adegan tersebut… semuanya digambarkan dengan sangat baik.
Saya akui Imagen 4 mengejutkan saya dengan yang satu ini! Saya tidak bisa menyangkal bahwa mereka melakukan pekerjaan yang fantastis. Tampaknya gaya pemberian petunjuk model AI mungkin bekerja lebih baik dengan instruksi yang lebih detail.
Selain itu, jika melihat contoh Imagen 4 dari Google DeepMind di situs webnya, tampaknya menggunakan instruksi yang panjang dan spesifik mungkin merupakan satu-satunya pilihan untuk mendapatkan hasil maksimal dari model AI ini.
Kali ini, saya memberikan nilai 9/10 untuk performa Imagen 4. Penanganannya sangat bagus.
Karena hasil gambar terbaru ini bagus, saya jadi sedikit ragu! Tentu saja, saya memutuskan untuk melakukan satu tes lagi sebelum mengambil keputusan tentang kemampuan Imagen 4.
Pada pengujian terakhir ini, saya ingin melihat bagaimana kinerja model gambar AI dalam hal tipografi. Jadi, saya meminta poster film promosi bergaya retro yang unik tentang hiu dengan desain judul yang berani.
Untuk permintaan ini, Imagen 4 berhasil membuat poster yang menarik perhatian dengan font tebal dan warna-warna cerah. Namun, Imagen 4 gagal menampilkan teks poster secara keseluruhan, yang cukup mengecewakan.

Pada dasarnya, gambar yang disajikan tidak lengkap, jadi tidak terlalu bisa digunakan. Namun terlepas dari itu, saya harus mengakui bahwa desain posternya tidak terlalu buruk.
Jika boleh jujur, Imagen 4 berhasil menampilkan gaya seni retro dengan baik dan menghasilkan sesuatu yang terlihat keren dan menarik. Sekali lagi, ini adalah uji coba dengan hasil yang beragam. Terus terang, saya akan memberinya nilai 6,5/10.
Secara keseluruhan, saya percaya bahwa Imagen 4 masih perlu sedikit perbaikan. Meskipun memiliki peningkatan baru dibandingkan pendahulunya, namun masih terlihat agak kurang rapi, terutama dalam hal adegan yang kompleks.
Selain itu, desain kreatifnya juga perlu ditingkatkan. Meskipun kualitas gambarnya tak terbantahkan, Imagen 4 tampak sedikit terbatas dalam imajinasinya.
Selain itu, gaya panduan baru Imagen 4 tampaknya kurang fleksibel dan intuitif. Bagi pengguna awam, hal ini kemungkinan akan menyebabkan rasa frustrasi dalam mencoba mendapatkan hasil yang tepat.
Butuh sesuatu yang lebih baik dari Imagen 4? Cobalah Pollo AI!
Mengingat Imagen 4 masih memiliki beberapa kekurangan yang perlu diperbaiki, pilihan terbaik berikutnya di pasaran saat ini yang sangat saya rekomendasikan adalah Pollo AI.
Ini adalah platform pembuatan gambar dan video serba guna yang terintegrasi dengan beberapa model pembuatan AI kelas atas yang sesuai dengan hampir semua gaya visual.
Anda dapat mengakses model gambar AI seperti Nano Banana , Imagen , GPT-4o , Recraft , Stable Diffusion , dan Flux . Pollo AI juga menawarkan model video AI seperti Kling AI , PixVerse AI , Luma AI , Hailuo AI , dan Runway .
Dengan semua opsi ini di satu tempat, Anda dapat dengan bebas beralih di antara opsi-opsi tersebut untuk menghasilkan berbagai macam output yang unik dan imajinatif.
Tapi bukan hanya itu! Pernahkah Anda ingin menyesuaikan gambar dan video yang sudah ada tanpa memerlukan keahlian pengeditan profesional?
Dengan Pollo AI, Anda akan mendapatkan akses ke puluhan efek AI, templat, dan alat yang dapat membantu Anda mengubah media visual apa pun menjadi berbagai macam output yang menghibur.
Bagian terbaiknya? Anda dapat mencoba berbagai kemampuan Pollo AI sekarang juga tanpa harus membayar apa pun melalui paket uji coba gratisnya!
Kesimpulan
Imagen 4 adalah model gambar AI yang menarik dengan berbagai fitur baru, tetapi masih dalam tahap pengembangan, setidaknya dari sudut pandang pengguna. Hingga menjadi produk yang lebih sempurna, saya sarankan untuk memilih alat AI yang lebih konsisten, kreatif, dan andal untuk membantu menghasilkan gambar Anda. Dan berdasarkan pengalaman pribadi saya, Anda tidak akan salah memilih Pollo AI!