Google, orijinal Veo 3 üzerine inşa edilen en yeni video oluşturma modeli Veo 3.1'i tanıttı.
Veo 3.1, vizyonunuzun daha doğru bir şekilde hayata geçmesini sağlayan gelişmiş komut uyumluluğu sunmanın yanı sıra, daha önce hiç olmadığı kadar doğal bir şekilde ses ve hareketi bir araya getiren daha zengin yerel ses çıkışı da sunuyor.
Ayrıca şunları içeren üç yeni temel özellik de tanıttı:
- Görüntüden Videoya: Karakter ve sahne stilini kilitleyerek referans görüntülerden tam bir video oluşturun.
- Karelerden Videoya: Bir çekimin ilk ve son karelerini sağlayarak pürüzsüz, doğal geçişler oluşturun.
- Videoyu Uzat: Bir dakikaya veya daha fazlasına uzatarak kısa klipleri daha uzun videolara dönüştürün.
Ayrıca, istenmeyen nesneleri silerek temiz bir sonuç için arka planı yeniden yapılandıracak tek tıklamayla silme aracı da yolda.
Google'ın Veo 3.1'i artık Pollo AI video oluşturucu üzerinde yayında ve yaratıcılara geliştirilmiş video oluşturma yeteneklerine erişim sağlıyor.
Geliştirilmiş yerel ses çıkışı, Görüntüden Videoya ve Karelerden Videoya olmak üzere dört temel yükseltmeye odaklanan bir dizi test yürüttüm. İşte bulduklarım — spoiler: Veo 3.1 bir oyun değiştirici.
Veo 3.1'i Test Etme
- Yerel Ses Oluşturma
Komut: "Kalabalık bir restoran mutfağında cızırdayan dökme demir tavaya yakın çekim. Bir aşçı biftek çeviriyor ve arka planda diğer aşçıların sohbetlerini ve tencereler ile tavaların seslerini duyabiliyorsunuz."
Sonuç: Çıktı etkileyiciydi. Ana ses - bifteğin keskin, çıtırdayan cızırtısı - net ve ön plandaydı. Ancak, komutta açıkça istenmesine rağmen, "diğer aşçıların belirgin sohbeti" yoktu. Bu, arka planın beklenenden daha az "kalabalık" hissetmesine neden oldu ve sesi gerçekten zengin ve katmanlı yapacak önemli bir insan unsuru eksikti.
- Karelerden Videoya
Komut: İlk ve son kareleri başlangıç ve bitiş noktaları olarak kullanarak, bir çiftin kafeye girdiği, oturduğu, kahve sipariş ettiği ve gece çökerken canlı bir şekilde sohbet etmeye başladığı 10 saniyelik pürüzsüz bir geçiş videosu oluşturun.
| Başlangıç ve Bitiş Karesi Görüntüsü | Çıktı Videosu |
![]() ![]() |
Sonuç: Karakterler ve sahne görsel olarak tutarlı kalsa ve başlangıç/bitiş kareleri başlangıç ve bitiş noktaları olarak kullanılsa da, video pürüzsüz bir geçiş oluşturmayı başaramadı. Sipariş verme gibi eylemler aniydi (örneğin, kahve fincanları aniden belirdi) ve son kareye geçişte belirgin bir süreklilik eksikliği vardı.
- Görüntüden Videoya
Komut: Mum ışıklı taş bir kütüphanede mor cüppeli sakallı bir sihirbaz antik bir tomar okuyor, aniden şaşkınlıkla yukarı bakıyor, ardından etrafında kitapların uçuştuğu bir büyü yapıyor
| Referans Görüntüleri | Çıktı Videosu |
![]() ![]() |
Sonuç: Genel ortam ve atmosfer mükemmel bir şekilde korunmuş olsa da - zengin detaylı, mum ışıklı taş bir kütüphane ve atmosferik aydınlatma ile - sihirbazın görünümü referans görüntüyle tam olarak eşleşmedi.
Yüz özellikleri ve sakal stili belirgin şekilde farklıydı, bu da karakter aktarımında sınırlı bir doğruluk olduğunu gösteriyor.
İlk eşleşmedeki eksikliğe rağmen, model mükemmel zamansal tutarlılık ve sahne uyumluluğu sergileyerek, açıklanan eylemle iyi uyum sağlayan sinematik ve sürükleyici bir sekans sunuyor.
Sonuç
Veo 3.1, tutarlı karakterler ve sahneler oluşturma konusunda güçlü yetenekler sergileyerek, kareler ve belirtilen başlangıç/bitiş noktaları boyunca görsel bütünlüğü başarıyla koruyor.
Birincil eylemler ve nesnelerle iyi performans gösteriyor ve net birincil ses efektleri üretebiliyor. Ancak model, dinamik ve nüanslı video içeriği oluşturma konusunda önemli zayıflıklar sergiliyor. Şu konularda zorlanıyor:
- Pürüzsüz Geçişler ve Süreklilik: Karmaşık, çok adımlı eylemler genellikle ani görünüyor (örneğin, nesnelerin aniden belirmesi) ve geçişlerde süreklilik eksikliği, özellikle son karelere doğru, kopuk sekanslara yol açıyor.
- Duygusal Nüans: Karakter ifadeleri ve tonu tutarsız olabilir veya belirtilen duygusal derinlikten yoksun olabilir (örneğin, "şaşkın" bir bakış hafif görünebilir veya "gülen" bir çift animasyondan yoksun olabilir).
- Karmaşık Nesne Animasyonu: Birden fazla nesneyi içeren etkileşimler (uçan kitaplar gibi) sert, mekanik görünebilir veya nesneler organik olarak hareket etmek yerine varlıklarını "aniden" gösterebilir.
- Katmanlı Ses: Birincil sesler iyi olsa da, açıkça istendiğinde bile belirgin ikincil veya arka plan ses öğeleri oluşturmak, ses manzarasının zenginliğini etkileyen bir zorluk olmaya devam ediyor.
Neden Pollo AI'da Veo 3.1 Kullanılmalı?
Pollo AI, yapay zeka video oluşturmanın en iyilerini tek bir çatı altında topluyor. Burayı yaratıcı kontrol merkeziniz olarak düşünün; güç esneklikle buluşuyor.
Veo 3.1 gibi yalnızca tek bir modla sınırlı kalmazsınız. Pollo AI'da istediğiniz zaman Sora 2, Veo 3, Kling 2.5 Turbo, Wan 2.5, Seedance ve diğerleri gibi üst düzey motorlar arasında geçiş yapabilirsiniz.
Bu demektir ki, Veo 3.1'in gerçekçiliğini ve hikaye anlatma derinliğini (ki bu arada harika!) seviyorsanız, tam olarak uyduğunda kullanabilirsiniz - ardından hız, stil veya detay için başka bir modele geçebilirsiniz. Sınır yok. Taviz yok.
Ayrıca, tüm temel yapay zeka video oluşturma özelliklerine de sahiptir:
- Görüntüden videoya yapay zekamızla fotoğrafları hayata geçirin.
- Metinden videoya yapay zekamızla senaryoları çarpıcı görsellere dönüştürün.
- Yapay zeka avatar video oluşturucu ile etkileyici klipler hazırlayın.
- Yapay zeka kısa video oluşturucu ile sakinleştirici, hayvan veya anime tarzı klipler oluşturun.
- Pollo Mimic ile referans videonun herhangi bir hareketini taklit edin.
Bugün Pollo AI'ı deneyin ve yapay zeka destekli video oluşturmanın tam potansiyelini ortaya çıkarın.



